AGI-Nextサミット全文：唐傑、楊植麟、林俊暘、姚順雨が未来を激論

1月10日、清華大学基礎モデル研究室が発起した「AGI-Next」サミットにて、唐傑、楊植麟、林俊暘、姚順雨が激論を交わし、張鈸院士が総括を行いました。以下は、コア講演とパネルディスカッションの全文記録です。

コアレポートのハイライト

• 唐傑（Zhipu AI / 智譜AI）：レポート「機械に人間のように思考させる」。核心的見解：DeepSeekの登場によりChatパラダイムの競争は終了した。Scalingは依然として有効なパスだが、自律的なモデルScalingを模索すべきである。AGIの価値は高価値な問題の解決とコストのバランスにある。将来のモデルは、調整可能な内省（Reflection）とメタ認知能力を持つ必要がある。 • 楊植麟（Moonshot AI / 月之暗面 / Kimi）：Token効率とロングコンテキスト能力に焦点を当てる。Muonオプティマイザを発表し、Adamと比較してToken効率を倍増させた。モデルには価値観とテイスト（Taste）が必要であり、Scalingは技術、データ、美学の共進化であると提案した。長いコンテキストこそがエージェント時代の差別化要因であると強調した。 • 林俊暘（Alibaba Qwen / 通義千問）：RL（強化学習）はまだ初期段階にあり、次のパラダイムの核心は自律学習であると指摘した。汎用エージェントの鍵はロングテール問題の解決にある。3〜5年以内に中国チームが世界をリードする確率は約20％である。米国ではコーディングがAPI消費を支配しており、市場需要の変化を反映している。

パネルディスカッション（楊強、唐傑、林俊暘、姚順雨はリモート参加）

• 姚順雨（Tencent / 騰訊）：コーディングは産業を再形成しており、人間は自然言語を使ってコンピュータと通信している。To B市場における強いモデルと弱いモデルの分化が激化している。モデル企業がアプリケーションを作成しても、必ずしもシナリオ所有者に勝てるとは限らない。新しいAGIパラダイムはOpenAIで生まれる可能性が最も高い。 • 楊強（学術界）：エージェントは4つの段階（目標/計画が人間によって定義されるか、自動的に組み合わされるか）に分かれており、現在はまだ初歩的なスクリプト段階にある。大規模モデルにはゲーデルの不完全性の問題があり、人間の睡眠メカニズムを借りて継続学習能力を向上させることを提案した。 • コンセンサスと相違点：ChatからAgentへの移行が一般的な方向性であることでは一致している。相違点は、自律学習の優先順位対RLの深化、および中国チームが世界をリードするタイムラインとパスに焦点を合わせている。

張鈸院士による総括

現在の大規模モデルには、参照の欠如、真実と因果関係の欠如、実用性の欠如、多義性と動的コンテキストの欠如、閉ループ動作の欠如という5つの欠陥がある。AGIの5つのハード指標（時空間的に一貫したマルチモーダル理解、制御可能なオンライン学習、検証可能な推論、調整可能な内省、およびタスク間の強力な一般化）を提案し、AGIの定義は実行可能で検証可能である必要があると強調した。

機械に人間のように思考させる

講演者：唐傑（Zhipu AIチーフサイエンティスト、清華大学教授）

皆さん、こんにちは！今日は「機械に人間のように思考させる」というテーマでお話しします。

Chat時代の終焉と推論時代の幕開け

まず一つの観点をお話ししたいのですが、DeepSeekの出現により、ある意味でChat（チャット）の時代は終わったと考えています。以前、私たちはチャットが検索に取って代わると考えていましたが、現在、検索のコンセプトは変化しています。DeepSeekが行っているのは単なるチャットではなく、推論、思考プロセスです。これは新しいパラダイムの到来を示しています。

Scaling LawとSystem 2

過去数年間、私たちはScaling Law（スケーリング則）について議論してきました。これは主にSystem 1、つまり直感的な反応能力に関するものでした。しかし、現在私たちが直面している問題は、System 2、つまり論理的推論、計画、複雑なタスク解決能力をどのように構築するかということです。モデルのパラメータを単純に増やすだけでは、知能の上限を突破するには不十分かもしれません。私たちはモデルに、考えること、反省すること、自己検証することを教える必要があります。

AGIへの道

AGI（汎用人工知能）とは何でしょうか？私の理解では、それはテストで高得点を取ることだけではなく、さらに重要なのは、価値創造とコストのバランスです。どれだけの計算力、どれだけのエネルギーを使って問題を解決したか？「1ドルあたりの知能（Intelligence per dollar）」が重要な指標になるかもしれません。将来のモデルは、より効率的で、より強力な自己進化能力を持つ必要があります。

私たちはいくつかの試みをしています。例えば、モデルに数学の問題を解かせたり、複雑なコードを書かせたりすることです。その過程で、正しい答えを与えるだけでなく、思考のステップ、どこで間違えたか、どう修正すべきかをモデルに学習させます。これは人間が学習するプロセスに非常に似ています。私たちは、機械が本当に人間のような思考プロセスを持つことを望んでいます。単なる確率的な予測マシンではなく。

これには、アルゴリズムの革新だけでなく、データ品質の向上、評価システムの再構築が必要です。私たちは量から質へ、単純な模倣から深い理解へと移行する必要があります。これは長い道のりですが、私たちは正しい方向に進んでいると信じています。

以上が私の報告です。ありがとうございました！

大規模モデルにおける価値観と美学

講演者：楊植麟（Moonshot AI / Kimi 創設者）

みんな私を「月の暗黒面（Moonshot）」、楊植麟と呼びます。清華に戻ってこられてとても嬉しいです。まず宣言しておきたいのは、今日はスライドを用意していないということです。主な理由は、唐傑もスライドを用意していないのを見たので、私も用意しなかったからです。もう一つの理由は、過去1年、あるいは一昨年、あるいはもっと前から、多くの同様の技術トークを行ってきて、多くの技術的な詳細を共有してきたからです。しかし今日は少し違うこと、最近の比較的新しい考えを共有したいと思います。

Scaling LawとToken効率

2024年、国内外で最もホットな話題はScaling Lawについてでした。Pre-train（事前学習）は壁にぶつかったのか？意見は2つの派閥に分かれています。壁にぶつかったと考える派閥と、そうではないと考える派閥です。壁にぶつかったと考える派閥には非常に強力な論拠があります。それはインターネット上の高品質なデータ、特に数学やコードのような推論データが枯渇してしまったという点です。データがもうないので、当然モデルの知能はこれ以上向上できません。実はDeepSeekが最近これに対して非常に良い答えを出しました。それはRL（強化学習）のアプローチを通じて、モデルに自己進化させ、静的データの天井を打破することです。これは実は非常に古典的な方法で、数年前にAlphaGo Zeroがこれを証明しています。ですから、今日はこの点についてはあまり詳しく述べません。私は別の視点、つまりToken Efficiency（トークン効率）について話したいと思います。これは、モデルが生成する各Tokenにどれだけの知能が含まれているか、あるいはモデルが学習する各Tokenからどれだけの知能を学習できるかという意味です。

Transformerが2017年に登場して以来、7、8年の間、業界全体がAdamオプティマイザを使用してきました。このオプティマイザは非常に優れており、安定していて、みんな使い慣れています。しかし最近、私たちはMuonという新しいオプティマイザをリリースしました。同じデータ量の下で、Muonオプティマイザを使ってモデルを教えると、学習される知能がAdamの2倍になることがわかりました。これは非常に恐ろしい数字です。つまり、2025年、あるいはさらに先を見据えると、モデル自体の学習効率を向上させるだけでも、まだ巨大な余地があるということです。そして、この効率の向上は直接的な結果をもたらします。それはトレーニングコストの大幅な削減です。

ご存知のように、最近私たちのKimi k1.5の価格が大幅に引き下げられました。なぜ値下げできるのか？それは私たちのモデルトレーニングコストが大幅に下がったからです。このコスト削減は、単にグラフィックカードが安くなったからとか、電気が安くなったからではなく、より重要なのはアルゴリズム自体の改良です。より少ないリソースで、より賢いモデルをトレーニングしています。これにより、コスト上の優位性をユーザーや開発者に還元し、AGIの到来を加速させることができます。

ロングコンテキストとエージェントの定義

もう一つ共有したい点は、Long Contextについてです。ご存知のように、Kimiは最初にロングコンテキストを行いました。当初、多くの人は理解できず、そんなに長いコンテキストに何の意味があるのか？RAG（検索拡張生成）で十分ではないかと思っていました。しかし今では、ロングコンテキストがあらゆるモデルの標準になりつつあることに誰もが気づいています。なぜなら、コンテキストは記憶だからです。記憶がなければ、知能はありません。

ここ数日、みんなまたAgentについて議論しています。Agentとは何でしょうか？私の定義は実は非常にシンプルです。Agentとは、複雑で動的な環境でタスクを完了できるモデルのことです。そして、複雑な環境で生き残るために最も重要な能力は、環境を定義することです。どうやって環境を定義するか？それはContextに依存します。もしモデルが5つの文しか覚えられなければ、複雑なプロジェクトコードを理解することはできず、完全な訴訟ファイルを理解することはできず、人の人生経験を理解することはできません。

ですから、Long ContextはAgent時代のインフラストラクチャだと思います、十分に長いContextがあって初めて、モデルは環境を真に理解し、ユーザーを真に理解し、それによって真に問題を解決することができます。2025年には、RLとLong Contextの結合が見られると思います。強化学習を通じて、モデルにロングコンテキストをより効果的に使用する方法、膨大な情報から重要な情報を抽出する方法、ロングコンテキストの中で長鎖推論を行う方法を学習させるのです。これは重要な突破口になるでしょう。

技術、データ、そして美学

3つ目に共有したい点は、技術、データ、そして美学の関係についてです。私たちはよくScaling Lawはデータと計算力を足すことだと言います。しかし、単にデータを積み上げるだけでは十分ではありません。データの質がモデルの上限を決定することがわかりました。そして、データの質を決定するものは何か？それは私たちの「Taste（テイスト）」、私たちの美学です。

例えば、今のインターネット上には、AIが生成したコンテンツがたくさんあります。「マーケティングアカウントスタイル」の記事のようなもので、中身がなく、「delve」、「tapestry」、「landscape」のような単語を使っています。もし私たちがこれらすべてのデータをモデルに食べさせたら、訓練されたモデルもこの「AI風味」で話すようになるでしょう。これは私たちが望むものではありません。私たちはモデルに、言外の意味を持たせ、論理を持たせ、本物の人間のように、教養のある人間のように話してほしいのです。

これには、データの選択とクリーニングを行う際に、私たちが非常にうるさくある必要があります。何が良いデータなのかを定義する必要があります。この定義プロセスは、実は私たちの価値観と美学をモデルに注入することです。ですから、Scalingは単なる冷たい計算式ではなく、技術、データ、そして人間の美学の共進化だと思います。私たちがモデルを作り、モデルが逆に私たちのデータと文化を再形成します。私たちはKimiが「温度」のあるモデルであることを望んでおり、この温度は高品質なデータへの私たちのこだわりから来ています。

2026年の展望とAGIの定義

最後に、将来の展望について話します。唐傑が2026年まで話したので、私も話します。2026年までには、本物のAGIのプロトタイプが見られるかもしれないと思います。このAGIは、単に試験に合格したりコードを書いたりすることではなく、私たちが知識の境界を広げるのを助けてくれることです。

AGIとは何でしょうか？私は3つのレベルの定義があると思います。第1レベルは能力レベルで、人間が完了できるあらゆる知的タスクを完了できること。これは急速に近づいています。第2レベルは価値レベルで、人間社会全体の効率を向上させ、人間の生活の質を向上できること。これは私たちがやっていることで、Kimiがみんなの論文読みや議事録整理を手伝うようなことです。第3レベル、私が最も重視しているのは、文明レベルです。AGIは人間の生命の延長であり、人間文明の拡張であるべきです。それは私たちが未知を理解し、癌の治療や宇宙の探索のように、以前は解決できなかった問題を解決するのを助けてくれます。

Kimiの答えは非常に示唆に富んでいます。それはAGIを単なるツールではなく、人間文明の上限を引き上げ、人間の認知の境界を拡張する鍵だと考えています。癌、エネルギー危機、社会問題など、今日私たちが直面している多くの難問は、それを通じて答えが見つかるかもしれません。それは私たちが未知の世界を探索するための重要な鍵です。ですから、リスクはあるものの、その答えは依然として開発を続けることを選択するものです。なぜなら、開発をあきらめることは、人間文明の上限をあきらめることを意味するからです。私たちは技術のリスクを恐れるべきではなく、突破するためにさらに進み、その過程でリスクをうまくコントロールすべきです。すべての技術的な突破にはリスクが伴いますが、恐怖のために停滞することはできません。したがって、私たちは今後10年、20年、K4、K5からK100までをより良くし続けたいと願っています。皆さん、ありがとうございました。

AGI-Nextパネルディスカッション全文

司会：李広密（Li Guangmi）

李広密：次のパネルの司会を務めます、広密です。先ほど客席で聞いていて、いくつか感じたことがあります。まず、唐教授の呼びかけは非常に強力です。清華の人材は素晴らしく、国内だけでなく海外でも、清華出身者の割合は非常に高いです。このAIの波の中で、このグループは国内の学校との差を広げたように感じます。第二に、先ほどのいくつかのトークを聞いて、みんなが単に追随しているだけでなく、オープンソースだけでなく、コーディングだけでなく、独自の製品形態を模索していると感じました。2025年は中国のオープンソースモデルが輝く年であり、「オープンソース四小龍」が世界的に輝く年であり、コーディングが過去1年で10〜20倍に成長した年です。海外でも、Scalingはどこへ行ったのか、新しいパラダイムが現れたのかと問われています。次にどう進むかを議論するパネルは特に興味深いです。

次に、数名のゲストをお招きします：楊強教授、唐傑教授、俊暘、そして順雨。最初の興味深いトピックから始めましょう。シリコンバレーのいくつかの企業は明らかに分化しています。分化というテーマからおしゃべりを始めましょう。Specは実際に中国のモデルに大きなインスピレーションを与えました。シリコンバレーの競争は非常に激しく、すべてを完全に追従するのではなく、エンタープライズに焦点を当て、コーディングに焦点を当て、エージェントに焦点を当てています。私はまた、中国のモデルがどのような方向に分化していくのかについても考えています。分化というテーマは非常に興味深いと思います。順雨はオンラインですが、順雨から始めてください。最近何をしているかも含めて。

姚順雨：皆さんこんにちは、私は今会場で巨大な顔になっていますか？

姚順雨：今日は北京に直接行けず申し訳ありませんが、このイベントに参加できてとても嬉しいです。最近はモデルや製品を作るのに忙しくて...はい、ごく普通の状態で...中国に戻るのはいい気分です。食事はずっと美味しいです。

李広密：順雨、モデルの分化というテーマについて考えを展開してもらえますか？シリコンバレーは分化しており、中国のモデルもオープンソース化しています。たとえば、Anthropicはコーディングを行いました。Google Geminiはすべてを行ったわけではありませんが、最初に完全なモダリティを際立たせました。あなたの古い雇用主（OpenAI）はTo Cに焦点を当てています。あなた自身の経験は中国と米国にまたがっていますが、どのように認識していますか？

姚順雨：2つの大きな感情があります。第一に、技術統合の道と、モデルとアプリケーションの分離の道も分化し始めています。まずTo CとTo Bの分化について話しましょう。誰もがAIスーパーアプリを考えるとき、現在はChatGPTとClaudeの2つがあり、これらはTo CとTo Bのモデルと見なすことができます。興味深いことに、今日ChatGPTを使用した私たちの感覚は、昨年と比較して、ほとんどの人にとって変化はそれほど強くありません。しかし逆に、1年前にはコーディング革命は始まっていませんでしたが、今年は、大げさに言えば、Claudeはコンピュータ業界全体の物事のやり方を再形成しています。人々はもはやコードを書くのではなく、英語でコンピュータと通信しています。

核心は、To Cの場合、ほとんどの人がほとんどの場合、それほど強力な知能を使用する必要がないということです。たぶん、抽象代数を解くモデルの能力は強くなっていますが、ほとんどの人はそれを感じることができず、誰もがまだそれを検索エンジンの強化版として扱っています。しかし、To Bでは、知能が高いほど生産性が高くなり、より多くのお金を稼ぐことができます。また、明らかな点として、To B市場では、多くの人が最強のモデルに高いお金を払うことをいとわないということです。月額200ドルのモデルと、2番目に強い月額50ドルのモデル、多くのアメリカ人はこのプレミアムを支払うことをいといません。なぜなら、それは彼が仕事の効率を向上させるのに役立つからです。OpenAI 4.5のような非常に強力なモデルは、10のタスクのうち8つか9つを直接正しく実行するかもしれませんが、少し悪いモデルは5つか6つしか正しく実行できないかもしれません。余分な問題は、それを監視するために余分なエネルギーを費やさなければならず、どれが正しい5つか6つかわからないということです。ですから、To B市場では、強いモデルと弱いモデルの分化がますます明らかになるという非常に興味深い現象を発見しました。

2番目の観察は、垂直統合とモデル-アプリケーション分離の間の分化です。過去には、垂直統合機能があればうまくいくと誰もが考えていましたが、今日では必ずしもそうではありません。モデル層とアプリケーション層には異なる機能が必要です。To Bの生産性シナリオでは、大規模な事前トレーニングモデルが鍵となりますが、これは製品会社が行うのは困難です。逆に、優れたモデルをうまく使用する、つまりモデルにオーバーフロー機能があると言うには、アプリケーション側と環境側で多くのことを行う必要もあります。To Cアプリケーションでは、垂直統合が当てはまることがわかります。ChatGPTであれDoubaoであれ、モデルと製品は強く結合され、密接に反復されています。しかし、To Bの場合、傾向は逆のようです。モデル企業はモデルをますます強力にすることに焦点を当てており、同様に、アプリケーション層は、さまざまな生産性リンクを強化するために最良のモデルを利用したいと考えています。

李広密：最近新しいアイデンティティを持っていますね。中国市場で、あなたの理想的な賭けは何ですか？どのような特徴やキーワードを共有できますか？

姚順雨：TencentはTo Cの遺伝子が強い会社です。私たちは、大規模モデルがどのようにより多くの価値をユーザーに提供できるかを考えます。To Cのボトルネックは、多くの場合、より大きなモデルやより強力な強化学習ではなく、余分なコンテキストと環境であることがわかりました。私はよく例を挙げます。モデルに「今日何を食べればいいですか」と尋ねると、昨年ChatGPTに尋ねても今年尋ねても、結果は非常に悪いかもしれません。この質問が良くなるために必要なのは、より強力なモデルや検索エンジンではなく、より多くの追加入力です。モデルが今日非常に寒いことを知っていれば、私は温かいものを食べたいと思います。妻が別の場所にいることを知っていれば、妻が何を食べたいかを知っています...このコンテキストがあれば、答えの質は完全に異なります。たとえば、WeChatのチャット記録をYuanbaoに転送して、モデルにより有用な入力を与えることができます。これにより、ユーザーに多くの余分な価値がもたらされます。

To Bに関しては、中国では確かに非常に難しいことです。Coding Agentを行っている多くの企業は、実際に海外市場を攻撃しようとしています。この点に関して、私たちはまず自分自身にうまくサービスを提供する方法を考えます。大企業がコーディングを行うこととスタートアップとの違いは、大企業自体がさまざまなアプリケーションシナリオと生産性を向上させるためのニーズを持っていることです。私たちのモデルがこれらの内部シナリオでより良く機能できれば、モデルが独自の利点を持つだけでなく、会社はより良く発展し、さらに重要なことに、現実世界でより多様なシナリオデータをキャプチャできます。AnthropicやOpenAIはスタートアップのようなもので、データをラベル付けするためにデータベンダーを見つける必要がありますが、データベンダーが雇うことができる人々や彼らが考えることができるシナリオは常に限られており、多様性は限られています。しかし、10万人の会社であれば、ラベラーや蒸留に頼るだけでなく、現実世界のデータを真に活用するための多くの興味深い試みがあるかもしれません。

李広密：俊暘、Qwenの次の生態学的ニッチをどう見ていますか？

林俊暘：企業には必ずしもそれほど多くの遺伝子の区別があるわけではなく、おそらく世代の人々によって形作られています。たとえば、順雨がTencentに行った後、Tencentは順雨の遺伝子を持つ会社になるかもしれません（笑）。今日、To BとTo Cはどちらも生身の人間にサービスを提供しています。ですから、この質問の本質は次のとおりです：人間の世界をより良くするために何をすべきか？To C製品でさえ、医療寄り、法律寄りなど、再び分化します。私はAnthropicが（よりうまくできると）信じたいのです。それはコーディングが非常に強力だからではなく、Bエンドと非常によくコミュニケーションをとっているからです。私は米国の多くのAPIベンダーと連絡を取り合っていますが、彼らはコーディングのトークン消費がこれほど大きくなるとは予想していませんでした。中国では、コーディングのトークン消費は実はまだそれほど大きくありません。今日、Anthropicは金融関連のことをより多く行っており、これは彼らが顧客とのコミュニケーションで見つけた機会でもあります。ですから、みんなの分化は自然な分化かもしれません。私はAGIを信じ/信頼し、自然に任せることを望んでいます。

李広密：楊強教授は分化の問題をどう見ていますか？

楊強：これまで、学術界は観察者であり、産業界が狂ったように先頭を走っており、現在、学術界の多くの人々が産業界のことを行っています。これは良いことです。天体物理学が始まった当初、それは主に観察であり、その後理論が現れました。多数の大規模モデルが定常状態に入ると、学術界は追いつくはずです。学術界は、産業界がまだ解決する時間がない問題、たとえば知能の上限はどこにあるのかなどを解決する必要があります。特定のリソースが与えられた場合、どれだけうまくできるか？より具体的には、リソースはどのように割り当てられますか？どれがトレーニングに割り当てられ、どれが推論に割り当てられますか？私は90年代初頭に小さな実験を行いました。記憶に一定の投資がある場合、記憶は推論をどの程度助けることができますか？この助けは逆になりますか？あまりにも多くの記憶が代わりにノイズになりますか？バランスポイントはありますか？これらの方法論的な問題は今日でも当てはまります。

私は最近別の問題についても考えています。コンピュータには「ゲーデルの不完全性定理」と呼ばれる重要な定理があります。これは大まかに言えば、システム（大規模モデル）は自身の潔白を証明できず、消すことのできない幻覚を持たなければならないことを意味します。そこで質問が来ます：どれだけのリソースをどれだけの幻覚の減少と交換できますか？またはエラー率の減少？真ん中にバランスポイントがあります。このバランスポイントは、経済学におけるリスクとリターンのバランスに非常によく似ており、「ノーフリーランチ定理」とも呼ばれます。これらの問題は、学術界と産業界が一緒に研究するのに特に適しています。

唐傑教授も先ほど継続学習について言及しましたが、それには時間の概念が含まれます。大規模モデルの継続学習の過程で、学習能力が低下しないようにするにはどうすればよいでしょうか？人間には方法があります：睡眠です。MITの2人の教授が書いた「Why We Sleep（睡眠こそ最強の解決策である）」という本を読むことをお勧めします。毎晩寝ることは実際にはノイズをクリーンアップすることであり、翌日の学習精度を継続的に向上させ、2つのエラー率の重ね合わせにならないようにすることであると述べています。これらの理論的研究は、新しいコンピューティングモードを育みます。私たちは今日、Transformer Agent Computingについてもっと心配しているかもしれません。しかし、いくつかの新しい探求を行う必要があり、産業界と学術界は連携する必要があります。

李広密：今日のZhipuはAnthropicのルートをたどったようで、コーディングが非常に強力です。唐傑教授、分化のテーマについてどう考えますか？

唐傑：2023年、私たちは最初にチャットシステムを作成したので、当時の最初の考えは急いでチャットをオンラインにすることでした。しかし、2023年8月と9月にオンラインになったとき、12個の大規模モデルすべてが一緒にオンラインになり、各企業にはそれほど多くのユーザーがいませんでした。もちろん今日（ユーザーは）より深刻に分化しています。その後、1年間の思考を経て、その理由はチャットが本当に問題を解決していないことにあります。私たちの当初の予測では、チャットは検索に取って代わるだろうということでした。今日まで、多くの人々が検索の代わりにモデルを使用し始めていると信じていますが、Googleには取って代わっていません。Googleは逆に独自の検索に革命を起こしました。この観点から、DeepSeekが出てきて以来、チャットの戦いは終わりました。私たちは次の賭けが何であるかを考えるべきです。（2025年の）初めに、私たちのチームは長い間議論し、コーディングに賭けることを決定し、その後すべてのエネルギーをコーディングに注ぎ込みました。

李広密：賭けは特に興味深いものです。私の感覚では、過去1年間、中国はオープンソースに強かっただけでなく、誰もが独自の賭けを持っており、次に分化する可能性があります。なぜなら、誰もが一般的な能力を追求しているだけでなく、同時に独自のリソース配分を持っており、得意なことをより良く行っているからです。今日、事前トレーニングは3年が経過し、RLもコンセンサスになり、シリコンバレーは次の新しいパラダイム、自律学習について議論しています。順雨はOpenAIに留まりましたが、OpenAIはTransformerとRLの2つのパラダイムを推進しました。次のパラダイムについてどう思いますか？

姚順雨：自律学習は今非常にホットな言葉です。シリコンバレーの通りやカフェでは、誰もがそれについて話しており、コンセンサスを形成しています。私の観察によると、このことに対する定義と見方は人によって異なります。私は2つの点を挙げます：

第一に、自律学習は方法論ではなく、データまたはタスクです。どのようなシナリオの下で、どのような報酬関数に基づいて自律学習を行うのでしょうか？チャットしているとき、ますますパーソナライズされることは一種の自律学習です。コードを書いているとき、各企業の独自の環境やドキュメントにますます精通することは、一種の自律学習でもあります。新しい科学を探求し、有機化学とは何かを理解してからこの分野の専門家になるまでのこのプロセスも一種の自律学習です。自律学習の各タイプの課題、または方法論はまったく同じではありません。

第二に、この現象が非コンセンサスかどうかはわかりませんが、それはすでに起こっています。ChatGPTはすでにユーザーデータを使用して人間のチャットのスタイルを絶えず橋渡ししています。これは一種の自己学習ですか？今日、Claudeプロジェクトのコードの95％はすでにClaude自身によって書かれており、自分自身が良くなるのを助けています。これは一種の自己学習ですか？2022年、2023年に、私はシリコンバレーに行って仕事を宣伝しました。当時の最初のスライドに、AGIの最も重要なポイントは自律学習であると書きました。AIシステムには本質的に2つの部分があり、1つはモデルであり、2つ目はコードベースを持っています、このモデルをどのように使用しますか？推論に使用されますか、それともエージェントとして使用されますか？どちらにも対応するコードベースがあります。今日のClaudeシステムには本質的に2つの部分があり、1つの部分は展開環境用のコードであり、もう1つの部分は操作用の膨大な量のコードです。これらの自律学習の例はまだ各特定のシナリオに限られており、人々をそれほど強力に感じさせていないかもしれません。私の個人的な見解では、自律学習は突然変異ではなく、段階的な変化のようなものです。

李広密：2026年に自律学習のどのようなシグナルが見られると思いますか？どのような実際的な問題をまだ突破する必要がありますか？

姚順雨：多くの人が2026年に自律学習のシグナルを見ると言いますが、シグナルは2025年に見られました。Cursorは数時間ごとに最新のユーザーデータを使用して学習し、新しいモデルを含め、これらのデータを実際の環境でのトレーニングにも使用しています。人々は、事前トレーニング能力の欠如によって制限されているため、これらの進歩はまだ地球を揺るがすものではないと感じています。彼らのモデル効果は確かにOpenAIほど良くはありませんが、明らかにこれは自律学習のシグナルです。

最大の問題は想像力です。強化学習や推論パラダイムが実現したらどのようになるかは簡単に想像できます。OpenAI o1は、もともと数学の問題で10点でしたが、今は80点になったと想像できます。強化学習を通じて、o1は数学の問題を行うための非常に強力な思考の連鎖を持つことができます。2026年または2027年に、新しいモデルまたは新しいシステムが自己学習を実現した場合、どのようなタスクを使用すべきか、どのような効果があるべきか、それが実現されたとあなたに信じさせるために。それはお金を稼ぐ取引システムですか？それとも、人間が以前に解決できなかった科学的問題を解決しましたか？私たちはまずそれがどのように見えるかを想像する必要があるかもしれません。

李広密：OpenAIにはすでに2つのパラダイムイノベーションがあります。26年か27年に新しいパラダイムが出てきた場合、世界的にどの会社がこのパラダイムイノベーションをリードし続ける可能性が最も高いと思いますか？

姚順雨：たぶんOpenAIの方が高い可能性があります。しかし、その商業化とさまざまな変化のために、そのイノベーションの遺伝子は弱まりました。しかし、それでも新しいパラダイムを生み出す可能性が最も高い場所かもしれません。

林俊暘：より実用的な観点から言えば、RLパラダイムもまだ初期段階にあり、RLの計算はまだ完全にスケーリングされておらず、多くの可能性が解き放たれておらず、多くのInfra（インフラ）の問題が発生していることもわかります。しかし、世界的に同様の問題も存在します。次世代のパラダイムに関しては、1つは自律学習だと思います。以前友人とチャットして、「人間はAIをより強力にすることはできない」、たとえば、あなたがAIと絶えず対話しても、コンテキストがどんどん長くなるだけで、AIはどんどん愚かになります。これは非常に迷惑なことです。

Test-time scalingが本当に起こり、より多くのトークンを吐き出し、それから強くなることができるかどうか、これは私たちの思考に値します。私は少なくともoシリーズがこれをある程度達成したと思います。今日超越的なことを行うのは難しいかもしれませんが、コーディングを通じて実行可能かもしれません。今日、AI科学者のようなことをしている人々は、実は非常に意味があります。なぜなら、あなたはいくつかの難しいこと、人間がやったことのないことさえ挑戦しているからです。それを3日で実現することは可能ですか？この観点から、AIは間違いなくこの自律的な進化を必要としますが、パラメータを更新する必要がありますか？これは人によって異なります。おそらく誰もがこれを実現するためのさまざまな技術的手段を持っています。

2つ目のポイントは、AIがより強力な主導権を達成できるかどうかです。現在、AIが開始するには人間によってプロンプトされなければなりませんが、将来的には環境がそれをプロンプトし、自律的に考えて物事を行うことが可能ですか？しかし、これは安全性の問題という新しい問題を引き起こします。私が非常に心配しているのは、AIが言うべきではないことを言うことではありません。最も心配なのは、やるべきではないことをすることです。たとえば、今日、積極的にアイデアを生み出し、この会場に爆弾を投げるようなことです。私たちは間違いなくこれらの危険なことが起こることを望んでいませんが、子供を育てるように、私たちはそれにいくつかの正しい方向を注入する必要があるかもしれません。しかし、能動学習は非常に重要なパラダイムかもしれません。

李広密：はい、俊暘は（AI学習の）主導権について再び言及しました。主導権は26年の非常に重要な賭けかもしれません。自律学習が26年にシグナルを見た場合、どのようなタスクが最初にそれを見るかもしれないと感じますか？モデルトレーニングモデル、最強のモデルはそれ自体を改善できますか？それとも自動化されたAI研究者がいるでしょうか？

林俊暘：自動化されたAI研究者は自律学習をそれほど必要としないと思います。人間はすぐにAIがAIをトレーニングすることに気付くかもしれません。クラスメートが毎日何をしているかを見て、彼らはすぐに置き換えられると感じます。しかし、それはより継続的なユーザーの理解かもしれません。たとえば、パーソナライズは非常に重要です。過去にレコメンデーションシステムを行っていたとき、ユーザー情報は継続的に入力され、システム全体がより強力になりました。しかし、AIが人間の生活のあらゆる側面をカバーするとき、パーソナライズの真の指標は何ですか？私たちは実際にはあまり知りません。ですから、より大きな技術的課題は、今日の評価を行う方法がわからないということです。

李広密：「記憶（Memory）」が実現した場合、それは2026年の技術的突破口の飛躍になるでしょうか？

林俊暘：私の個人的な見解では、多くのいわゆる技術的突破口は、いくつかの観察の問題であり、実際には線形に発展しており、人間がそれを非常に強く感じているだけです。ChatGPTの出現を含め、実際に大規模モデルを作成している私たちにとっては、それは線形成長に属します。Memoryの現在の技術的解決策は正しいですか？多くの解決策には正しいか間違っているかの区別はありませんが、生み出される効果、少なくとも私は自分の無能さを示すために自分たちのものを取ります。それは私たち自身の記憶であり、私が過去に何をしたかを知っているように見えますが、過去のことを思い出しただけで、あまり賢くは見えません。しかし、記憶がある臨界点に達すると、それは本当に生きている人のようになるか、映画「Her」のように、あなたの記憶を理解し、人間の感情を知ることによって、多かれ少なかれまだ1年かかります。多くの場合、技術は実際にはそれほど速く発展せず、誰もが比較的複雑（内巻き）で、毎日新しいことがあると感じていますが、実際には技術は線形に発展しています。私たちが毎日何をしているかを見ると、本当に泥臭く、それらのバグはみんなに話すのが本当に恥ずかしいです。この方法で行っているなら、私たちはすでにそのような結果を達成しています。おそらく将来、アルゴリズムとインフラがより良く組み合わされれば、やるべきことはもっとたくさんあるでしょう。

李広密：楊強教授を宣伝します。

楊強：私はずっと連合学習を行ってきました。連合学習の主なアイデアは、複数のセンター、全員が協力することです。私は今ますます、多くのローカルリソースが不十分であるが、ローカルデータには多くのプライバシーとセキュリティの要件があるのを見ています。私たちは想像することができます、今、大規模モデルの能力はますます強くなっています、一般的な大規模モデルとローカルの専門的な小規模モデル、またはドメインエキスパートモデルはどのように協力しますか？そのような協力はますます可能になっています。米国のZoomのように、Huang Xuedongによって作られたAIシステム、彼は大きな基盤を作り、誰もがこの基盤にプラグインできます。それは、分散型の状態で、プライバシーを保護し、一般的な大規模モデルと効果的に通信し協力することができます。このオープンソースモードは特に良く、1つは知識のオープンソース、1つはコードのオープンソース、モデルステージです。特に医療や金融のようなシナリオでは、この現象がますます起こるでしょう。

李広密：唐教授を宣伝します。

唐傑：継続学習、記憶、さらにはマルチモダリティ、すべて新しいパラダイムの変化があるかもしれません。なぜそのようなパラダイムが生成されるのですか？本来、産業界は実際には学術界よりもはるかに速く走っていました。昨年と一昨年、清華に戻ったことを覚えていますが、多くの教授はほとんどゼロカードでした。産業界は10,000枚のカードを持っており、学校は0枚または1枚のカードを持っており、倍率は10,000倍です。しかし今、多くの学校には多くのカードがあり、多くの教授は大規模モデルに関連する多くの研究を行っています。シリコンバレーを含め、多くの教授がモデルアーキテクチャ、継続学習の研究を開始しました。本来、私たちは常に産業界がこれらを支配していると感じていましたが、2025年の終わりから2026年の初めまでに、この現象は大部分が存在しなくなるかもしれません。学校と産業界の間にはまだ10倍の違いがあるかもしれませんが、それは種を孵化させました。

第一に、学術界にはイノベーションの遺伝子があります。第二に、イノベーションの出現は間違いなく何かに巨額の投資をしたためであり、効率のボトルネックが現れました。今、大規模モデルには巨額の投資がありますが、効率は高くありません。Scalingを続けることは今間違いなくリターンがあります、おそらく2025年の初めに10Tのデータが必要で、今は30Tが必要で、100Tまでスケーリングすることさえできますが、Scalingの後、あなたのリターンはどれくらいですか？計算コストはどれくらいですか？イノベーションを行わない場合、10億を費やし、20億を費やしても、リターンは小さく、それだけの価値はありません。一方、新しい知能イノベーションの場合、ベースを再トレーニングし、RLを再トレーニングするたびに、リターン効率が小さくなるとします。将来的には、リターンを測定する新しいパラダイムを定義するかもしれません。一方では、知能の上限を引き上げたいので、最も愚かな方法はScalingです。一方では、Intelligence efficiency、知能の効率を定義し、より少ないScalingを使用して同じ知能向上を得る必要があります。ですから2026年のパラダイムシフトは間違いなく起こります。私たちも努力しており、この変化が私たちに起こることを願っています。

李広密：私も唐教授と同じように非常に楽観的です。すべての主要なモデル企業、コンピューティング量は毎年約10倍になり、誰もがより多くのコンピューティングリソースを持っており、才能はますます流入しています。誰もがより多くのカードを持っており、おそらく特定の実験プロジェクト、特定のポイントが出てくるでしょう。誰もが2026年のAgentに大きな期待を寄せています。それは、人間が1〜2週間の作業負荷を自動化でき、もはや単なるツールではなくなるということです。これは、Agentが経済的価値を生み出すための重要な年になるかもしれません。シリコンバレーのいくつかの企業はすべて、モデルからAGIまでエンドツーエンドで行いました。順雨、あなたはAgentの研究に多くの時間を費やしました。2026年、Agentは本当に人間が1〜2週間の仕事を自動化するのに役立ちますか？モデル会社の出発点から、この問題についてどう思いますか？

姚順雨：To BとTo Cは異なるかもしれません。To Bの側面では、Agentは常に上昇曲線上にあり、現在減速の傾向はありません。Anthropicは非常に興味深いです。派手なイノベーションを行わず、事前トレーニングを大きくし、RLをうまく行い、現実世界のタスクを解決するだけで、モデルはますます賢くなり、より多くの価値をもたらします。To Bを行うことは、実際にはすべての目標がより一貫しています：モデルの知能が高いほど、解決されるタスクが多くなり、収益が大きくなります。これはTo Cとは異なります。私たちは皆OpenAIのTo Cの問題を知っています。To CのDAUとモデルの知能は、多くの場合無関係であり、逆の関係さえあります。これは、Anthropicが集中できるもう1つの非常に重要な理由です：モデルをより良くし続けるだけです。そうすれば、彼の収益はどんどん高くなり、すべてのことは非常に一致しています。

現在、モデル自体に加えて、2つのボトルネックがあります。1つは環境と展開の問題です。OpenAIの前、私はTo Bカスタマーサービス会社でインターンをしていましたが、かなり多くのことを得ました。今日モデルが良くならなくても、既存のモデルを世界のさまざまな企業に展開するだけで、今日10倍または100倍の収益をもたらし、GDPに5％〜10％の影響を与えるかもしれませんが、今日、GDPへの影響は1％未満です。

もう1つの非常に重要なことは教育です。人々の間の格差は広がっており、AIが人々に取って代わるのではなく、AIツールを使用できる人々が使用できない人々に取って代わります。コンピュータが発明されたばかりのときのように、プログラミングを学ぶようになったとしても、スライドルールを使用し、アルゴリズムを使用している場合、その差は巨大です。おそらく今日中国ができる最大の有意義なことの1つは、実際にはより良い教育であり、ClaudeやChatGPTのような製品をよりよく使用する方法を全員に教えることです。もちろん、Claudeは中国では使用できないかもしれませんが、KimiやZhipuのような国内モデルを使用できます。

李広密：俊暘、Qwenにもエコシステムがあり、Agentを行うこととエコシステムの一般的なAgentをサポートすることを対比させて、共有できますか？

林俊暘：これには製品哲学の問題が含まれるかもしれません。もちろん、Manusのような製品は確かに非常に成功しています。シェルをラップすることは未来ですか？確かに疑問です。「Model is Product」という見方にもっと同意します。TML（Thinking Machine Lab）の人とチャットしましたが、彼らはResearcher is Productという見方を持っています。多くの研究者は自分でプロダクトマネージャーになり、エンドツーエンドで物事を行うことができます。今日、私たち自身の内部研究者は皆、現実世界に直面してより多くのことをしたいと考えています。これからのAgentsは、今言ったこと、自己関与と今言った能動学習に強く関連していることができると信じています。たとえば、彼はそんなに長い間働くことができます、彼は実際にこのプロセスで進化しなければならず、彼はまた何をすべきかを決定しなければなりません。彼が受け取る指示は非常に一般的なタスクであるため、現在のエージェントは、私が絶えず行ったり来たりする形ではなく、その種の管理されたエージェントにますます似始めているように見えます。これには高いモデル能力が必要です。たとえば、モデルはこのエージェントであり、エージェントはこの製品自体です。それらがすべてこのように統合されている場合。この観点から、Test Time Scaling upを行うことを含め、モデル能力の上限を絶えず引き上げる場合。彼は確かにこのことができます。

もう1つの点は、環境相互作用です。私たちは現在、十分に複雑ではないコンピュータ環境と対話しています。私は科学のためのAIを行っている友人がいます。たとえば、AlphaFoldのようなものを行い、薬を作ります。今日のAIを使用しても、おそらくそれほど役に立ちません。なぜなら、実験を行う必要があるからです。コンピュータだけで行うことはできず、ロボットに指示して実験を行い、フィードバックを得る必要があります。現在の人間の効率によると、実際には非常に低く、この環境で実験を行うために多くのアウトソーサーを雇う必要さえあります。AIが実際の物理世界と対話できる場合、それは私がAgentがコンピュータ内だけでなく長時間の仕事を行うことができると想像するシナリオです。コンピュータ環境で行われるいくつかのことは、今年非常に早く完了するかもしれませんが、今後3〜5年で、完了すべきAgentタスクは具現化された知能と組み合わされるかもしれません。これはより興味深いでしょう。

李広密：より鋭い質問でフォローアップしたいのですが、あなたの観点から、起業家にとって一般的なAgentの機会はありますか？

林俊暘：私は基本的なモデルを作っているからといって、起業家精神のメンターになることはできません。成功した人からのその文を借りることしかできません。Peak（Manusの共同創設者）は、General Agentの最も興味深い点はロングテール問題を解決することにある、または今日のAIのより大きな魅力はロングテールにあると言いました。頭の問題は実際に解決するのが簡単です。当時レコメンデーションを行っていたとき、実際には、そのレコメンデーションは非常に集中しており、商品はすべて頭にありましたが、実際にはテールのものを押したかったのですが、当時私がそれをしたときは非常に悲惨でした。NLPとマルチモダリティを行っている人として、マタイ効果を解決しようとすると、基本的に行き詰まります。今日のいわゆるAGIは実際にこの問題を解決していると思います。ユーザー、私はどこでも検索しましたが、この問題を解決するのを手伝ってくれる人は見つかりませんでした。しかし、その瞬間、私はAIの能力を感じました。つまり、世界のどこでも、どこでも検索しても見つかりませんでしたが、あなたは私が解決するのを手伝うことができました。たぶんこれがAIの最大の魅力です。一般的なAgentをやりたいですか？あなたが「シェルラッピング」の専門家であり、モデル会社よりも優れたラッピングをしているなら、あなたはそれを行うことができます。しかし、この自信がなければ、この問題はまだモデル会社自身が行うために残されているかもしれません。なぜなら、彼らが問題に遭遇したとき、モデルを少しトレーニングし、いくつかのカードを燃やすだけで、問題は解決されるかもしれないので、それは意見の問題です。

李広密：実際にロングテール問題を解決すると、モデル会社は計算能力とデータを加えて、あなたはそれを非常に速く解決するようですね。

林俊暘：今日のRL（強化学習）の最も興味深い場所は、問題を修正するのが以前よりも簡単であることがわかったことです。以前は問題を修正するのが困難でした。Bエンドの顧客のケースを挙げましょう。彼らは自分たちでSFT（教師ありファインチューニング）をやりたいと言いました。一般データの比率を教えてもらえますか？相手がSFTのやり方を本当に知らず、彼のデータは実際には悪いのに、自分のデータは役に立つと感じるかもしれないので、私たちは毎回頭痛の種になります。今RLを使用すると、ラベル付けさえ必要なく、非常に小さなデータポイントが必要なだけで、このクエリがあり、この報酬（報酬関数）があり、少しトレーニングするだけで、それをマージすることは実際には非常に簡単です。

楊強：Agentの出現には、目標と計画が人間によって定義されるか、AIによって自動的に定義されるかに応じて、4つの段階があるはずだと思います。私たちは今、最も初歩的な段階にいます：目標は人間によって定義され、計画も人間によって行われます。したがって、現在のAgentの定義、これらのソフトウェアシステムは、基本的に、より深いPrompt言語です。私は将来、大規模モデルが人間の仕事を観察し、人間のプロセスデータを利用し、最終的に目標と計画の両方が大規模モデルによって定義されることを実現すると予測しています。Agentは大規模モデルに固有のシステムであるべきです。

李広密：唐傑教授を宣伝します。

唐傑：いくつかの側面がAgentの将来の傾向を決定します：第一に、Agent自体が人間のことを解決したか、そしてこのことは価値があるか、どれだけ価値があるか？たとえば、GPTのような元のAgentも多くのAgentを作成しましたが、その時点で、そのAgentは非常にシンプルで、最終的にプロンプトがそれを解決したことがわかりました。このとき、ほとんどのAgentはゆっくりと死にました。したがって、第一に、Agentというこのことを解決することがどれほど価値があり、本当に人々を助けることができるかです。第二に、このことを行うための私たちのコストはどれくらいか。コストが特に大きい場合、これも問題です。俊暘が言ったように、APIを呼び出すとこの問題が解決するかもしれません。しかし逆に、APIを呼び出すと解決できると仮定すると、このAPI自体は、このことが非常に価値があると感じたとき、それをその中に作り込むかもしれません。これは矛盾しており、非常に矛盾しており、ベースアプリケーションは常に矛盾しています。最後に、アプリケーションを作成する速度。もし私が時間枠を持っていて、半年間の時間枠を引っ張ることができ、このアプリケーションをすぐに満たすことができれば、半年後、反復するか、接続する方法、前進する方法も側面です。大規模モデルは今まで、速度で、時間でより競合しており、私たちのコードは正しいかもしれませんが、この側面でさらに進むかもしれませんが、半年後に失敗するかもしれません、半年は終わりました。今年私たちはCodingで少しだけ行いました、Agentで、今私たちのCoding呼び出し量はかなり良いです、より多くも方向であり、Agentの未来を行うことも方向です。

李広密：ありがとうございます。過去のモデル企業は一般的な能力を追いかけなければならなかったので、おそらくその優先順位は探求するためにそれほど多くのエネルギーを費やしませんでした。一般的な能力が追いついた後、私たちは2026年にもっと期待しています。Zhipu、Qwenは独自のClaudeの瞬間、そしてMemoryの瞬間を持っており、これは非常に期待する価値があります。4番目の質問、将来も楽しみにする必要があります。3年後、5年後、世界の主要なAI企業が中国のチームである確率はどれくらいですか？今日のフォロワーから将来のリーダーまで、どのような重要な条件が必要ですか？順雨はシリコンバレーと中国市場を経験しましたが、確率と必要な重要な条件についてのあなたの判断は何ですか？

姚順雨：確率はかなり高いです。私はまだかなり楽観的です。現在見ていると、一度発見されたものは何でも、中国ですぐに再現でき、製造業のような以前の例を含め、多くの地元でより良く行われており、電気自動車は絶えず起こっています。いくつかの比較的重要なポイントがあるかもしれません。1つは、中国の露光機が突破できるかどうかです。最終的に計算能力がボトルネックになった場合、計算能力の問題を解決できますか。現在見ていると、私たちには非常に優れた電力の利点、優れたインフラストラクチャの利点があります。主なボトルネックの1つは、露光機を含む生産能力と、ソフトウェアの生態系です。この問題を解決することは大きな助けになるでしょう。もう1つの問題は、To Cに加えて、より成熟した、またはより良いTo B市場があるか、または国際的なビジネス環境で競争する機会があるかです。今日、生産性やTo Bを行っている多くのモデルやアプリケーションがまだ米国で生まれることがわかります。なぜなら、支払う意欲が強く、文化がより良いからです。今日中国でこれを行うのは難しいので、誰もが海外に行くか、国際化することを選択します。これら2つは比較的大きな客観的要因です。より重要なのは主観的な概念です。最近私は多くの人とチャットしていますが、私たちの感覚では、中国には非常に多くの非常に強力な才能がいます。実行可能であることが証明されている限り、多くの人が非常に前向きに試し、より良くしたいと考えています。中国の人々が新しいパラダイムを突破したい、あるいは非常に危険なことをしたいと思うだけでは不十分かもしれません。ここには経済環境、文化的要因を含むビジネス環境が含まれます。もう1つポイントを追加すると、主観的には、起業家精神や冒険心を持った人々、本当にフロンティアの探求や新しいパラダイムの突破を行いたい人々がもっと必要です。現在見ていると、パラダイムが発生すると、非常に少ないカード、非常に高い効率を使用してローカルでより良く行うことができます。私たちは新しいパラダイムをリードできますか？これは今日中国が解決する必要がある唯一の問題かもしれません。なぜなら、ビジネスであれ、工業デザインであれ、エンジニアリングであれ、他のすべてのことは、私たちがある程度米国よりもすでにうまく行っているからです。

李広密：順雨にもう1つ質問します。中国のラボの研究文化に関して何か呼びかけることはありますか？OpenAI、DeepMindも経験しました。中国とアメリカの研究文化の違いは何ですか？AIネイティブ企業として、これにはどのような根本的な影響がありますか？何か呼びかけや提案はありますか？

姚順雨：研究文化は場所によって大きく異なります。アメリカのラボ間の違いは、中国とアメリカのラボ間の違いよりも大きいかもしれません。中国でも同じです。私は個人的に2つの点を感じています。1つは中国で、誰もがまだより安全なことをすることを好むということです。たとえば、今日事前トレーニングというこのことは実行可能であることが証明されました。実際、このことは行うのも非常に難しく、多くの技術的問題を解決する必要がありますが、このことが一度実行可能であると証明される限り、私たちは皆、数か月または一定期間でこの問題を解決することに非常に自信を持っています。しかし、今日誰かに長期記憶や継続学習を探求するように頼むと、このことを誰もどうすればいいかわからず、できるかどうかわからない場合、このことはまだ比較的困難です。たぶん、誰もが特定のことをすることを好むだけでなく、革新的なことをする意欲が低いのかもしれません。非常に重要な点は、文化の蓄積や全体的な認知であり、実際には時間の沈殿が必要です。OpenAIは2022年にこれを開始し、国内は2023年に開始しました。このことの理解にはいくつかの違いがあります。あるいは中国はそれほど大きくないと言えます。多くは単なる時間の問題です。より深い文化や基盤を蓄積すると、微妙な影響度が人々の物事のやり方に影響を与える可能性があります。しかし、それは非常に微妙で、ランキングに反映するのは困難です。中国はランキングや数字を磨くことにより多くの重みを置いています。DeepSeekが比較的うまくやっていることを含め、彼らはランキングの数字にそれほど注意を払っていないかもしれません。第一に、何が正しいことか。第二に、自分自身が経験した何が良いか悪いか。これはまだ非常に興味深いです。なぜなら、Claudeモデルはプログラミングやソフトウェアエンジニアリングのランキングで最高ではないかもしれませんが、誰もがこのものが使うのに最適であることを知っているからです。これには、誰もがこれらのランキングの制約から抜け出し、正しいと感じるプロセスを固持できる必要があります。

李広密：順雨ありがとう。俊暘、確率と課題について話してください。

林俊暘：この質問は危険な質問です。理論的にはこの機会に冷水を浴びせることはできません。確率について話すなら、私は中国と米国の間で感じた違いについて話したいかもしれません。たとえば、アメリカのComputeは全体的に私たちよりも1〜2桁大きいかもしれませんが、OpenAIであれ他の人であれ、彼らの大規模なComputeは次世代のResearchに投資されていることがわかります。私たちは今日、相対的に言えば、手一杯であり、単なるデリバリーがすでに私たちのComputeの大部分を占めている可能性があります。これは比較的大きな違いになります。これは歴史以来存在する問題かもしれません。イノベーションは金持ちの手で起こっているのか、それとも貧乏人の手で起こっているのか。貧乏人には機会がないわけではありません。私たちはこれらの金持ちの兄弟が本当にカードを無駄にしていると感じています。おそらくたくさん訓練されていますが役に立たないかもしれませんが、今日貧乏であること、たとえば今日のいわゆるアルゴリズムInfra共同最適化のようなことは、あなたが非常に金持ちなら、このことをする動機はありません。先ほど順雨は露光機の問題に言及しました。おそらく将来の別のポイントは、ソフトとハードの組み合わせの観点から、次世代のモデルとチップを作ることは本当に可能ですか、それらを一緒に作ることは可能ですか？2021年に大規模モデルを作成していたとき、Alibabaはチップを作成しているため、彼らの人々は私を見つけて、このモデルが3年後にTransformerアーキテクチャであるかどうか、モデルが3年後にマルチモーダルであるかどうかを予測できますかと言いました。なぜ3年ですか？彼はテープアウトするのに3年必要だと言いました。その時の私の答えは、3年後、私がまだAlibabaにいるかどうかわからないということでした。しかし今日私はまだAlibabaにいます。案の定まだTransformerです。案の定まだマルチモーダルです。私は非常に後悔しています。なぜ当時彼にそれをするように強く勧めなかったのですか。当時私たちのコミュニケーションは非常に噛み合わず、彼は私にたくさんのことを言いましたが、私は完全に理解できませんでした。私は彼に言いましたが、彼も私たちが何をしているのかわかりませんでした。ただこの機会を逃しました。この機会が再び来ることは可能ですか？私たちは貧しい人々のグループですが、貧困は変化を生み出します。イノベーションの機会はここで起こりますか？今日私たちの教育は良くなっています。私は90年代前半に属し、順雨は90年代後半に属し、私たちのチームには多くの00年代がいます。みんなの冒険心が強くなっていると感じます。アメリカ人は当然非常に強い冒険心を持っています。非常に典型的な例は、電気自動車が出たばかりのとき、屋根が漏れる状態でさえ、運転すると事故死を引き起こす可能性さえあるときでも、このことを喜んで行う多くの大物がまだいるということです。しかし中国では、大物はこのことをしないと信じています。誰もが非常に安全なことをします。今日、みんなの冒険心は良くなり始めており、中国のビジネス環境も良くなっています。いくつかのイノベーションをもたらすことは可能だと思います。確率はそれほど大きくありませんが、本当に可能です。

李広密：数字を選ぶとしたら？3〜5年後、中国で最も主要な企業が中国企業である確率。

林俊暘：20％だと思います。20％はすでに非常に楽観的です。なぜなら、ここには本当に多くの歴史的蓄積の理由があるからです。

李広密：もう1つ質問をフォローします。たとえば、中国のモデルとアメリカのモデルの間のギャップ、いくつかの場所が追いついている、いくつかの場所で彼らの計算能力が広がっている、ギャップが広がることへの恐怖は強いですか？

林俊暘：今日この行を行うことは恐れることはできません、非常に強い精神力を持たなければなりません。私たちの精神力にとって、この行を行うことができることはすでに非常に良いことであり、大規模モデルというこのことを行うことができることはすでに非常に幸運です。それでも最初の意図が何であるかによります。先ほど順雨はある点に言及しました。あなたのモデルは必ずしもそれほど強力である必要はなく、CエンドでOKです。私はこの問題について考えるために別の角度に切り替えるかもしれません。私たちのモデルは人間社会にどのような価値をもたらしましたか？私のものが人間社会に十分な価値をもたらすことができ、人間を助けることができると信じている限り、最強でなくても、私は受け入れたいと思います。

李広密：俊暘ありがとう。楊教授を宣伝します。あなたは多くのAIサイクルを経験し、多くの中国のAI企業が世界最強になるのを見たので、この問題に対するあなたの判断は何ですか？

楊強：インターネットの発展を振り返ることができます。最初は米国からも始まりましたが、中国は非常に迅速に追いつき、WeChatのようなアプリケーションは世界第1位です。私は、AIは技術であり、最終製品ではありませんが、私たち中国には多くの知性と知恵があり、To BであろうとTo Cであろうと、この製品を極限までプレイするでしょう。しかし、私はTo Cの方をもっと支持するかもしれません。なぜなら、百花繚乱で、中国人はアイデアを出し合っているからです。To Bには、支払う意欲、企業文化などの変化など、いくつかの制限があるかもしれません。私は最近ビジネスの方向性も観察しており、ビジネススクールの学生と議論しています。たとえば、米国にはPalantirという会社があります。そのコンセプトの1つは、AIが現在どの段階に発展しても、私は常にAIの中に企業に適用するための良いものをいくつか見つけることができるということです。真ん中に間違いなくギャップがあり、それを埋める必要があります。それにはオントロジーと呼ばれる方法があります。少し観察しましたが、大まかなアイデアは以前行った転移学習であり、一般的なソリューションを特定の実践に適用し、知識転移にオントロジーを使用することです。この方法は非常に賢いです。もちろん、それはForward Deployed Engineer（FDE）と呼ばれるエンジニアリング手法によって解決されます。とにかく、このように学ぶ価値は非常にあります。AI Native企業のような中国企業はそのようなTo Bソリューションを開発すべきであり、私は彼らがそうすると信じています。ですから、To Cは間違いなく百花繚乱であり、To Bも非常に迅速に追いつくでしょう。

李広密：楊教授ありがとう。唐教授を宣伝します。

唐傑：まず、中国と米国で、特に産業界のAIラボで研究を行っているかどうかにかかわらず、米国とのギャップがあることを認めなければなりません。これが第一です。中国は今、ゆっくりと良くなってきています。特に90年代、00年代の世代の企業は、以前よりもはるかに優れています。かつて私は会議で、私たちの世代は最も不運だと言いました。前の世代も働き続けており、私たちも働いているので、私たちはまだ現れる日がありません。残念ながら次の世代が出てきて、世界は次の世代に渡され、私たちの世代はシームレスにスキップされました。これは冗談です。中国のチャンス：第一に、賢い人々のグループが特に危険なことを本当に敢えて行います。現在存在し、00年代の世代、90年代の世代を含め、俊暘、Kimi、順雨を含め、そのようなことをするためにリスクを冒すことを非常に望んでいます。第二に、巨大企業と中小企業の競争、スタートアップ企業間の問題、ビジネス環境など、国の環境であれ、私たちの環境はより良いかもしれません。俊暘が先ほど言ったように、私はまだデリバリーを行っています。リスクを冒すことを敢えてする賢い人々のグループにイノベーションを行うためのより多くの時間を与える、この環境をより良く構築する場合、それは私たちの政府、私たちの国を含めて改善を助けることができることかもしれません。第三に、私たち一人一人に戻って、私たちが固執できるかどうかです。敢えて行い、道路でリスクを冒すことをいとわないことができ、環境は悪くありません。環境は決して最善ではありません。環境が最善であるとは決して考えないでください。私たちはまさに幸運であり、環境があまり良くなかった時代からゆっくりと良くなる時代を経験しており、私たちは目撃者であり、おそらく最も富と収穫を持つ人々です。私たちが愚かに固執すれば、おそらく私たちが最後まで歩く人です。皆さんありがとうございました！

李広密：唐教授ありがとうございます。私たちはまた、中国のAGI産業により多くのリソース資金を投資し、より多くの計算能力を持ち、より多くのAIの若い研究者にカードをこすらせ、おそらく3〜5年こすらせるべきだと呼びかけたいと思います。中国には独自のIlya Sutskeverが数人生まれるでしょう。これは私たちが今後3〜5年で非常に楽しみにしていることです。

AGI-Nextサミット全文：唐傑、楊植麟、林俊暘、姚順雨が未来を激論

Table of Contents