中国のAI研究所内部からのノート
原文作者:Nathan Lambert
編集:Peggy、BlockBeats
編集者注:中国のAIラボは、グローバルな大規模モデル競争においてますます無視できない存在となっています。それらの優位性は、人材の多さ、エンジニアリングの強さ、イテレーションの速さだけでなく、非常に現実的な組織形態に由来しています。概念を語るのではなく、モデルの開発に集中し、個人のスターダムを強調するのではなく、チームの実行力を重視し、外部サービスに依存するのではなく、自社でコアテクノロジースタックを掌握することを優先しています。
本文の著者ナサニエル・ランバートは、中国の主要なAI研究所を訪問した結果、中国のAIエコシステムは米国とは完全には異なることを発見した。米国はオリジナルのパラダイム、資本投資、トップ科学者の個人的影響力に重きを置くのに対し、中国は既存の方向性において迅速に追いつくことに長けており、オープンソース化、エンジニアリングの最適化、多数の若手研究者の貢献を通じて、モデルの能力を素早く最先端に押し上げている。
最も注目すべきは、中国のAIが米国を上回ったかどうかではなく、二つの異なる発展パスが形成されていることである:米国は資本とスターラボによって駆動される先端競争に似ており、中国はエンジニアリング能力、オープンソースエコシステム、技術自立意識によって支えられる産業競争に似ている。
これは、今後のAI競争がモデルランキングの争いにとどまらず、組織力、開発者エコシステム、産業実行力の競い合いにもなることを意味する。中国AIの真の変化は、シリコンバレーを単に模倣するのではなく、自らの方法でグローバルな最前線に参加し始めている点にある。
以下が原文です:
杭州から上海に向かう新型新幹線に座り、窓の外を見ると、はっきりと起伏する山並みに風力タービンが点在し、夕陽に照らされてシルエットとなって浮かび上がっている。山々が背景となり、その手前には広大な田畑と高層ビル群が交錯する光景が広がっている。
私は非常に謙虚な気持ちで中国から戻りました。これほど異質な場所で、これほど温かい歓迎を受けたことは、非常に心温まる、また人間味あふれる体験でした。これまで遠くからしか知らなかったAIエコシステムの多くの人々と出会うことができ、彼らは明るい笑顔と熱意をもって私を歓迎してくれました。それによって、私の仕事、そしてAIエコシステム全体がグローバルであることを改めて実感しました。
中国の研究者の心構え
言語モデルを構築している中国の企業は、この技術の「迅速な追随者」として非常に適していると言える。それらは、中国長年にわたる教育と労働文化の伝統に基づいており、西方とは若干異なる形でテクノロジー企業を構築している。
生産物、つまり最新かつ最大のモデル、およびこれらのモデルがサポートするエージェント型ワークフローに注目し、優れた科学者、大規模なデータ、高速計算リソースといった投入要素を考慮すると、中国の研究室とアメリカの研究室は基本的に似ているように見える。しかし、真に長期的に存在する差異は、これらの要素がどのように組織され、どのように形成されるかという点に現れる。
私はこれまで、中国の研究機関が非常に優れており、最先端に近い位置を維持できる理由の一つは、その文化がこの任務と非常にマッチしているからだと考えてきました。しかし、直接人々と交流するまでは、この直感を重要な影響に帰属させることは不適切だと感じていました。中国のトップ研究機関の多くの優秀で謙虚かつ開放的な科学者たちと話し合った後、私の多くの考えがはっきりと明確になりました。
今日、最良の大規模言語モデルを構築するには、データからアーキテクチャの詳細、強化学習アルゴリズムの実装に至るまで、技術スタック全体にわたる緻密な作業が大きく影響する。モデルの各段階にはいずれも改善の余地があり、それらの改善をどのように組み合わせるかは複雑なプロセスである。この過程では、非常に優れた個人が行った作業が、全体のモデルが多目的最適化において最大化されるために一時的に棚上げされる可能性がある。
米国の研究者は、個々のコンポーネントの問題を解決することにも明らかに長けていますが、米国には「自らの声を上げる」という文化がより強いです。科学者として、自らの研究に注目を引きつけるために積極的に行動すると、より成功しやすくなります。また、現代の文化は、「トップAI科学者」となるという新しい有名になる道を推進しています。これは直接的な対立を引き起こします。
外部では、Llama組織がこれらの利害関係を階層的組織に組み込んだ後、政治的圧力によって崩壊したという噂が広まっている。他の研究機関からも、トップ研究者を「なだめる」必要があり、彼らが自分のアイデアが最終モデルに取り込まれていないと不満を述べるのをやめさせることがあると聞いている。これが完全に事実かどうかはともかく、意味は明確である:自己意識やキャリアアップへの欲求は、最良のモデルを構築する妨げとなる。米国と中国の間で、このような文化的なわずかな方向性の差異でも、最終的な成果に有意な影響を与える可能性がある。
その一部の差異は、中国でこれらのモデルを構築しているのが誰であるかに関係しています。すべての研究室において、非常に明確な現実として、主要な貢献者の多くがまだ在学中の学生です。これらの研究室は非常に若く、これは私たちがAi2で採用している組織形態を思い起こさせます:学生は仲間として扱われ、大規模言語モデルチームに直接統合されています。
これは米国のトップラボとは非常に異なります。米国では、OpenAI、Anthropic、Cursor などの企業はまったくインターンシップを提供していません。Google などの他の企業は、Gemini に関連するインターンシップを名目上提供していますが、多くの人が、自分のインターンシップが真正なコア業務から隔離されてしまうのではないかと懸念しています。
要而言之、このようなわずかな文化差異は、以下の方法でモデル構築能力を高める可能性がある:最終的なモデルを向上させるために、人々はより地味な作業をより積極的に行うようになる;AI構築に初めて参加する人々は、これまでの数回のAIバブルの影響を受けにくいため、新しい現代的な技術手法に素早く適応できる。実際、私が話した中国の科学者は、この点を明確に利点と見なしていた;自己意識が低いことで、組織構造が一定程度拡張しやすくなり、人々が「システムを操作しよう」とする傾向が減る;大量の人材は、他の場所ですでにプロトタイプが確認されている問題を解決するのに非常に適している、など。
これは、中国の研究者が創造性が低く、新分野を開拓する「0から1」の学術研究をあまり生み出さないという既知のステレオタイプと対照的である。
この訪問の数回のより学術的な研究所訪問では、多くの責任者が、より野心的な研究文化を育成していると語った。一方で、私たちが話した一部の技術責任者は、教育システムとインセンティブシステムの再設計を必要とするこの科学的研究方法の再構築が、短期間で実現可能かどうか疑問を呈しており、その変革は大きすぎて、現在の経済均衡下では起こりにくいと感じている。
この文化は、おそらく「大言語モデル構築ゲーム」に非常に熟練した学生やエンジニアのグループを育成している。もちろん、その数も非常に多い。
これらの学生は、中国でも米国と同様の人材流出が起きていると語った。かつて学術の道を志していた多くの人々が、今では産業界に残ることを決めている。最も興味深い発言は、元々教授になりたかった研究者によるもので、彼は教育システムに近づきたくて教授になりたかったと語ったが、その後、教育は大規模言語モデルによって解決されたと評価した。「学生たちはなぜわざわざ私と話す必要があるのか!」
学生が大言語モデルの分野に新鮮な視点で取り組むことは、有利な点です。過去数年間、大言語モデルの主要なパラダイムは次々と変化してきました:MoEの拡張から、強化学習の拡張、そしてエージェントのサポートへ。これらのいずれかを成功させるには、広範な文献だけでなく、自社内の技術スタックを含む大量の背景情報を極めて迅速に吸収する必要があります。
学生はこのようなことを慣れているだけでなく、「何が効果的であるべきか」というすべての前提を謙虚な姿勢で手放す意欲もある。彼らは全身全霊をかけて取り組み、モデルを改善する機会を得るために人生を捧げる。
これらの学生は非常に直接的で、科学者を混乱させるような哲学的な余談がほとんどありません。モデルの経済的影響や長期的な社会的リスクについてどのように考えているかを尋ねた際、複雑な見解を持ち、これらの課題に影響を与えたいと考える中国の研究者は明らかに少ないです。彼らは自らの役割は最良のモデルを構築することだと考えています。
この差異は些細で、否定されやすい。しかし、洗練され、賢く、英語で明確に表現できる研究者と長時間話し合うとき、最も強く感じられる。AIに関するより哲学的な質問をしたとき、これらの基本的な問題が空気に漂い、相手に単純な困惑の表情が浮かぶ。彼らにとって、これはカテゴリーの誤りである。
ある研究者は、ダン・ワンの有名な見解を引用した:アメリカは弁護士が主導するのに対し、中国はエンジニアが統治している。彼は、このような問題について語る際、この比喩を使って、彼らが建設したいという願望を強調した。中国には、Dwarkesh や Lex といった超メジャーなポッドキャストのように、中国の科学者にスター性を育成する体系的な道筋は存在しない。
私は、AIによって引き起こされる未来の経済的不確実性、単純なAGI能力を超える課題、またはモデルがどのように振る舞うべきかという倫理的議論について、中国の科学者たちにコメントを求めてみたが、これらの問題は結局、これらの科学者たちの成長環境と教育背景(編集済み)を浮き彫りにした。彼らは自分の仕事に極めて集中しているが、社会がどのように組織され、どのように変化すべきかについて議論や表現を奨励されない環境で育ってきた。
遠くから見ると、特に北京は湾区にとても似ていると感じます。歩いたりタクシーで数分の距離に、競争力のある実験室が存在するようです。空港に到着後、ホテルに向かう途中で阿里巴巴北京キャンパスに寄りました。その後の36時間で、私たちは智谱AI、月の暗面、清華大学、美团、小米、01.aiを訪問しました。
中国で滴滴出行を利用するのは便利です。XL車種を選択すると、マッサージチェア付きの電動ミニバンが割り当てられることが多いです。私たちは研究者に人材獲得競争について尋ねましたが、彼らはこれはアメリカで経験したことと非常に似ていると答えました。研究者が転職することは普通であり、人々がどこに行くかは、現在どの場所が最も良い雰囲気かに大きく左右されます。
中国では、大規模言語モデルのコミュニティは、互いに争う部族というより、一つのエコシステムのように感じられる。多くの非公開の対話で、私は同行に対する敬意ばかりを耳にした。すべての中国の研究所は、中国で唯一の先端的な閉鎖型研究所であるバイトダンスとその人気モデル「ドウバオ」を警戒している。一方で、すべての研究所は、DeepSeekを実行面で最も研究的な味わいを持つ研究所と深く尊重している。アメリカでは、研究所のメンバーと非公開でやり取りすると、すぐに火花が散る。
中国研究者の謙虚さの中で、最も印象に残ったのは、彼らがビジネス面でもしばしば肩をすくめて、「それは自分の問題ではない」と言う点である。一方、アメリカでは、データ販売者から計算能力、そして資金調達に至るまで、誰もがあらゆるエコシステムレベルの産業トレンドに夢中になっているようだ。
中国AI産業と西洋の研究室との違いと類似点
今日、AIモデルを構築することがこれほど興味深いのは、優れた研究者たちを同じ建物に集めて、一つの工学的奇跡を生み出すだけではなくなったからです。過去は確かにそうでしたが、AIビジネスを維持するため、大規模言語モデルは今や混合体となりつつあります。これは構築、デプロイ、資金調達、そしてこの創造物の採用を促進することを含んでいます。
上位AI企業は複雑なエコシステムに存在しています。これらのエコシステムは、前線を継続的に推進するために、資金、計算能力、データ、その他のリソースを提供します。
西洋のエコシステムでは、大規模言語モデルの生成と維持に必要な各種投入要素の統合方法が比較的十分に概念化され、図示されている。Anthropic や OpenAI がその典型例である。したがって、中国の研究室がこれらの問題について西洋とは明確に異なる考え方をしていることが明らかになれば、異なる企業が今後どのような意味のある差異に注力する可能性があるかを示唆することができる。もちろん、これらの将来像は資金調達および/または計算リソースの制約の強い影響を受けることになる。
これらの研究所とのやり取りから得られた最大の「AI産業レベル」の収穫を以下にまとめます:
まず、国内のAI需要に早期の兆しが現れている。
中国AI市場がより小さくなるという広く議論されている仮説がある。これは、中国の企業がソフトウェアに支払うことを一般的に好まないため、ラボを支えるのに十分な推論市場が生まれないという考えに基づいている。
しかし、この判断はSaaSエコシステムに対応するソフトウェア支出にのみ適用されます。SaaSエコシステムは中国历史上常に小さく続きました。一方で、中国には依然として広大なクラウド市場が存在します。
重要な未解決の質問は、中国企業のAIへの支出が、規模が小さいSaaS市場に似るか、それとも基盤的な支出であるクラウド市場に似るかということです。この質問は中国の研究機関内部でも議論されています。全体的に見て、私はAIがクラウド市場に近づいていると感じており、新しいツールに基づく市場が成長しないことについては、誰も本気で懸念していません。
第二に、ほとんどの開発者はClaudeの影響を深く受けています。
Claudeは名目上中国で禁止されているが、中国の大多数のAI開発者はClaudeに魅了されており、それが彼らのソフトウェア構築方法をどのように変えたかを注目している。中国が過去にソフトウェアの購入に消極的だったからといって、中国で推論需要が大幅に増加しないとは考えられない。
中国の技術者は非常に実用的で、謙虚であり、やる気に満ちています。この点は、「ソフトウェアを無料で手に入れる」という過去の習慣よりも、私に強い印象を与えました。
一部の中国の研究者は、KimiやGLMのコマンドラインツールなどの独自ツールを使用していると述べるが、全員がClaudeを使用していると指摘する。驚異的だが、Codexに言及する人はほとんどおらず、一方で湾区ではCodexが急速に人気を博している。
第三に、中国の企業には技術所有権への意識がある。
中国の文化は、轟音を立てて動作する経済のエンジンと結びつき、予測不可能な結果を生み出している。私が強く感じたのは、多数のAIモデルが、ここでの多くのテクノロジー企業が現実的にバランスを取っていることを反映しているということだ。総合的な計画は存在しない。
この産業は、バイトダンスとアリババへの敬意によって定義されています。それらは、強力なリソースを活かして多くの市場を制覇すると見なされる大手既存企業です。DeepSeekは尊敬される技術リーダーですが、市場リーダーとは遠く及びません。彼らは方向性を示しますが、市場で経済的に勝利するための構造を持っていません。
これにより、美团や蚂蚁集団这样的企業が残ります。西洋人は、なぜそれらの企業がこれらのモデルを構築しているのか驚くかもしれません。しかし実際には、それらの企業は大規模言語モデルを将来のテクノロジー製品の核と見なしており、強力な基盤が必要だからです。
それらが強力な汎用モデルを微調整する際、オープンソースコミュニティからのフィードバックは、それらの技術スタックをより堅牢にし、同時に自社製品向けに内部微調整バージョンを保持することも可能にする。この業界における「オープンを優先する」マインドセットは、実用主義によって大きく定義されている:これはモデルに強力なフィードバックをもたらし、オープンソースコミュニティに還元し、自社のミッションを強化することができる。
第四に、政府の支援は実際に存在していますが、その規模は不明です。
人々はしばしば、中国政府が大規模言語モデルの競争を積極的に支援していると主張する。しかし、これは多くの階層からなる比較的分散化された政府体制であり、各階層には自ら何をすべきかを明確に定めた操作マニュアルが存在しない。
北京の異なる地域間では、テクノロジー企業がオフィスを設立するよう誘致するために競争しています。これらの企業に提供される「支援」には、おそらく許可証などの官僚的手続きの煩雑さを排除することが含まれているでしょう。しかし、このような支援はどの程度まで有効でしょうか?政府の異なるレベルは、人材を引きつけるために役立つでしょうか?また、チップの密輸を助けることはできるでしょうか?
訪問全体を通じて、政府の関心や支援に関する言及は確かに多くありましたが、その情報は十分ではなく、政府が中国のAI発展の道筋をどのように変えることができるかについて、自信を持って詳細を報告するには至りませんでした。
もちろん、中国政府の最高指導部がモデルのあらゆる技術的決定に影響を与えているという兆候はまったく見られない。
第五に、データ産業は西洋ほど発達していない。
これまで、Anthropic や OpenAI が単一の環境に 1000 万ドル以上を費やし、強化学習の前進のために年間数億ドル規模の累計支出を行っていると聞いてきました。そのため、中国の研究室も米国企業から同じ環境を購入しているのか、あるいはそれと同様の国内エコシステムが存在するのかを知りたいと思っています。
答えは「データ産業が完全に存在しない」という意味ではなく、それらの経験に基づけば、データ産業の品質は比較的低いため、多くの場合、内部で環境やデータを自社構築するのがより良い選択であるということです。研究者は自ら強化学習の訓練環境を構築するために大量の時間を費やしますが、バイトダンスやアリババなどの大手企業は、この作業を支えるための内部データアノテーションチームを保有しています。これらはすべて、前述の「購入ではなく自社構築」というマインドセットと一致しています。
第六、より多くのNVIDIAチップへの需要が非常に強い。
NVIDIAの計算能力はトレーニングの黄金標準であり、誰もがより多くの計算能力が不足していることに制限されています。供給が十分であれば、明らかにそれらを購入します。华为を含むその他のアクセラレーターは、推論において肯定的な評価を受けています。無数の研究所が华为のチップを利用できます。
これらのポイントは、非常に異なるAIエコシステムを描き出している。西洋の研究室の運営方法を中国の同業者に即座に適用すると、範疋の誤りが生じることが多い。重要な問題は、これらの異なるエコシステムが本質的に異なるモデルタイプを生み出すかどうか、それとも中国のモデルは常に3〜9ヶ月前の米国先端モデルと同様に解釈されるのかである。
結論:グローバル均衡
この旅行の前、私は中国についてあまりにも知らなかった。そして、去るとき、私はようやく学び始めたばかりだと感じた。中国は、ルールやレシピで表現できる場所ではなく、非常に異なる力学と化学反応を持つ場所である。その文化は非常に古く、深く、国内の技術構築の方法と完全に絡み合っている。私はまだ学ぶべきことがたくさんある。
米国の現在の権力構造の多くの部分は、自らの既存の中国観を意思決定における重要な心理的ツールとしている。私が中国のほぼすべてのトップAIラボと公式または非公式の対面交流を重ねた結果、中国には、西洋の意思決定方式ではモデル化するのが難しい多くの特性と本能があることがわかった。
たとえ私がこれらの研究所に、なぜ最も強力なモデルをオープンにリリースするのか直接尋ねたとしても、所有権意識とエコシステムへの真摯な支援との交差点を完全に結びつけるのは依然として難しい。
このラボは非常に実用的であり、オープンソースの絶対主義者というわけではなく、開発したすべてのモデルを公開するわけではありません。しかし、開発者を支援し、エコシステムを支援し、オープンを自らのモデルをより深く理解する手段としている点では、明確な意図を持っています。
中国の大手テクノロジー企業のほとんどが、独自の汎用大言語モデルを構築しています。美团のようなプラットフォーム型サービス企業や小米のような大手消費テクノロジー企業が、オープンウェイトモデルをリリースしているのを見ています。米国の同様の企業は通常、サービスを購入するだけです。
これらの企業は、流行の新事物で存在感をアピールするためではなく、自社のテクノロジースタックを制御し、現在最も重要な技術を発展させたいという深く根本的な願いから大規模言語モデルを構築しています。ノートパソコンから顔を上げると、地平線に無数のクレーンが見えるのは、中国のより広範な建設文化と建設のエネルギーと明確に一致しています。
中国研究者身上的人情味、魅力和真诚温暖,非常令人感到亲近。在个人层面上,我们在美国习惯的那种残酷地缘政治讨论,完全没有渗透到他们身上。这个世界可以拥有更多这种简单的积极性。作为 AI 社区的一员,我现在更担心的是,围绕国籍标签,成员和群体之间正在出现裂缝。
私が、米国のラボがAI技術スタックのすべての部分で明確なリーダーになることを望んでいないと言えば、それは嘘になります。特に、私が多くの時間を費やしているオープンモデルの分野では、私はアメリカ人であり、これは正直な好ましさです。
一方で、私はオープンエコシステムが世界中で繁栄することを願っています。なぜなら、それはより安全で、アクセスしやすく、より有用なAIを世界にもたらすからです。しかし現在の課題は、米国の研究機関がこのリーダーシップを握るために行動するかどうかです。
この記事を書き終えた時点では、行政命令がオープンモデルに与える影響に関するさらなる噂が広まっている。これは、米国のリーダーシップとグローバルエコシステムとの協調関係をさらに複雑にする可能性があり、私に安心感を与えることはない。
月之暗面、智谱、美团、小米、通義千問、螞蟻靈光、01.ai 以及其他機構で有幸に会話させていただいたすべての優れた方々に感謝します。皆様はとても熱意があり、貴重な時間を惜しみなくご提供くださいました。私の考えが形になっていくにつれ、中国に関する観察、より広い文化面およびAI分野そのものについても引き続き共有していきます。
明らかに、これらの知識は、AIの最先端の発展が展開する物語と直接関連しています。
[原文リンク]
律動 BlockBeats 公式コミュニティへようこそ:
Telegram サブスクライブグループ:https://t.me/theblockbeats
Telegram コミュニティ:https://t.me/BlockBeats_App
Twitter公式アカウント:https://twitter.com/BlockBeatsAsia
