なぜ中国のAIはこれほど急速に発展しているのか?ラボからの洞察

icon MarsBit
共有
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon概要

expand icon
中国のAIセクターは、優れたエンジニアリングへの注力、オープンソースでの協力、チームベースの開発によって加速しています。研究室は個人の評価よりも実行を重視しています。アリババやバイトダンスなどの大手企業が影響力を拡大するにつれ、AI関連資産に対するオープンインターレストが増加しています。AIマーケットのフィアントグリードインデックスは、楽観的な傾向を示しています。政府の支援とデータインフラがさらにこの勢いを後押ししています。

編集者注:中国のAI研究所は、グローバルな大規模モデル競争においてますます無視できない存在となっている。その優位性は、人材の多さ、エンジニアリングの強さ、イテレーションの速さだけでなく、非常に現実的な組織形態にも由来する。つまり、概念を語るのではなくモデルを作り、個人のスターを強調するのではなくチームの実行力を重視し、外部サービスに依存するのではなく、自らコアテクノロジースタックを掌握することである。

本文の著者ナサニエル・ランバートは、中国の主要なAI研究所を訪問した結果、中国のAIエコシステムは米国とは完全には異なることを発見した。米国はオリジナルのパラダイム、資本投資、トップサイエンティストの個人的影響力に重きを置くのに対し、中国は既存の分野において迅速に追いつくことに長けており、オープンソース化、エンジニアリングの最適化、多数の若手研究者の貢献を通じて、モデルの能力を素早く最前線に押し上げている。

最も注目すべきは、中国のAIが米国を上回ったかどうかではなく、二つの異なる発展路径が形成されつつあることである。米国は資本とスターラボラトリーが駆動する先端競争に似ており、中国はエンジニアリング能力、オープンソースエコシステム、技術自立意識が共に推進する産業競争に似ている。

これは、今後のAI競争がモデルランキングの争いにとどまらず、組織力、開発者エコシステム、産業実行力の競い合いにもなることを意味する。中国AIの真の変化は、シリコンバレーを単に模倣するのではなく、自らの方法でグローバルな最前線に参加し始めている点にある。

以下が原文です:

杭州から上海に向かう新型新幹線に座り、窓の外を見ると、はっきりと起伏する山並みに風力タービンが点在し、夕陽に照らされてシルエットとなって浮かび上がっている。山々が背景となり、その手前には広大な田畑と高層ビルが入り混じる風景が広がっている。

私は非常に謙虚な気持ちで中国から戻りました。これほど異質な場所で、これほど温かく歓迎されたことは、非常に心温まる、また人間味あふれる体験でした。これまで遠くからしか知らなかったAIエコシステムの人々 many に会うことができ、彼らは明るい笑顔と熱意を持って私を歓迎してくれました。それによって、私の仕事、そしてAIエコシステム全体がグローバルであることを改めて実感しました。

中国の研究者の心構え

言語モデルを構築している中国の企業は、この技術の「迅速な追随者」として非常に適していると言える。それらは、中国長年にわたる教育と労働文化の伝統に基づいており、西方とは若干異なる形でテクノロジー企業を構築している。

生産物、すなわち最新かつ最大のモデル、およびこれらのモデルがサポートするエージェント型ワークフローに注目し、優れた科学者、大規模なデータ、高速計算リソースといった投入要素を考慮すると、中国の研究室とアメリカの研究室は基本的に似たような姿をしている。しかし、真に長期的に存在する差異は、これらの要素がどのように組織され、どのように形作られているかという点に現れる。

私は以前から、中国の研究機関が非常に優れており、最先端に近い位置を維持できる理由の一つは、その文化がこの任務と非常にマッチしているからだと考えていた。しかし、直接人々と話す前に、この直感を重要な影響に帰属させることは適切ではないと思っていた。中国のトップ研究機関で働く多くの優秀で謙虚かつオープンな科学者たちと話した後、私の多くの考えがはっきりと明確になった。

今日、最良の大規模言語モデルを構築するには、データからアーキテクチャの詳細、強化学習アルゴリズムの実装に至るまで、技術スタック全体にわたる緻密な作業が大きく影響する。モデルの各段階にはいずれも改善の余地があり、それらの改善をどのように組み合わせるかは複雑なプロセスである。この過程において、非常に優れた個人が行った作業は、全体のモデルが多目的最適化において最大化されるために、一時的に棚上げされる必要がある場合もある。

アメリカの研究者は、個々のコンポーネントの問題を解決することにも非常に長けていますが、アメリカには「自ら声を上げる」という文化がより強いです。科学者として、自らの研究に注目を浴びようと積極的に行動すれば、より成功しやすくなります。また、現代の文化は、「トップAI科学者」となるという新しい有名になる道を推進しています。これは直接的な衝突を引き起こします。

外部では、Llama組織がこれらの利害関係が階層的組織に組み込まれた後、政治的圧力により崩壊したという噂が広まっている。他の研究機関からも、トップ研究者を「なだめる」必要があり、彼らが自分のアイデアが最終モデルに取り込まれていないと不満を述べるのをやめさせることがあると聞いたことがある。これが完全に事実かどうかはともかく、意味は明確である:自己意識やキャリアアップへの欲求は、最良のモデルを構築する妨げとなる。米国と中国の間で、このような文化的なわずかな方向性の差異でも、最終的な成果に有意な影響を与える可能性がある。

その一部の差異は、中国でこれらのモデルを構築しているのが誰であるかに関係しています。すべての研究室において、非常に明確な現実として、主要な貢献者の多くがまだ在学中の学生です。これらの研究室は非常に若く、これは私たちがAi2で採用している組織形態を思い出させます:学生は仲間として扱われ、大規模言語モデルチームに直接統合されています。

これは米国のトップラボとは非常に異なります。米国では、OpenAI、Anthropic、Cursor などの企業はまったくインターンシップを提供していません。Google などの他の企業は、Gemini 関連のインターンシップを名目上提供していますが、多くの人が、自分のインターンシップが真正なコア業務から隔離されてしまうのではないかと懸念しています。

要而言之、このようなわずかな文化差異は、以下のような形でモデル構築能力を高める可能性がある:最終的なモデルを向上させるために、人々はより地味な作業を積極的に行うようになる。AI構築に初めて参加する人々は、これまでの数回のAIバブルの影響を受けにくいため、新しい現代的な技術手法に素早く適応できる。実際、私が話した中国の科学者は、この点を明確に利点と見なしていた。自己意識が低いことで、組織構造が一定程度拡大しやすくなり、人々が「システムを操作しよう」とする傾向が少なくなる。また、多くの人材は、他の場所ですでにプロトタイプが確認されている問題を解決するのに非常に適している。

これは、中国の研究者が創造性が低く、新分野を開拓する「0から1」の学術研究をあまり生み出さないという既知のステレオタイプと対照的である。

この旅行中のいくつかのより学術的な研究所訪問では、多くの責任者が、より野心的な研究文化を育成していると語った。一方で、私たちが話した一部の技術責任者は、教育システムとインセンティブシステムの再設計を必要とするこの科学的研究方法の再構築が、短期間で実現可能かどうか疑問を呈しており、その変革は大きすぎて、現在の経済均衡下では起こりにくいと感じている。

この文化は、非常に得意な「大言語モデル構築ゲーム」の学生やエンジニアを育成しているようだ。もちろん、その数も非常に多い。

これらの学生は、中国でも米国と同様の人材流出が起きていると語った。かつて学術の道を志していた多くの人々が、今や産業界に残ることを決めている。その中で最も興味深い発言は、元々教授になりたかった研究者によるもので、「教授になりたかったのは、教育システムに近づきたかったからだ」と述べた後、さらに「教育は大規模言語モデルによってすでに解決された。学生たちがなぜわざわざ私と話す必要があるのか!」とコメントした。

学生たちは新鮮な視点で大規模言語モデルの分野に参入しており、これは強みです。過去数年間、大規模言語モデルの重要なパラダイムは次々と変化してきました:MoEの拡張から、強化学習の拡張、そしてエージェントのサポートへ。これらのいずれかを成功させるには、広範な文献だけでなく、自社内の技術スタックを含む大量の背景情報を極めて迅速に吸収する必要があります。

学生はこのようなことをする習慣があり、自分自身の「何が効果的であるべきか」という前提を謙虚な姿勢で手放すことを厭いません。彼らは全力で取り組み、モデルを改善する機会を得るために人生を賭けます。

これらの学生は非常に直接的で、科学者を混乱させるような哲学的な余談がほとんどありません。モデルの経済的影響や長期的な社会的リスクについてどのように考えているかを尋ねたとき、複雑な見解を持ち、これらの課題に影響を与えたいと考える中国の研究者は明らかに少ないです。彼らは自らの役割は最良のモデルを構築することだと考えています。

この差異は些細で、否定されやすい。しかし、優雅で賢く、英語で明確に表現できる研究者と長時間話し合うとき、AIに関するより哲学的な質問をすると、その基礎的な問題が空気中に漂い、相手に単純な困惑の表情が浮かぶ。彼らにとって、これはカテゴリーの誤りである。

ある研究者は、ダン・ワンの有名な判断を引用した:アメリカは弁護士が主導する国であるのに対し、中国はエンジニアが治める国である。彼は、こうした問題について議論する際に、この類比を用いて、彼らが建設したいという願望を強調した。中国には、Dwarkesh や Lex といった超メジャーなポッドキャストのように、中国の科学者にスター性を育成する体系的な道筋は存在しない。

私は、AIが引き起こす未来の経済的不確実性、単純なAGI能力を超える課題、またはモデルがどのように振る舞うべきかという倫理的議論について、中国の科学者たちにコメントを求めようとしたが、これらの問題は結局、これらの科学者たちの育った背景と教育背景を浮き彫りにした(編集済み)。彼らは自分の研究に極めて集中しているが、社会がどのように構成され、どのように変化すべきかについて議論や表現を奨励されない環境で育ってきた。

遠くから見ると、特に北京は湾区にとても似ていると感じます。歩いたりタクシーで数分の距離に、競争力のある実験室が存在するような印象です。空港に到着後、ホテルに向かう途中で阿里巴巴北京キャンパスを訪問しました。その後の36時間で、私たちは智谱AI、月の裏側、清華大学、美团、小米、そして01.aiを訪問しました。

中国で滴滴出行を利用するのは便利です。XL車種を選択すると、マッサージチェア付きの電動ミニバンが割り当てられることが多いです。私たちは研究者に人材獲得競争について尋ねましたが、彼らはこれはアメリカで経験したことと非常に似ていると述べました。研究者が転職することは普通であり、人々がどこに行くかは、現在どの場所が最も良い雰囲気かに大きく左右されます。

中国では、大規模言語モデルのコミュニティは、互いに争う部族というより、一つのエコシステムのように感じられる。多くの非公開の対話で、私は同行に対する敬意ばかりを耳にした。すべての中国の研究所は、中国で唯一の先進的な閉鎖型研究所であるバイトダンスとその人気モデル「ドウバオ」を警戒している。一方で、すべての研究所は、DeepSeekを実行面で最も研究的な品味を持つ研究所と深く尊敬している。アメリカでは、研究所のメンバーと非公開で話すと、すぐに火花が散ることが多い。

中国研究者の謙虚さの中で、私が最も印象に残ったのは、彼らがビジネス面でもよく肩をすくめて、「それは私たちの問題ではない」と言う点である。一方、アメリカでは、データ販売者から計算能力、そして資金調達に至るまで、誰もがあらゆるエコシステムレベルの産業トレンドに夢中になっているようだ。

中国AI産業と西洋の研究室との違いと類似点

今日、AIモデルを構築することがこれほど興味深いのは、優秀な研究者たちを同じ建物に集めて、一つの技術的奇跡を生み出すだけではなくなったからである。過去は確かにそうだったが、AIビジネスを維持するため、大規模言語モデルは今や複合体となりつつある。これは構築、デプロイ、資金調達、そしてこの創造物の採用を促進することを含んでいる。

トップAI企業は複雑なエコシステムに存在しています。これらのエコシステムは、前線を継続的に推進するために、資金、計算能力、データ、その他のリソースを提供します。

西洋のエコシステムでは、大規模言語モデルの生成と維持に必要な各種投入要素の統合方法が比較的十分に概念化され、図示されている。Anthropic や OpenAI がその典型例である。したがって、中国の研究室がこれらの問題について西洋とは明確に異なる考え方をしていることが明らかになれば、各企業が将来どのような意味のある差異に注力する可能性があるかを示唆することができる。もちろん、これらの将来は資金調達および/または計算リソースの制約の強い影響を受けることになる。

これらの研究所とのやり取りから得られた最大の「AI産業レベル」の収穫を以下にまとめます:

まず、国内のAI需要に早期の兆しが現れている。
広く議論されている仮説によると、中国のAI市場はより小さくなるとされている。これは、中国の企業がソフトウェアに支払うことを一般的に好まないため、ラボを支えるのに十分な推論市場が生まれないからである。

しかし、この判断はSaaSエコシステムに対応するソフトウェア支出にのみ適用されます。SaaSエコシステムは中国において歴史的に常に小さく続きました。一方で、中国には依然として膨大なクラウド市場が存在します。

重要な未解決の質問は、中国企業のAIへの支出が、規模が小さいSaaS市場に似るか、それとも基盤的な支出であるクラウド市場に似るかという点である。この質問は、中国の研究機関内部でも議論されている。全体的に見て、AIはクラウド市場に近づいているように感じられ、新しいツールに基づく市場が成長しないことについては、誰も本気で懸念していない。

第二に、ほとんどの開発者はClaudeの影響を深く受けています。
Claudeは名目上中国で禁止されているが、中国の大多数のAI開発者はClaudeに魅了されており、それが彼らのソフトウェア構築方法をどのように変えたかを注目している。中国が過去にソフトウェアの購入にあまり積極的ではなかったからといって、中国で推論需要が大幅に増加しないとは考えられない。

中国の技術者は非常に現実的で、謙虚かつ意欲に満ちています。この点は、「ソフトウェアを無料で手に入れる」という歴史的な習慣よりも、私に強い印象を与えました。

一部の中国の研究者は、KimiやGLMのコマンドラインツールなどの独自ツールを使用していると述べるが、全員がClaudeを使用していると指摘している。驚異的だが、Codexに言及する人はほとんどおらず、一方で湾区ではCodexが急速に人気を博している。

第三に、中国の企業には技術所有権への意識がある。
中国の文化は、轟音を立てて動く経済のエンジンと結びつき、予測不可能な結果を生み出している。私が強く感じたのは、多数のAIモデルが、ここでの多くのテクノロジー企業が現実的にバランスを取っていることを反映しているということだ。全体的な計画は存在しない。

この産業は、バイトダンスとアリババに対する敬意によって定義されています。それらは、強力なリソースを背景に多くの市場を制覇すると見なされる大手既存企業です。DeepSeekは尊敬される技術リーダーですが、市場リーダーとは遠く及びません。彼らは方向性を示していますが、市場で経済的に勝利するための構造を持っていません。

これにより、美团や蚂蚁グループのような企業が残ります。西洋人は、なぜそれらの企業がこれらのモデルを構築しているのか驚くかもしれません。しかし実際には、それらの企業は大規模言語モデルを将来のテクノロジー製品の核と見なしており、強力な基盤が必要だからです。

強力な汎用モデルを微調整する際、オープンソースコミュニティからのフィードバックは、それらの技術スタックをより堅牢にし、同時に内部用の微調整バージョンを自社製品に保持することも可能にする。この業界における「オープンを優先する」マインドセットは、実用主義によって大きく定義されている:これはモデルに強力なフィードバックをもたらし、オープンソースコミュニティに還元し、自社のミッションを支援するからである。

第四に、政府の支援は実際に存在するが、その規模は不明である。
人々はしばしば、中国政府が大規模言語モデルの競争を積極的に支援していると主張するが、これは多くの階層からなる比較的分散化された政府体制であり、各階層には自ら何をすべきかを明確に定めた操作マニュアルが存在しない。

北京の異なる地域間では、テクノロジー企業がオフィスを設立するよう誘致するために競争している。これらの企業に提供される「支援」には、おそらく許可証などの官僚的手続きの煩雑さを排除することが含まれている。しかし、このような支援はどの程度まで有効なのか?政府の異なるレベルは、人材を引きつけるために役立てるだろうか?また、チップの密輸を助けることができるだろうか?

訪問中、政府の関心や支援についての言及は確かに多数ありましたが、その情報は十分ではなく、政府が中国のAI発展の道筋をどのように変えることができるかについて、確信を持って詳細を報告するには至りませんでした。

もちろん、中国政府の最高指導部がモデルのあらゆる技術的決定に影響を与えているという兆候はまったく見られない。

第五に、データ産業は西洋ほど発展していない。
これまで、AnthropicやOpenAIが単一の環境に1000万ドル以上を費やし、強化学習の最前線を推進するために年間で数億ドル規模の累計支出を行っていると聞いてきました。そのため、中国の研究室も米国企業から同様の環境を購入しているのか、あるいはそれと同等の国内エコシステムが存在しているのかを気になります。

答えは「データ産業が完全に存在しない」という意味ではなく、それらの経験によれば、データ産業の品質は比較的低いため、多くの場合、内部で環境やデータを自社構築するのがより良い選択であるということです。研究者は自ら強化学習のトレーニング環境を構築するために多くの時間を費やします。一方、バイトダンスやアリババなどの大手企業は、この作業を支えるための内部データアノテーションチームを保有しています。これらはすべて、前述の「購入ではなく自社構築」のマインドセットと一致しています。

第六、より多くのNVIDIAチップへの需要が非常に強い。
NVIDIAの計算能力はトレーニングの黄金標準であり、誰もがより多くの計算能力が不足していることに制約されています。供給が十分であれば、明らかに購入するでしょう。华为を含むその他のアクセラレーターは、推論において好評を得ています。無数の研究所が华为のチップを利用できます。

これらのポイントは、非常に異なるAIエコシステムを描き出している。西洋の研究室の運営方法を中国の同業者にそのまま適用すると、しばしばカテゴリーの誤りを犯すことになる。重要な問題は、これらの異なるエコシステムが本質的に異なるモデルタイプを生み出すのか、それとも中国のモデルは常に3〜9ヶ月前の米国最先端モデルと同様に解釈されるのかである。

結論:グローバル均衡

この旅行以前、私は中国についてあまりにも知らなかった。そして、去るとき、ようやく学び始めたばかりだと感じた。中国は、ルールやレシピで表現できる場所ではなく、非常に異なる動態と化学反応を持つ場所である。その文化は非常に古く、深く、国内の技術構築の方法と完全に絡み合っている。まだ学ぶべきことがたくさんある。

米国の現在の権力構造の多くの部分は、自らの既存の中国観を意思決定における重要な心理的ツールとして利用している。私は中国のほぼすべてのトップAIラボと公式または非公式の対面交流を重ねたが、中国には、西洋の意思決定方式ではモデル化するのが難しい多くの特性と本能が存在することがわかった。

たとえ私がこれらの研究所に、なぜ最も強力なモデルをオープンリリースするのか直接尋ねたとしても、所有権意識とエコシステムへの真摯な支援との間の交差点を完全に結びつけるのは依然として難しい。

ここでのラボは非常に実用的であり、オープンソースの絶対主義者というわけではなく、構築したすべてのモデルを公開するわけではありません。しかし、開発者を支援し、エコシステムを支援し、オープンであることによって自らのモデルをより深く理解しようとする意図は非常に強いです。

中国の大手テクノロジー企業のほとんどが、自社の汎用大言語モデルを構築しています。美团のようなプラットフォーム型サービス企業や小米のような大手消費テクノロジー企業が、オープンウェイトモデルを発表したのを見ています。米国の同種の企業は通常、サービスを購入するだけです。

これらの企業は、流行の新事物で存在感をアピールするためではなく、自社のテクノロジースタックを制御し、現在最も重要な技術を発展させたいという深い根本的な願いから大規模言語モデルを構築している。ノートパソコンから顔を上げると、地平線に無数のクレーンが見えるのは、中国の広範な建設文化と建設エネルギーと深く一致している。

中国研究者身上的人情味、魅力和真诚温暖,令人感到无比亲近。在个人层面上,我们在美国习以为常的那种残酷的地缘政治讨论,丝毫没有影响到他们。这个世界需要更多这样的简单积极。作为AI社区的一员,我如今更担心的是,围绕国籍标签,成员与群体之间正出现裂痕。

私が、米国のラボがAI技術スタックのすべての部分で明確なリーダーになることを望んでいないと言えば、それは嘘になる。特に、私が多くの時間を費やしているオープンモデルの分野では、私はアメリカ人であり、これは正直な好ましさである。

同時に、私が望むのは、オープンエコシステム自体が世界中で繁栄することです。なぜなら、それがより安全で、アクセスしやすく、有用なAIを世界に生み出すからです。しかし現在の課題は、米国の研究所がこのリーダーシップを握るために行動するかどうかです。

この記事を書き終えた時点で、行政命令がオープンモデルに与える影響に関するさらなる噂が広まっている。これは、米国のリーダーシップとグローバルエコシステムとの協調関係をさらに複雑にする可能性があり、私にはより自信が持てない。

月之暗面、智谱、美团、小米、通義千問、螞蟻靈光、01.ai 以及其他機関で有幸に話し合ったすべての優れた方々に感謝します。皆様はとても熱意があり、貴重な時間を惜しみなくご提供くださいました。私の考えが形になっていくにつれ、中国に関する観察、より広い文化レベルだけでなく、AI分野そのものについても引き続き共有していきます。

明らかに、これらの知識はAIの最先端の発展が展開する物語と直接関連しています。

免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。 デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。