DeepSeek(ディープシーク)のロゴ
27日(現地時間)、米紙ウォールストリートジャーナル(WSJ)やマサチューセッツ工科大学(MIT)の情報技術メディア「テクノロジーレビュー」などによると、ディープシークは2023年5月、中国杭州で設立された。
設立者は1985年生まれの梁文峰という人物で、中国広東省出身の梁氏は工学分野で特に指折りの名門大学の浙江大学でコンピューター工学を専攻したという。
梁氏は大学卒業後、2015年に大学の友人2人と共に「ハイ-フライヤー(High-Flyer)」というヘッジファンドを設立し、コンピュータトレーディングにディープラーニング技法を先駆的に適用して資金を集めた。
同ファンドの資産は80億ドル(約1兆2439億円)水準に増え、梁氏は小規模AI研究所を作って運営し、独立的な会社に分離してディープシークを創業した。
梁文峰氏の知人たちによると、梁氏は自らファンドトレーダーよりもエンジニアとして認識されることを好むとWSJが伝えた。
経済メディアフォーブスはディープシークの研究チームに中国最高の大学を卒業した若い人材が集まっており、特に伝統的な業務経験より技術的な能力を優先する採用を通じて「AI開発に対する新鮮な見解を持つ高度に熟練したチームを構成した」と報じた。
梁氏のファンド「ハイ-フライヤー」は、2019年からAI開発のためのチップを備蓄し始め、巨大言語モデル(LLM)を訓練できるNVIDIAのグラフィック処理装置(GPU)約1万個を確保し、AIチップクラスターを構築した。
その後、2023年11月にディープシークは最初のオープンソースAIモデル「ディープシーク・コーダ」を公開し、昨年5月にはさらに進展した「ディープシーク-V2」を発売した。このモデルは強力な性能と低コストで大きく注目され、中国内のAIモデル市場に価格戦争を触発した。
続いて、次々と発売した「ディープシーク-V3」と「ディープシーク-R1」は、同社の名前を世界に知らせるきっかけとなった。ディープシークは、V3とR1がいずれも米国の主要AIモデルより性能が良いか、同じような水準だと自信を示した。
ディープシークによると、特に米国の数学競技大会のAIME2024ベンチマークテストでR1は79.8%を得てオープンAI「o1」の79.2%よりリードしたという。
25日基準でこの2つのモデルはカリフォルニア大学バークレー校(UCバークレー)の研究員がチャットボット性能を評価するプラットフォーム「チャットボットアリーナ」で上位10位内に入った。
さらに同社は、これまで米国の主要企業がAIモデル開発にかけた費用に比べてはるかに少ない金額で自社のモデルを作ったと明かし、世界を驚かせた。
会社側はディープシーク-V3開発にかけた費用が557万6000ドルに過ぎないと明らかにしたが、これはメタが最新AIモデルのラマ(Llama)3モデルをNVIDIAの高価チップ「H100」で訓練した費用と比べて10分の1の水準だ。
ただし、ディープシークが明らかにした金額はNVIDIAの安いチップの「H800 GPU」を1時間当り2ドルで2カ月間借りた費用を計算したもので、人件費や運営費などは含まれていない金額だ。
それでも業界は、この会社がはるかに安い資源で優れた性能のモデルを作ったという点で、AI開発街道に一大革新を起こしたと評価する。
特に、最新推論モデルR1の場合、既存モデルの微調整(fine-tuning)段階をスキップし、強化学習(reinforcement learning)に焦点を合わせた創意的な設計などで注目された。
オープンAIの元役員のジャック・カス氏は、ディープシークのこのような事例が「資源制約がしばしば創意性を促進するという大きな教訓を示している」と述べた。
ただ、ディープシークのV3モデルのユーザーは、このチャットボットが中国政府や習近平国家主席に対するデリケートな政治的質問には回答を避けるなど、政府の検閲を受けるのが唯一の短所だと指摘した。
WSJは、梁文峰氏が20日、中国の李強首相と会い、中国企業が米国企業との技術格差を減らすことができる方案について議論したと報じた。
WSJによると、この席で梁氏は「中国企業が米国に追いつこうと絶えず努力しているが、米国の先端チップ輸出制限が依然としてネックになっている」と話したという。
一方、同日、ディープシークのAIモデル開発のニュースに、ニューヨーク証券市場でナスダック指数は前取引日より612.47ポイント(-3.07%)急落した1万9341.83で取引を終えた。
ディープシーク・ショックの直撃弾を受けたNVIDIAが指数下落を主導した。同日、NVIDIAの株価は118.42ドルで取引を終えた。前取引日より16.97%暴落した数値だ。
スタンダード&プアーズ(S&P)500指数は前取引日より88.96ポイント(-1.46%)低い6012.28で取引を終え、技術株の比重が相対的に低いダウジョーンズ工業株30種平均指数は前取引日より289.33(0.65%)高い4万4713.58で取引を終えた。
この記事を読んで…