アジリティロボティクスのヒューマノイド「ディジット」。
◇世界モデル=現実世界でモノと人がどのように動き、その結果はどうなるかを推論するAIモデルを意味する。このAIは仮想世界でシミュレーションを通じて実際の物理法則が適用される現実世界の因果関係を学習する。学界では世界モデルがGPTをはじめとする既存のLLMを跳び超えると予想している。LLMは物理的結果を推論する問題では限界があるためだ。
この限界を超えたAIが世界モデルだ。世界モデルが商用化されれば自動運転や物流ロボットなどの開発スピードが速くなり、人のように思考する汎用人工知能(AGI)を作る糸口となる。
◇フィジカルAI=物理的実体と直接相互作用できるAIを意味する。ロボットを実験室の外に連れ出して人間とともに仕事ができるようにさせるための必須技術だ。この技術を先取りするために昨年から米国と中国の競争が激しくなっている。産業現場をまねた実験室でロボットを稼動しあらゆる試行錯誤データを集め、このデータをロボットの頭脳である視覚・言語統合モデル(VLA)に移植して性能を高度化しているところだ。
性能競争が激しくなりロボットの体(ハードウエア)と頭脳(フィジカルAI)を同時に作って最適化しようとする開発会社も現れた。こうした「フルスタック戦略」は今後ロボット市場の主導権を握る必須条件になっている。
◇AIサイエンティスト=AIが自律的に科学仮説を立て、過去の論文とデータを分析した後に実験室で自ら検証するモデルだ。人間の研究を補助したAIコサイエンティスト(共同科学者)モデルとしてさらに一歩進化した概念だ。すでに研究室ではAIが必須研究ツールとしての位置を確立した。グーグルによると、グーグル・ディープマインドのたんぱく質構造予測AIモデルである「アルファフォールド」はサービス開始5年で300万人以上のユーザーを集めた。学界ではAIが疾病にともなう症状を分類し治療計画を設計するなど医療分野での役割が増えると期待している。
◇スペック基盤コーディング=人がプロダクトに対する定義をし、コーディングはAIがする技法だ。AIのコーディング実力が低年次開発者を追い抜いてシリコンバレーで広がった業務方式だ。昨年2月にオープンAI共同設立者のアンドレイ・カーパシー氏が「バイブコーディング」(普段使う言葉でコーディングする方式)という用語を初めて使った後、開発業務の敷居は急速に低くなる傾向だ。企業が開発者に要求する能力もコーディングの代わりに「プロダクトスペック」(製品明細書)に変わり始めた。
◇バイブデザイン=デザイナーではない一般人もAIと対話して各種イメージや動画などのコンテンツを製作する技術だ。昨年5月にデザイン協業ソフトウエア開発会社のフィグマが初めて提示した後、デザイン業界に急速に広がった。AIはユーザーの好みに合わせて編集も処理してくれる。グーグルは昨年映像生成AIの「VEO3」、イメージ生成AIの「ナノバナナプロ」などを出し、オープンAIも「GPTイメージ1.5」を発売した。後発走者であるメタもイメージ生成AI「マンゴー」を開発している。合わせてビッグテックの知的財産権(IP)確保競争も激しくなっている。IPがなくてはAIが学習するデータを手に入れることができないためだ。
話すAIは去り働くAI…チャットGPTよりも強い奴がくる(2)
この記事を読んで…