AIチップ「ハラペーニョ」を手にするOpenAIのサム・アルトマンCEO(左)と、ブロードコム(Broadcom)のホック・タンCEO。[写真 OpenAI]
OpenAIは24日(現地時間)、公式ホームページを通じて「ブロードコムと共同開発した初のAI半導体『ハラペーニョ(Jalapeno)』を公開する」と発表した。ハラペーニョは、大規模言語モデル(LLM)の推論に特化したAI半導体だ。OpenAIが昨年10月にブロードコムと次世代AI半導体の供給契約を締結してから9カ月で、「テープアウト」(AI半導体の設計完了後、最初の試作品を出荷すること)に成功した。
OpenAIは「ハラペーニョの初期テストの結果、エヌビディアやグーグルの最新AI半導体と同等の性能を記録した」と明らかにした。また、消費電力当たりの性能(電力効率)は競合他社の半導体を上回った。あらゆるAIモデルの学習・推論演算に対応できるよう設計された汎用グラフィックス処理装置(GPU)とは異なり、ハラペーニョはChatGPTやCodexなどOpenAIの製品向けに最適化して設計されているためだ。ブロードコムのホック・タン最高経営責任者(CEO)はこの日、ロイター通信とのインタビューで、「(ハラペーニョは)エヌビディアのブラックウェルやグーグルのテンソル・プロセッシング・ユニット(TPU)と肩を並べる性能を備えている」と述べ、「台湾TSMCのファウンドリー(受託生産)工程で量産し、サムスン電子やSKハイニックスなどからメモリー半導体の供給を受ける計画だ」と説明した。ブルームバーグ通信によると、両社は2028年に次世代AI半導体を発売した後、毎年新製品を投入する計画だ。
OpenAIは、増加するコンピューティング(演算)需要に主体的に対応するため、「AIフルスタック」(インフラからモデル、サービスまで、AIに関するあらゆる技術を統合する体系)戦略を推進している。エヌビディアなどの半導体メーカーへの依存度を下げ、大規模なコンピューティング資源を自ら確保する方針だ。OpenAIの共同創業者であるグレッグ・ブロックマン社長はこの日、「ハラペーニョによってコンピューティング資源をさらに充実させ、AIをより高速かつ安定的に、より低コストで提供できるようになる」と述べ、「(OpenAIの)長期的なフルスタック・インフラ戦略の一環だ」と説明した。
グーグルやメタなどの競合各社も、自社AI半導体の開発ペースを加速させている。カスタム半導体(ASIC)を活用し、AI利用コストの削減競争に乗り出しているためだ。ブロードコムとTPUを共同開発したグーグルは、メモリー半導体の供給不足を解消するため、米半導体設計企業マーベルと提携し、カスタムメモリー処理装置(MPU)の開発を協議している。メタも今年3月に自社開発したAI半導体4種類を公開した後、来年の量産に向けた準備を進めている。
この記事を読んで…