16日にソウル市内のソウルでKデータアライアンス協約式が開かれた。[写真 KT]
KTは16日、ソウル市内のホテルで「Kデータアライアンス」協約式を開催したと明らかにした。高品質韓国語データ共有と協力を通じ韓国的AI生態系を構築するための協約だ。アライアンスには高麗(コリョ)大学民族文化研究院、斗山(トゥサン)デジタルイノベーション、アイスクリームエデュ、中央日報、韓国教育放送公社(EBS)、ハングル学会などが参加した。KTは各機関が保有するコンテンツを選別してAI学習用データとして精製した後、これをKTが独自開発したモデル「ミドゥム2.0」、マイクロソフト(MS)と協業して開発中のGPTモデルなどに学習させて「韓国的AI」を作る計画だ。
アライアンスの主要目的は韓国語と韓国的文脈を理解するAIを作るために高品質のデータを集めることだ。AIの性能と信頼度はどのようなデータをベースに学習したかにかかっている。オープンAIやグーグルなど海外ビッグテックが作ったAIは主に西欧圏の英語データをベースに学習したため西欧偏向性に対する疑問から自由でなかった。数年間にビッグテックAIの外国語性能が良くなり韓国語もうまく駆使するようになったが、韓国文化や歴史に特化した質問をした時に回答品質が落ちた理由だ。
アライアンスに参加した企業・機関が保有するデータは韓国社会で蓄積された信頼度の高い1次資料という長所がある。EBSが保有するコンテンツは質問・回答形式のデータで、AIモデルの核心機能である推論能力を向上させるのに最適化された資源だ。中央日報は韓国社会を立体的に反映した時宜性あるニュース、ハングル学会は韓国語研究資料などを保有している。これを学習させれば単純にウェブにあるデータだけ学習させた時よりも偏向・有害表現生成のような副作用を減らすことができる。高麗(コリョ)大学民族文化研究院のホ・ウン院長は「韓国的AI発展に向け高い水準の韓国学専門資料をAI学習用データに活用することは必須」と話した。
KTは今後「データ-モデル-サービス」に続く生態系を構築するためにアライアンス規模を拡大する計画だ。開発した韓国的AIモデルを基に実際の生活で使うAIサービスを実現するのが目標だ。KTのオ・スンピル技術革新部門副社長は「Kデータアライアンスが韓国的AIの高度化と実用化を導く核心動力になるよう協力するだろう」と話した。
この記事を読んで…