2025年の会話型「生成AI」はどうなる? 知っておきたい3つのポイント
2025.1.16 Interview

ChatGPTをはじめ、ビジネスの場で生成AIは欠かせない存在となっています。会話型AI構築プラットフォームを運営する「miibo」が12月中旬に開催したイベント「miibo AI Conference 2024」では、生成AI活用の第一人者として知られる深津貴之さんと、起業家、投資家の肩書きを持ち京都芸術大学教授として学生のAI活用を推進している小笠原治さんとの間で活発な意見が交わされました。この講演内容から、生成AIの現在地とこれからについて考えるヒントを探ってみましょう。
Slack上で1年間、AIとバレずに働く「AI社員」
「2025年を考えるうえで、AGIの話ははずせない」と小笠原さんは言います。AGIとは、Artificial General Intelligence(人工汎用知能)の略で、人間のような知能や能力を持ち、プログラムされた特定の状況以外のさまざまな課題、タスクを解決できる人工知能を指します。
一方で、現在普及しつつあるChatGPTは、与えられた範囲内でのみタスクをこなす人工知能。AGI実現をゴールとすると、始まりの部分にすぎません。AGIは、「いつできるのか?」「何ができるのか?」「人間を超えるのはいつか?」などについて、IT業界を牽引する世界中のリーダーたちはさまざまな視点で予測しています。AGIの定義も現時点ではあいまいです。小笠原さんは、AGIの定義を次のように考えます。
「AGIは長いスパンで考えると、人間を超える知能としてイメージされると思います。実際は、いくつかのエージェント(自分の置かれた環境や状況を理解し、最適な行動を選択するような存在)を束ねるシステムになるのではないでしょうか。最初は、単機能のエージェントをいくつか組み合わせることで人間よりいい感じに1つ仕事ができたという時点でAGIと言っていいと個人的には思っています」(小笠原さん)
一方で深津さんは、「一般的あるいは全般的な性能が、人間の性能を超えているのをどう証明するか」がAGIの定義に関わってくると考えます。
「個人的に、これができたらAGIと言っていいのではないかと考えているのは、ビジネス用チャットツールであるSlack上で労働者として働いて、1年間人工知能であることがバレずに仕事ができたら、それはAGIと言っていいと考えます。例えば、去年入社して総務課に配属された××さんって実はAIなんだって、と1年後の忘年会で社員たちにバレるというような感じになったらそれはAGIと言っていい。法規制などを考えると、現実的には開示義務などが発生するのかもしれませんが、AGIはそこを目指してほしいですね」(深津さん)
「マルチモーダルAIとデバイス」はどうなっていくか
ここで話は、「マルチモーダル」に移ります。AIの文脈でマルチモーダルというのは、映像と音声、映像とテキストなど異なる種類の情報をまとめて扱うAIを指します。2025年、マルチモーダルAIとそれに対応するデバイスはどうなっていくと考えられるのか、まずは小笠原さんが口火を切りました。
「僕は、人間の顔や体表面温度といった生態情報を読むのもすでにマルチモーダルだと思っています。投資先で医療機器認証プログラムをつくっているところがあるのですが、24時間血圧や心拍の情報が取れます。そういった情報をすべてAIに渡すことで、今までわからなかったことがわかるようになってほしいんですよ。2025年、コンピュータビジョン(コンピュータが画像や動画、そのほかの視覚データから自動的に意味のある情報を抽出し処理する技術で、人工知能の一分野)は飛躍的な進歩を遂げると予測していて、マルチモーダルはまず、わかりやすい画像認識から精度が上がっていくような気がしますね」(小笠原さん)
深津さんが続きます。
「いま作られているマルチモーダルは、視覚と聴覚とあと何かと何か、人間が持っているセンサーのいくつかを移植したぐらいのものですよね。本来は、人間が持っていないセンサーを積むほうが性能はよくなると思うんですよ。振動、超音波、赤外線、湿度などをいっぱい入れたマルチモーダルを作ると、人間からみると超直感に思えるような、ものすごい判断にみえるようなことが、このセンサーとこのセンサーを組み合わせればわかるんですよといった事例が増えてくる。
人間よりセンサーの数を増やし、多様化してぶちこむのがいちばん手っ取り早いと思います。学習データが足りないという問題も、文字データが足りないというだけ。こういった形でデータアーギュメンテーション(学習データの拡張・水増し)すれば、世の中にはまだまだ未活用のデータがいっぱいある」(深津さん)
実用フェーズでの日本企業の戦い方
データの収集や活用を考えるとき、どこまでデータを取られてもいいのか、どこまでのデータをAIに渡しても大丈夫なのか、ぼんやりとした不安が出てくる。ここは、進歩をさまたげる障壁にならないだろうか。深津さんはそういった漠然としたものではなく、より現実的な障壁について語ります。
「ビジネス上でのいちばん大きな課題は、人工知能の開発を行うOpenAI(オープンAI)などが超音波をマルチモーダルに突っ込んだとしても、ユーザーである私たちが超音波を集めるデバイスを持っていないという点にあります。GoogleやAppleといったビッグテックや、オープンAIでもソニーでもいいので、超センサー増し増し携帯電話か、超センサー増し増しホームデバイスをまずつくってくれるといいですよね。そこから超学習をして、AIを出すという流れだとすごく楽しい世界がやってくるような気がしています」(深津さん)
実用フェーズに入ったら、日本企業はどのように戦っていけばいいのでしょうか。深津さんは「超高度なAIは資本とデータの物量で勝ち負けが決まってしまうので、その土俵には上がらないほうがいい」と考えています。大事なのは、「AIでリプレイスできないところに、どうやって価値をつくるのかということ。2025年は、何を使ってAIの外側に陣地をつくるかを考えるときだと思います」(深津さん)。
普遍的な領域を攻めるのが、日本企業の戦い方だと話す深津さん。小笠原さんも共鳴し「日本にも商機はある」と強調します。
「日本企業が開発した国産モデルというとき、話はLLM(Large Language Models/大規模言語モデル)のことになりますよね。世界人口に占める日本語を話す割合は2%弱。日本語のデータが不足していることが問題となっていますが、当然です。ただ、言語だけでなく、映像や視覚、聴覚、血圧や心拍などの生態情報といったマルチモーダル的に、さまざまなデータで学習を実行できたら日本に商機はある。もちろん、言語は文化のベースとしてあるので、そういう意味ではLLMはやらないという選択肢はないと考えています」(小笠原さん)
Ranking ランキング
-
「おカネをもらう=プロフェッショナル」と考える人が見落としている重要な視点
2024.6.17 Interview
-
さすがにもう変わらないと、日本はまずい。世界の高度技能者から見て日本は「アジアで最も働きたくない国」。
2018.4.25 Interview
-
評価は時間ではなくジョブ・ディスクリプション+インパクト。働き方改革を本気で実践する為に変えるべき事。
2018.4.23 Interview
-
時代は刻々と変化している。世の中の力が“個人”へ移りつつある今、昨日の正解が今日は不正解かもしれない。
2018.4.2 Interview
-
働き方改革の本質は、杓子定規の残業減ではなく、個人に合わせて雇用側も変化し選択できる社会になる事。
2018.3.30 Interview