話題の生成AI XRとの融合で起こることとは?

現在、世間に最も大きな話題を提供しているデジタル技術として「ChatGPT」をはじめとした生成AIが挙げられます。様々な技術との組み合わせにより生活・ビジネスを広範に変革する可能性を持つだけに、XRとの関係も見逃せません。そこで今回は生成AIとXRの融合の先にある未来の姿について考えてみたいと思います。
テック企業の主導権争い続く

生成AIの開発競争は激化しています。会話型AIでは、OpenAIのChatGPTが出資者でもあるMicrosoftのBingへの組み込みなどで先行している感がありますが、Googleも大規模言語モデル「LaMDA」による会話型AI「Bard」を投入し、関連アプリケーションの開発で評価を高めています。
またMetaはオープンソースの生成AI「Llama 2」を提供しMicrosoftと提携するほか、オープンな開発環境でのイノベーションを促しています。MetaはTwitterの対抗馬であるThread、Instagram、そしてFacebookとSNSでの厚い支持があるだけに、多くの開発者とユーザが参加したAIへの独自のアプローチに期待が集まります。
最近、Appleも生成AIの開発を進めているとの報道がなされました。先日のMRヘッドセットVision Proの発表に続く動きであり、XRとの融合にも話題を提供してくれそうです。
自動で眼前に三次元世界が
XRと関連する技術では、言語モデルと画像生成の組み合わせに要注目です。前出のOpenAIは、画像やテキストから2Dおよび3Dモデルを自動生成するAI「Shap-E」を発表。またベンチャーを含めたテック企業各社が、言語プロンプトによる画像生成サービスを開発、展開しています。
言語で指定したイメージをもとに画像、とくに3Dを制作する技術のインパクトは極めて大きいものといえます。プロダクトデザイン、設計、建設や建築などの分野で、詳細なプロンプトの入力により完成物に近い三次元イメージが自動生成できるようになれば、多くのビジネスに変革をもたらすことになるでしょう。ゲームやアニメーションなどコンテンツ制作の現場では、プロット作成をはじめキャラクターデザイン、作画などを同時に生成してしまうことも、技術的に可能となるかもしれません。
XRゴーグルで観る360度の仮想世界を生成することも不可能ではなくなります。これはあくまで想像ですが、例えば「中世ヨーロッパの雰囲気の街並み」や、「近未来的なデザインの高層ビル街」といった言葉を指定し、短時間でメタバース空間を生成。さらにその中に没入し自由に歩き回れる。そんな未来像も見えてきます。
メタバース内で出会う「人間」も自動生成されるかもしれません。こちらの語り掛けに対し、言葉のほか、しぐさや表情など非言語表現を含めたリアルな反応を示すアバターが、実は「中の人」の操作なしで動いている、といったことも考えられます。ヘッドセットのインターフェースで入力されたユーザの手の動きや目線などをAIで分析することで、まるでアバターと心が通じているかのような精度の高いコミュニケーションが可能となるでしょう。
普及にクリアすべき課題は

生成AIによるXRの未来像を想像するのはとても楽しいものですが、未解決の課題もあります。
一つは信頼性。すでに生成AIで作成した不確かな情報によるトラブルは大小さまざまに発生しています。米国では、弁護士が裁判で生成AIによって書かれた存在しない判例を引用し問題となりました。XRは文字情報だけではなく、映像や音声などの情報が合わせて発信されるため、負のインパクトはさらに大きくなりえます。人がメタバース内に没入し、自動生成されたアバターと信ぴょう性の低い話を延々としている光景を想像すると、その光景がリアルであればあるほど若干空恐ろしいものがあります。
もう一つが著作権です。米国の脚本家のストライキでも争点となっているAIコンテンツの権利関係もまた、様々な表現の要素が組み合わされXRでは複雑になります。生成AIが作り出した創造物が誰のものなのか、誰がその内容に責任を持つのか、世界的な合意形成が待たれるところです。
生成AIを適切に実装するために
様々な課題を抱えつつも、生成AI技術がXRの世界に広がっていくことは既定路線とも言え、大きな可能性を感じさせてくれることは確かです。生成AIを過信することも、過度に恐れることもなく、機能を正しく知ったうえで自身の生活やビジネスにおいてできること、その際に人間がしなくてはならないことを慎重かつ前向きに検討していくことが重要になってくるのではないでしょうか。