インスタグラム

LET’s MEET for Excitement!|バーチャルヒューマンについて考えよう!

日進月歩で加速度をつけて進歩する現代。その中でも最近特に気になる「バーチャルヒューマン」について、AIや3DCGの技術を使い、ダイナミックな世界シミュレーションの構築を目指すWarps, Inc.のプロデューサーYAKATAさんに「バーチャルヒューマン」についてお話を伺い、実際に構築・生成して頂きました!

(編集:A 以下A)
今回は、LET’s MEET at PROJECT の新しい企画「LET’s MEET for Excitement!〜ワクワクすることに会いましょう!〜」にご登場頂きありがとうございます。
YAKATAさんにとって、現在はどんな時代だと思いますか?

YAKATA : 現在は、技術が急速に変化していく時代だと思います。
つい先週までできなかったことが、今週にはできるようになっていく。
ある技術を開発していたら、すぐにそれを覆すような新しい論文が出てきたりする。

そんな現状をみて『産業革命』と後に呼ばれる時代は、まさにこのような状況だったのだろうと想像できます。
むしろ、現在のほうがその変化のスピードはさらに加速していると思います。

A : その変化をどう受け止めていますか?

YAKATA : 時としてその急速な変化は社会に不安をもたらしますが、そんなとき私は危機感より好奇心を働かせるようにしています。

A : 今回はその好奇心から生まれた「バーチャルヒューマン」について、現在の技術を使ってバーチャルヒューマンの構築を体験させて頂けるそうですね!

YAKATA : はい。「バーチャルヒューマン」の構築は様々な側面からアプローチできますが、今回は最も視覚的にわかりやすい動画生成を行います。
まずは「バーチャルヒューマン」の見た目となる画像を用意します。
この画像は、実在する人物の写真でもいいですし、実在しない人物を画像生成AIを用いて仮想的に生成しても構いません。
今回は画像生成AIを用いて、私の方で分かりやすく「会社の広報担当」をイメージした人物の画像を生成しました。

動画生成には、『Gen Studio』というシステムを利用します。
『Gen Studio』は、入力したテキストを発話させ、その発話に応じて画像をアニメーションさせることができます。
発話の音声は独自にカスタマイズしたボイスが使え、カスタマイズするのに必要なものはわずか10秒程度のナレーションの音声素材です。
そうすることで、以下のような動画が数十秒で作成できます。

テキストを入力するだけで、仮想的な存在が自然な音声で喋っている様子を簡単に作成できます。
一般的な動画素材とは異なり、画像・音声・動画はすべて仮想的なものなので、実際に撮影したり撮影のためのスケジュールを調整したりする必要はありません。
一度画像を用意すれば、あとは喋らせたいテキストを入力するだけです。

A : これとてもスゴイですね!この女性を自分の会社の広報や受付、秘書にできるということですよね!
何よりテキストを打ち込むだけで、毎回の撮影が必要ないというのは、時間やコストパフォーマンスが最高ですね。

YAKATA : もちろん、現段階では、できることは限られますが、そういうことになります!
例えば、こちらの動画をさらに実用的な形式に応用してみます。
今回はあるキャンペーンの告知をするユースケースを想定し、以下のようなバナーを作成しました。
先ほどの人物画像とこのような背景画像を合成した画像を利用して再度動画を生成してみます。

このように、キャンペーンを告知する動画を撮影の手間なしに作成することができました。

A : なるほど!この動画は、X(旧Twitter)やYoutube,TikTok,Instagramなどの各種プラットフォーム・SNSで活用できるのでしょうか?

YAKATA : はい、普通の動画をアップする要領でできます。今回は実用的なユースケースの1つとして上記の例を紹介させていただきました。

A : ところで、バーチャルヒューマンの実現というからにはまだまだできることがありそうですね?

YAKATA : 今回のケースでは動画や音声は仮想的に生成されましたが、その内容は人が入力した文章をそのまま出力しただけにすぎません。
また、「バーチャルヒューマン」には知性がなく、人間とインタラクティブにアクションを起こすこともありません。
次回は「バーチャルヒューマン」に知性を与え、人間の代わりとなりうるような存在を実現することを目指したいと思っています。

A : それはとてもワクワクしますね!また進捗があれば是非お話を聴かせて下さい。
今日はありがとうございました。


Profile
YAKATA

Warps, Inc.(ワープス株式会社)は、『Simulating dynamic worlds with artificial intelligence.』をミッションに掲げるスタートアップです。
AIや3DCGの技術を使い、ダイナミックな世界シミュレーションの構築を目指しています。
そこで培った技術やノウハウを活かし、業務効率化から新しいゲーム体験の創出まで、人々の生活を豊かにするAIの社会実装に向けて、日々取り組んでいます。

https://corp.warps.gg