クラシックな家族写真を生き生きとした動く肖像画に変換するMyHeritageアプリで話題となったテクノロジーを開発した企業が、新たな技術を発表:静止画を超リアルな動画に変換し、任意の言葉を話させることが可能に。
D-IDの「スピーキングポートレート」は、ここ数年話題となった「ディープフェイク」に似ていますが、基盤となる技術は全く異なり、基本機能の使用に特別なトレーニングは必要ありません。
2018年のTechCrunch Battlefieldで顔認識技術の攪乱という全く異なる目的でデビューしたD-IDは、TechCrunch Disrupt 2021で新製品「スピーキング・ポートレート」を初公開しました。同社は、新技術を使用して多言語対応のテレビ司会者を作成し、様々な感情を表現できるようにすること、カスタマーサポートのためのバーチャルチャットボットのキャラクターを作成すること、プロフェッショナルなトレーニングコースを開発すること、そしてインタラクティブな会話型のビデオ広告キオスクを作成することなど、いくつかの使用例を紹介しました。
この新製品とMyHeritageとの提携(同社アプリがAppleのApp Storeチャートで一時首位を獲得)は、当初の事業方針から大きく転換したものです。昨年5月まで、D-IDは従来のアプローチに基づく資金調達を行っていましたが、2月にMyHeritageとの提携を開始し、その後GoodTrustとの同様の契約、さらにWarner Bros.とヒュー・ジャックマン主演映画「Reminiscence」でファンがトレーラーに自分を挿入できるという注目を集める提携を実現しました。D-IDのCEO兼共同創業者のGil Perryによると、この方向転換は、この種のアプリケーションに大きな市場が存在することが明らかだったためだと説明しています。Warner Bros.のような大手顧客の獲得や、比較的無名のブランドからのApp Store首位アプリの実現は、この判断の正しさを裏付けているようです。
他社と比べると大きな方向転換に見えるかもしれませんが、技術的な観点からすると、写真に命を吹き込むという新しい焦点は、個人特定防止ソフトウェアから大きくかけ離れてはいません。共同創業者兼CEOのGil Perry氏によると、この種のアプリケーションには明らかに大きな市場があったため、この新しい方向性を選択したとのことです。
Warner Bros.のような大手企業との取引や、比較的知名度の低いブランドのアプリがApp Storeで首位を獲得したことは、この判断の正しさを裏付けているといえます。「スピーキング・ポートレート」は、大小様々な顧客をターゲットとしており、元となる画像から録音された音声やテキストを組み合わせてフルHD動画を生成することが可能です。現在は英語、スペイン語、日本語に対応しており、今後顧客の要望に応じて他の言語にも対応していく予定です。
「シングルポートレート」では、1枚の静止画から作成が可能で、頭部はアニメーション化されますが、他の部分は静止したままとなります。この場合、写真に含まれる既存の背景のみでの使用となります。
より本物に近いリアリティを求める場合は、「トレーニドキャラクター」オプションが用意されています。このオプションでは、会社が提供するガイドラインに従って10分間のトレーニング動画を提出する必要があります。カスタム背景への入れ替えが可能で、キャラクターの体や手に対してプリセットのアニメーションオプションを使用できるという利点があります。
トレーニドキャラクター方式で生成したニュースキャスターの「スピーキング・ポートレート」の例をご覧ください。その驚くべきリアルさをご確認いただけます:
Perry氏がDisruptで披露したデモは、自身の子供時代の写真から作成されました。写真は人間の操り手の表情に合わせてマッピングされ、現在の自分と若い頃の自分との対話を演出しました。話者の表情がアニメーション化された写真にどのように反映されているか、以下の動画でご覧いただけます:
1枚の写真から、望む台詞を自然に話す実写のような動画を作成できる技術は、確かに懸念を抱かせるものです。すでにディープフェイクの倫理性について広範な議論が行われており、業界ではAIが生成した現実的ながら人工的なコンテンツを特定・追跡しようとする取り組みも進められています。
Perry氏はDisruptで次のように述べています。「D-IDは本技術が良い目的のためだけに使用されることを確実にしたいと考えています。そのため、10月末にパートナー企業とともに、スピーキング・ポートレートのような技術の使用における『透明性と同意』へのコミットメントを示す誓約を発表する予定です。」このコミットメントの目的は、「ユーザーが見ているコンテンツについて誤解することなく、また関係者全員の同意を確実に得る」ことにあります。
D-IDは利用規約や技術の悪用に対する公式な立場を通じて保証を提供しようとしていますが、Perry氏は「私たちだけでは実現できません」と述べ、技術の乱用を防ぐため、エコシステムの他の参加者との協力を呼びかけています。