Veo 3.1 の詳細: ビデオへの参照、ネイティブオーディオ、および高速か品質かの決定

Veo 3.1 の違い

Google が Veo 3 をリリースしたとき、それは印象的でした。しかし、Veo 3.1 は別物です。主なアーキテクチャの変化は、単一のテキストからビデオへのパイプラインから、それぞれが異なるクリエイターワークフロー向けに設計された 3 つの異なるモードを備えたマルチモーダル生成システムに移行することです。最上位のネイティブオーディオ合成と高速/品質階層分割を重ねることで、今日の市場で最も汎用性の高い AI ビデオモデルが得られます。

3 つの生成モードの説明

1.テキスト → ビデオ

クラシックモード。詳細なプロンプトを作成すると、モデルは同期した周囲の音声 (群衆の騒音、風、音楽、足音、すべて自動生成) とともに映画のようなビデオを約 8 秒間レンダリングします。 Veo 3.1 がこの点で優れているのは、その迅速な理解がディレクターの言葉に合わせて微調整されているためです。「ドリーイン」、「ダッチアングル」、「ラックフォーカス」、「ゴールデンアワー」などの用語はすべて正しく解釈されます。

プロのヒント: 一貫して映画のような結果を得るには、プロンプトを [主題 + アクション] + [カメラの移動] + [照明] + [ムード/スタイル] として構成します。

2.画像 → ビデオ (最初のフレーム + オプションの最後のフレーム)

開始画像 (最初のフレーム) をアップロードすると、モデルがそれをアニメーション化して完全なビデオクリップを作成します。オプションで、2 番目の画像を最後のフレームとして指定します。Veo 3.1 は、2 つのフレーム間の滑らかで物理学を意識したトランジションを補間します。これはストーリーボード作成にとって大きな変革です。写真家は、編集ソフトウェアを使用せずに、任意の 2 つの重要なショットをプロレベルのトランジションに変えることができます。

最初のフレームのみ: モデルは、開始フレームの後の動きの方向を創造的に自由に決めることができます。
最初と最後のフレーム: モーションは 2 つの画像を橋渡しするように制限されます。商品の紹介、タイムラプス、劇的なトランジションに最適です。

3.参考→動画（キャラクターロック）

これは、映画制作コミュニティが最も興奮しているモードです。 1 ～ 3 枚の参照画像 (顔写真、衣装の写真、製品の静止画) をアップロードすると、Veo 3.1 はそれらの視覚的アイデンティティを生成されたビデオにロックします。あなたのキャラクターがクリップの途中で別の誰かに変身することはありません。ブランド広告やキャラクター主導の短編映画にとって、これは変革をもたらします。

注: リファレンスモードは現在、高速レベル (65 クレジット) でのみ利用可能です。品質モードのサポートはロードマップにあります。

高速 vs 品質: どちらを選択すべきですか?

両方の層で、ネイティブオーディオを含む約 8 秒のクリップが生成されます。違いは、解像度、テクスチャの詳細、レンダリングの忠実度です。

高速 (65 クレジット): コンセプトの検証、ソーシャルメディアコンテンツ、プロンプトの反復処理に最適です。出力はシャープでクリーンですが、細かいディテール (布地の質感、髪の束、複雑な照明の反射) はわずかに柔らかくなります。 2 分以内にレンダリングされます。
品質 (204 クレジット): 放送グレード。すべてのフレームは、1080p のフルズームでの精査に耐えます。映画のような被写界深度、正確な鏡面ハイライト、複雑な背景の詳細はすべて忠実にレンダリングされます。これは、最終成果物、クライアントのプレゼンテーション、大画面に表示されるコンテンツに使用します。

ネイティブオーディオ: どれくらい優れていますか?

Veo 3.1 のオーディオ生成は、驚くほど状況に応じて行われます。石畳の上に雨が降っているシーンでは、音声によるプロンプトは表示されずに、雨の音、遠くの雷鳴、石の壁からの微妙な反響音が生成されます。話すキャラクターを追加すると、Veo 3.1 は適切なリップシンクと音声テクスチャを生成します (ただし、特定のダイアログにはテキスト音声プロンプトが必要です)。時折時代錯誤的な音や会話がわずかに同期していないなど、完璧ではありませんが、周囲の雰囲気としては、後から追加する AI 生成の音声よりも優れています。

はじめに

3 つの Veo 3.1 モードはすべて、プラットフォームで利用できます。まずはテキスト → ビデオファースト (65 クレジット) でコンセプトを検証し、次に品質に移行して最終的な納品を行います。ブランドやキャラクター主導の作品にはリファレンスモードを試してください。その結果はあなたを驚かせるでしょう。

Veo 3.1 の詳細: ビデオへの参照、ネイティブ オーディオ、および高速か品質かの決定