動画生成AIのテキストプロンプトへの忠実性の調査
ChatGPT Sora・Sora 2・Google Veo 3.1・Runway Gen-4の比較
DOI:
https://doi.org/10.51094/jxiv.1532キーワード:
動画生成AI、 Sora、 Sora 2、 Veo 3.1、 Gen-4、 テキストプロンプト抄録
本稿では,動画生成AIがテキストプロンプトに即して動画を生成する能力を調査することで,映像制作者が動画生成AIを選定する際の参考となる知見の提供を目的とした.各動画生成AIモデルがテキストプロンプトの内容に即して動画を生成する能力を比較するために,Movie Gen Video Benchを参考にした12種類のテキストプロンプトを用いて動画を生成した.生成された動画に対して,筆者らによる評価および考察を行った.本研究結果は,現時点における最新の動画生成AIモデルを横断的に比較し,文章や画像等の静的な情報だけでなく,生成された動画を参照しながらの比較検討を可能にしている点において,有用な知見を提供していると考える.今後は,補間動画の生成能力の評価研究やプロンプトへの忠実性の客観的な評価研究等を実施することが望まれる.
利益相反に関する開示
著者らには,本研究に関連して開示すべき利益相反関係はありません.ダウンロード *前日までの集計結果を表示します
引用文献
TechStock². “Sora vs Veo 3 vs Runway Gen-4: Which AI Video Generator Is Taking Over 2025?”. https://ts2.tech/en/sora-vs-veo-3-vs-runway-gen-4-which-ai-video-generator-is-taking-over-2025/, (参照 2025-12-08).
OpenAI. “Sora”. https://openai.com/ja-JP/sora/, (参照 2025-12-08).
Google. “Turn your photos into videos in Gemini”. https://blog.google/products/gemini/photo-to-video/, (参照 2025-12-08).
Runway AI. “Introducing Runway Gen-4”. https://runwayml.com/research/introducing-runway-gen-4/, (参照 2025-12-08).
Runway AI. “AIFF 2025”. https://aiff.runwayml.com/, (参照 2025-12-08).
Polyak, A.; Zohar, A.; et al. Movie Gen: A Cast of Media Foundation Models. arXiv, 2024, arXiv:2410.13720.
Google. “Google DeepMind”. https://deepmind.google/models/veo/evals/, (参照 2025-12-08).
Huang, Z.; He, Y.; et al. VBench: Comprehensive Benchmark Suite for Video Generative Models. arXiv, 2023, arXiv:2311.17982.
Wiedemer, T.; Li, Y.; et al. Video Models are Zero-Shot Learners and Reasoners. arXiv, 2025, arXiv:2509.20328.
Wang, X.; Zhou, B.; et al. Generative Inbetweening: Adapting Image-to-Video Models for Keyframe Interpolation. arXiv, 2024, arXiv:2408.15239.
Zheng, D.; Huang, Z.; et al. VBench-2.0: Advancing Video Generation Benchmark Suite for Intrinsic Faithfulness. arXiv, 2025, arXiv:2503.21755.
Ye, Z.; Huang, H.; et al. StyleMaster: Stylize Your Video with Artistic Generation and Translation. arXiv, 2024, arXiv:2412.07744.
ダウンロード
公開済
投稿日時: 2025-12-23 08:07:20 UTC
公開日時: 2026-01-14 01:13:33 UTC
ライセンス
Copyright(c)2026
須藤, 信
向井, 美樹
この作品は、Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International Licenseの下でライセンスされています。
