什么是 Google Veo 3.1
Google Veo 3.1 于 2025 年 10 月 15 日正式发布,由 Google DeepMind 开发,是最新一代 AI 视频生成模型。可将文本或图像转化为具备原生音频同步与自然物理效果的电影级视频。全新功能包括延展、参考图像、帧转视频等,赋予创作更多灵活性。
Select the model you want to generate your video with.
探索 Google Veo 3.1 和 Veo 3.1 极速版——支持文本转视频与图像转视频,搭载原生音频与参考图像、帧转视频等高级功能,让创作更自由、更逼真。
Google Veo 3.1 于 2025 年 10 月 15 日正式发布,由 Google DeepMind 开发,是最新一代 AI 视频生成模型。可将文本或图像转化为具备原生音频同步与自然物理效果的电影级视频。全新功能包括延展、参考图像、帧转视频等,赋予创作更多灵活性。
Google Veo 3.1 采用基于积分的计费方式。订阅 Google AI Pro(月费 $19.99)可获得 1,000 积分,Google AI Ultra(月费 $249.99)则包含 25,000 积分。每次使用 Veo 3.1 极速版消耗约 20 积分,高清版消耗约 100 积分。
Google Flow 是一个创意平台,用户可以在其中直接生成和编辑 Veo 3.1 视频。Gemini 应用提供多模态智能支持,并与 Veo 3.1 AI 模型连接,而 Vertex AI 作为支持后端基础设施,为开发者提供 Veo 3.1 API 访问权限。
最多可以使用三张参考图像来指导场景中的角色、物体和风格。Flow Veo 3.1 的‘图像成视频’功能会将这些视觉参考融合成统一镜头,并且现已增强同步音频和更丰富的纹理细节。
提供起始和结束图像,Veo 3.1 AI 视频生成器将生成一个无缝连接这两张图像的视频。此功能能够自然地过渡帧之间的光照、运动和音频,适合制作流畅的叙事过渡。
通过‘延展’功能,你可以将一个 8 秒钟的片段扩展为一个无缝的连续序列,最长可达一分钟或更长。每个新片段自然延续上一帧的运动、光照和色调,适合长镜头或平滑的镜头运动。
每个细节——从运动和光照到面料褶皱和表面反射——都经过更真实的物理模拟。升级后的 Veo 3.1 捕捉真实质感与动态运动,带来更接近现实电影拍摄的真实感。
输入简短的文本提示或上传图片,描述您希望看到的场景——例如“雪山无人机航拍”——或者直接使用现有图片生成视频。Veo 3.1 AI 视频生成器能理解文本和图像输入,生成逼真的场景。
提交后,Google Veo 3.1 模型开始处理您的提示。其先进的 DeepMind 引擎会分析运动、光照和物理效果,在几分钟内生成流畅、高清的文本转视频或图像转视频片段。
视频准备好后,您可以立即在浏览器中预览。如果满意,您可以下载 Veo 3.1 视频并直接分享到 TikTok、Instagram 或 YouTube。您还可以修改提示词,重新生成视频,进一步调整动作或风格。
Google Veo 3,由 DeepMind 开发,是首个具备本地音频、精准口型同步和先进物理模拟的 AI 视频模型,创造了 AI 视频生成的新标准。基于这一基础,Veo 3.1 预计将进一步提升音质、一致性、物理精度和创意控制,使 AI 视频更加接近电影级的真实感。相比之下,OpenAI Sora 2 聚焦于高度真实且富有创意的故事讲述,提供表现力丰富的客串式场景——但目前需要邀请码才能使用。
| 主要功能 | Google Veo 3 | Google Veo 3.1 | OpenAI Sora 2 |
|---|---|---|---|
| Release Date | Released in May 2025 via Gemini App and Flow | Released in October 2025 via Gemini App and Flow | Released in Sept 2025; still requires a Sora invite code |
| Video length | Around 8 seconds per clip | 8 seconds by default; can Extend up to one minute in Google Flow | 10 s (standard), 15 s (Sora 2 Pro) |
| Control tools | Text-to-Video, Image-to-Video | Adds multi-reference images, Frames-to-Video, and Extend for longer continuous shots | Text-to-Video, Image-to-Video, Cameo feature |
| Audio quality | Native audio with basic sync | Richer multi-channel audio, better mixing and lip-sync | Natural voice and scene sound integration |
| Physics & realism | Strong rigid/fluid simulation base | Improved textures and motion physics, though complex character actions remain limited compared to Sora 2 Pro | More consistent scene physics and cinematic lighting |
使用 Veo 3.1 AI 视频生成器,任何人都可以轻松制作热门视频,无需拍摄或编辑经验。只需输入文本提示,如“霓虹灯下的未来街舞表演”,Veo 3.1 会迅速生成流畅、动感十足的本地音效视频。您可以快速跟上热门话题或模因,生成超现实视觉效果,并在几分钟内发布——通过 Google Veo 3.1 免费在线,迅速将创意转化为病毒式内容。
使用 Veo 3.1 的文本转视频功能,释放您的创意。描述一个短小的动画场景,例如‘一个小机器人在废弃城市中发现一朵花’,Veo 3.1 会根据您的描述构建连贯的角色、情感和场景转换。您无需具备动画或电影制作经验;Veo 3.1 会自动处理灯光、动作和镜头角度,让您专注于故事创作。
对于小品牌或独立商家,Veo 3.1 让创建高影响力的产品视频变得更加轻松。上传一张图片,比如一款智能手表放在大理石桌面上,图片转视频功能会为您加入电影级旋转、反射和深度效果。得益于 Veo 3.1 强大的光照和物理模拟,您的产品看起来更加高端、专业,无需工作室或后期制作。
通过持续优化与迭代,引入更多智能功能,Veo 3.1 帮助教师、YouTuber 和知识创作者轻松将复杂主题转化为简洁的视觉短片。例如输入‘人类心脏如何泵血——横截面动画’,Veo 3.1 能在几分钟内生成清晰、动态的解说视频。Google Veo 3.1 帮助教育内容变得更具视觉吸引力、互动性更强,且便于在各大学习平台上分享。