VEO3.1 Fast 模式支持的多图参考(最多 3 张),来塑造角色设计、灯光风格或色调,确保生成的视频在每一镜头中保持视觉一致性。
Veo 3.1 高质量模型是谷歌最先进的视频生成模型,创建高质量、8秒时长且带有声音的视频。
Veo 3.1 Fast 快速模型是谷歌先进的视频生成模型,将创意想法转化为引人入胜的视频叙事。Veo 能够根据文本提示生成带音频的视频,或者在文本指导下为图像制作动画。
提示词示例
赛博朋克风格的未来都市,无人机俯瞰视角,霓虹灯光闪烁,8K 画质...
从快速原型到精品渲染,Veo 3.1 都能胜任。
AI 视频的天花板。先进扩散采样技术加持,输出细腻纹理与真实物理效果。
速度提升 5 倍。专为短视频、实时互动和创意探索打造,核心能力不打折。
告别角色走形。上传最多 3 张参考图,锁定人物、风格和场景,多镜头也能保持一致。
Veo 3.1 是首个真正做到音画同步的视频模型。无论是引擎轰鸣还是落叶沙沙,都能精准匹配每一帧画面。
对白与表情自然匹配
声音跟随镜头移动
AI 视频最头疼的角色走形问题,Veo 3.1 用多图参考彻底解决。上传角色、风格、场景参考图,剩下的交给模型。



把 Veo 3.1 嵌入你的产品——SaaS、游戏引擎、创意工具都行。底层能力我们搞定,你专心做产品。
# Initializing Veo 3.1 API payload = { "model": "veo-3-1-quality", # or "veo-3-1-fast" "prompt": "Cinematic landscape, 8k", "image_urls": [ "https://cdn.ai/char_1.jpg", "https://cdn.ai/style.jpg" ], "aspect_ratio": "16:9" } response = requests.post( "https://api.apipod.ai/v1/videos/generations", json=payload, headers={"Authorization": "Bearer Key"} )