Gemini Omni 参考生视频模型支持基于 1-5 张参考图片来生成视频。
Gemini Omni Extend 模型支持视频转视频(续写或编辑)功能,可附加1至5张参考图片。
Google Gemini Omni 图生视频模型支持参考首帧、首尾帧以及三张图像进行视频融合。
Google Gemini Omni 文生视频版本模型。
让 Gemini 的推理能力与创造力相遇,一个模型搞定 文生视频, 真实物理, 对话式编辑.
提示词示例
弹珠在连锁机关轨道上飞速滚动,一镜到底,物理效果精准...
Gemini Omni 融合 Gemini 的世界理解与生成式媒体,覆盖从创意到成片的完整链路。
用自然语言描述任意场景,模型自动生成连贯运动、精准物理与电影级细节的画面。
用首帧(可选尾帧)让静态图片动起来。锁定起止状态,模型补全自然可信的运动过程。
上传最多 5 张参考图,锁定角色、风格与场景。每个镜头都保持完美一致性。
延续已有片段,或一步步编辑它。每一次调整都建立在上一次之上,全程保持场景连贯。
把 Gemini Omni 变成实用工具的能力——而不只是演示。
用自然语言一步步精修场景——换环境、调动作、替换对象、转镜头或加特效,同时保持原有场景连贯。无需每次重写整段提示词。
Gemini Omni 把视觉创作与物理、历史、生物、文化和叙事逻辑打通——场景、对象和动作都按应有的方式呈现,成片更有意图,而非随机。
把文本、最多 5 张参考图和源视频融合为一个可控的创作过程。从真实素材出发,而非空白提示词,并让主体与风格在每个镜头里保持一致。
让角色的存在感、表情与演绎融入完整场景——而非单薄的视觉图层。非常适合演讲片段、角色叙事与互动媒体。
把 Gemini Omni 嵌入你的 SaaS、游戏引擎或创意工具。异步生成 + 任务轮询,让大规模负载稳稳跑起来。
# Gemini Omni 视频生成 payload = { "model": "gemini-omni-t2v", # or -i2v / -r2v / -extend "prompt": "弹珠在连锁机关轨道上飞速滚动,一镜到底", "aspect_ratio": "16:9" } response = requests.post( "https://api.apipod.ai/v1/videos/generations", json=payload, headers={"Authorization": "Bearer Key"} )
在 Gemini Omni 系列上规划生产级负载所需的一切。
模型变体
t2v · i2v · r2v · extend
一个模型,四种生成模式
单片时长
10 秒
用续写模式延长成片
分辨率
720p · 1080p
高清与全高清输出
画面比例
16:9 · 9:16 · 1:1
横屏、竖屏与方形
参考图数量
最多 5 张
用于 r2v 与 extend 模式
提示词长度
4,000 字符
支持丰富细腻的描述