首个具备 思考能力的图像模型
Image Arena 榜单第一,领先 242 分。接近完美的文字渲染、逼真图像生成、多图一致性。

提示词
一份中餐厅菜单,包含菜品名称、价格和描述,简约设计风格,暖色调灯光效果...
OpenAI 最先进的图像生成模型,具备思考能力、接近完美的文字渲染和前所未有的逼真度。
多语言文字准确率达 99%,支持中文、日文、韩文、印地语、孟加拉语。菜单、海报、UI 截图可直接使用,无需人工修正。
首个具备推理能力的图像模型。可联网获取实时信息,自我核查输出结果,单次提示词生成最多 8 张风格一致的系列图片。
生成与真实照片难以区分的图像。社交媒体截图、产品图、直播画面——一句话提示词即可生成。
在多张生成图片中保持角色和风格的一致性。支持最多 6 张参考图,精确控制风格和构图。
灵活的参数配置,覆盖所有创作场景。
可选 1K(默认)、2K 和 4K 质量。2K/4K 自动升级为 Pro 模型。
从社交媒体到超宽银幕格式,生成完美适配任何场景的图像。
文生图从零创作,图生图基于参考图编辑。
探索 OpenAI 最强图像模型能做什么。

一份墨西哥餐厅菜单,包含正宗菜品和美元价格,暖色调专业排版设计...

一张 TikTok 美妆教程视频截图,展示护肤步骤,逼真的界面元素...

一张科技大会海报,包含活动详情、嘉宾、场地信息,现代简约设计风格,粗体排版...

一整页彩色漫画,讲述一个机器人学习画画的故事,日漫风格,包含中文对话...
import requests import time API_BASE = "https://api.apipod.ai/v1" headers = {"Authorization": "Bearer YOUR_KEY"} # 1. Submit generation task resp = requests.post( "https://api.apipod.ai/v1/images/generations", headers=headers, json={ "model": "gpt-image-2", "prompt": "A professional menu design...", "quality": "1K", "aspect_ratio": "1:1" } ) task_id = resp.json()["data"]["task_id"] # 2. Poll status until completed while True: res = requests.get( f"https://api.apipod.ai/v1/images/status/{task_id}", headers=headers ).json() if res["data"]["status"] == "completed": print(res["data"]["result"][0]) break time.sleep(2)
关于 GPT Image 2 的一切。
GPT Image 2(官方名称 ChatGPT Images 2.0)是 OpenAI 最先进的图像生成模型。它是首个具备思考能力的图像模型,在 Image Arena 上以创纪录的 242 分优势排名第一。文字渲染准确率接近 99%,支持多种语言。
思考模式让模型像大语言模型一样对图像生成进行推理。它可以联网搜索实时信息,自我核查输出结果的准确性,并从单个提示词生成最多 8 张视觉一致的图片。该模式面向 Plus 及以上订阅用户开放。
GPT Image 2 的文字渲染准确率达到约 99%,相比上一代的 90-95% 有显著提升。支持中文、日文、韩文、印地语、孟加拉语等多种语言。菜单、海报、UI 截图等文字密集型输出可直接使用,无需人工修正。
向 /v1/images/generations 发送 POST 请求,携带 API Key、模型名 'gpt-image-2' 和提示词。API 返回 task_id,通过 /v1/images/status/{task_id} 轮询直到状态变为 'completed' 即可获取生成图片 URL。支持文生图和图生图两种模式,可配置质量(1K/2K/4K)和 11 种宽高比。
可以。通过 API 生成的所有图片均拥有完整的商业使用权。您拥有所创建内容的使用权,可用于广告、产品设计、营销物料等商业用途。
按质量等级和使用量计费。1K 质量为基础定价,2K 和 4K 质量自动使用 Pro 变体。具体价格请查看定价页面,企业客户可享批量折扣。