GPT Image 2

2 个可用模型

提供商: OPENAI

更新于: 最近

GPT Image 2 是 OpenAI 的新一代图像模型，具备更强的逼真度、更精细的图像编辑能力、更清晰的文本渲染以及更出色的产品效果图表现。它专为更高阶的视觉工作流打造，不仅突破了基础文生图的局限，更能全面满足高质量的创意、商业及专业设计级应用需求。

可用模型

GPT Image 2 图生图

GPT Image 2 图生图版本。

GPT Image 2 文生图

GPT Image 2 文生图版本模型。

OpenAI 最强图像模型

GPT-Image
2

首个具备思考能力的图像模型

Image Arena 榜单第一，领先 242 分。接近完美的文字渲染、逼真图像生成、多图一致性。

查看文档

99%

文字渲染准确率

最高分辨率

+242

竞技场领先分数

提示词

一份中餐厅菜单，包含菜品名称、价格和描述，简约设计风格，暖色调灯光效果...

为什么选 GPT Image 2？

OpenAI 最先进的图像生成模型，具备思考能力、接近完美的文字渲染和前所未有的逼真度。

接近完美的文字渲染

多语言文字准确率达 99%，支持中文、日文、韩文、印地语、孟加拉语。菜单、海报、UI 截图可直接使用，无需人工修正。

思考模式 + 联网搜索

首个具备推理能力的图像模型。可联网获取实时信息，自我核查输出结果，单次提示词生成最多 8 张风格一致的系列图片。

以假乱真的逼真生成

生成与真实照片难以区分的图像。社交媒体截图、产品图、直播画面——一句话提示词即可生成。

多图一致性

在多张生成图片中保持角色和风格的一致性。支持最多 6 张参考图，精确控制风格和构图。

技术能力

灵活的参数配置，覆盖所有创作场景。

3 种质量等级

可选 1K（默认）、2K 和 4K 质量。2K/4K 自动升级为 Pro 模型。

1K 标准

2K 高清

4K 超清

11 种宽高比

从社交媒体到超宽银幕格式，生成完美适配任何场景的图像。

1:12:33:29:1616:94:33:44:55:421:9auto

2 种生成模式

文生图从零创作，图生图基于参考图编辑。

文生图

图生图

用 GPT Image 2 创作

探索 OpenAI 最强图像模型能做什么。

菜单设计

一份墨西哥餐厅菜单，包含正宗菜品和美元价格，暖色调专业排版设计...

UI 截图

一张 TikTok 美妆教程视频截图，展示护肤步骤，逼真的界面元素...

活动海报

一张科技大会海报，包含活动详情、嘉宾、场地信息，现代简约设计风格，粗体排版...

漫画创作

一整页彩色漫画，讲述一个机器人学习画画的故事，日漫风格，包含中文对话...

秒级接入

简洁的 REST API，异步任务模式。提交生成请求后轮询获取结果。

REST API

简洁易用

速度提升 2 倍

对比上一代

获取 API Key

import requests
import time

API_BASE = "https://api.apipod.ai/v1"
headers = {"Authorization": "Bearer YOUR_KEY"}

# 1. Submit generation task
resp = requests.post(
    "https://api.apipod.ai/v1/images/generations",
    headers=headers,
    json={
        "model": "gpt-image-2",
        "prompt": "A professional menu design...",
        "quality": "1K",
        "aspect_ratio": "1:1"
    }
)
task_id = resp.json()["data"]["task_id"]

# 2. Poll status until completed
while True:
    res = requests.get(
        f"https://api.apipod.ai/v1/images/status/{task_id}",
        headers=headers
    ).json()

    if res["data"]["status"] == "completed":
        print(res["data"]["result"][0])
        break

    time.sleep(2)

常见问题

关于 GPT Image 2 的一切。

GPT Image 2 是什么？

GPT Image 2（官方名称 ChatGPT Images 2.0）是 OpenAI 最先进的图像生成模型。它是首个具备思考能力的图像模型，在 Image Arena 上以创纪录的 242 分优势排名第一。文字渲染准确率接近 99%，支持多种语言。

什么是思考模式？

思考模式让模型像大语言模型一样对图像生成进行推理。它可以联网搜索实时信息，自我核查输出结果的准确性，并从单个提示词生成最多 8 张视觉一致的图片。该模式面向 Plus 及以上订阅用户开放。

文字渲染有多准确？

GPT Image 2 的文字渲染准确率达到约 99%，相比上一代的 90-95% 有显著提升。支持中文、日文、韩文、印地语、孟加拉语等多种语言。菜单、海报、UI 截图等文字密集型输出可直接使用，无需人工修正。

如何接入 GPT Image 2 API？

向 /v1/images/generations 发送 POST 请求，携带 API Key、模型名 'gpt-image-2' 和提示词。API 返回 task_id，通过 /v1/images/status/{task_id} 轮询直到状态变为 'completed' 即可获取生成图片 URL。支持文生图和图生图两种模式，可配置质量（1K/2K/4K）和 11 种宽高比。

生成的图片能商用吗？

可以。通过 API 生成的所有图片均拥有完整的商业使用权。您拥有所创建内容的使用权，可用于广告、产品设计、营销物料等商业用途。

GPT Image 2 怎么收费？

按质量等级和使用量计费。1K 质量为基础定价，2K 和 4K 质量自动使用 Pro 变体。具体价格请查看定价页面，企业客户可享批量折扣。

准备好体验 GPT Image 2 了吗？

加入正在使用全球排名第一图像生成模型的开发者行列。

联系我们