如果焦虑的话,就行动起来
背景:
GPT Image 2 刚发布几天,和以前的生成模型有代差。让我们来体验下。
GPT Image 2 在 Text-to-Image Arena 榜单中以 1332 分登顶,领先第二名 GPT Image 1.5 高达 62 分。在更大的 Arena 榜单中,medium 版本更是以 1507 分大幅领先第二名约 236 分,展现出断层式的统治力。


快速上手
登录 chatgpt.com,需要科学上网。
- 新建聊天
- 点击「生成图片」,输入提示词
- 等待生成
生成过程会显示多个状态:正在创建图片 → 打磨细节 → 收尾中 → 最后润色中 → 最后微调一下…
照本宣科
让 GPT 生成 10 个场景,然后分别让 Image 生成。
教育考试类
数学试卷:
一张中国中学数学试卷,A4纸排版,黑白印刷风格,标题为"2026年高一数学期中考试",包含选择题、填空题、解答题三个部分,题号清晰对齐,文字工整,留有答题空白区域,真实考试卷风格,严谨排版
英语阅读试卷:
一张英语考试阅读理解试卷,包含一篇短文和5道选择题,每题有A/B/C/D选项,排版整齐,字体类似Times New Roman,标题为"English Reading Test",有答题卡区域,教育考试风格
答题卡:
一张标准考试答题卡,包含选择题填涂区域(A/B/C/D),考号填写框,条形码位置,黑色边框,扫描识别风格,布局精确对齐,类似高考答题卡设计
手写风格语文试卷:
一张仿手写风格的语文试卷,标题为"期末测试",内容包含阅读理解和作文题,字体类似学生手写但整齐,纸张略带褶皱,真实感强
知识呈现类
物理讲义:
一张高中物理知识讲义,主题"牛顿第二定律",包含公式、解释、示意图占位、重点标注框,排版类似辅导书页面,结构清晰,印刷教材风格
AI发展时间轴:
一张现代信息图海报,主题"AI发展阶段",包含时间轴(2010-2026),每个阶段有标题和简短说明,配图标,中文文字清晰,极简设计风格
商业文档类
PPT汇报页:
一页企业汇报PPT页面设计,主题为"业务流程优化项目汇报",16:9横版比例,标题位于顶部居中且突出。左侧为三条核心要点模块(每条包含小标题+简短说明,层级清晰),右侧为流程图模块(包含步骤节点与箭头连接,结构清楚)。整体为商务科技风,蓝白配色,留白充足,对齐严谨,字体清晰可读
杂志内页:
一页中文杂志内页设计,包含主标题、副标题、两栏正文、图片占位框,文字段落整齐排版,类似商业杂志排版,高级感设计
后台管理系统:
一个后台管理系统界面截图,包含表格数据(姓名、部门、状态),顶部筛选栏,分页控件,中文界面,现代企业系统UI风格
产品说明书:
一页电子产品说明书,包含标题"智能手表使用指南",分步骤说明,图标+文字组合,小字清晰可读,排版类似真实说明书
实战演练
让 GPT 生成 5 个场景,我寻找素材后测试。
场景一:表情包风格迁移
原图:

提示词:
参考这张图片,生成博丽灵梦的表情包
生成结果:

调整: 使用涂区域功能,手动涂抹需要调整的部分。

调整后结果:

观察: 调整后,第二行第四张图修改了原图含义,但我们先不进一步修复了。
场景二:App 风格迁移
原图:

风格参考:

提示词:
将第一张图的内容按照第二张图生成卡片式
生成结果:

场景三:进化树扩展
原图:

提示词:
模仿这个进化树的效果,扩展到2026最新的模型。最新的数据可以参考 https://artificialanalysis.ai/
生成结果:

观察: 生成结果仍有较多错误。
场景四:KV 物料延展
原图:

提示词:
根据这个KV生成多个物料,例如名片、海报、包装等(约8项)
生成结果:

场景五:Icon 批量生成
原图:
![]()
提示词:
根据这个icon风格,生成6*10个icon,内容是萌物
生成结果:
![]()
冲浪体验
GPT Image 2 带来的感受:
1. 设计门槛更低了 从演示文稿到教学素材,再到产品原型,“想到就能看到”的时代真正来了。以前需要几小时的设计工作,现在几分钟就能生成初稿。
2. 模型与流程配合还有空间 生成过程中的多状态反馈(正在创建 → 打磨细节 → 收尾中 → 最后润色 → 微调)说明代差不仅仅来自模型本身,流程优化同样能带来显著提升。加上Agent后蒸馏难度变大,这层壁垒也会逐渐被模型公司筑起
3. 速度将颠覆工具生态 只要生成速度足够快,PPT 这类传统工具将面临来自 AI 生图方式的降维打击。