今年 3 月,OpenAI宣布对 ChatGPT 的图像生成功能进行重大升级。ChatGPT 不再依赖像 DALL·E 这样的独立模型,而是开始使用 GPT-4o 的原生图像生成功能,根据文本提示生成更准确、更具视觉吸引力的图像。
GPT-4o 图像生成模型能够精准地渲染文本,并利用其知识库和持续的聊天上下文精准地遵循提示。它还允许用户编辑已上传的图像,或使用上传的照片作为视觉灵感生成全新的图像。这一大幅提升的图像生成能力迅速走红,仅一周时间,就有超过 1.3 亿用户创作了超过 7 亿张图片。
ChatGPT 病毒式传播成功近 50 天后,微软为 Copilot 用户带来同样的图像生成技术。通过此次更新,Copilot 用户现在可以生成更精确的图像,拥有更佳的文本渲染效果,并能够使用文本提示编辑生成的图像等等。
虽然微软正在为 Copilot 引入这项增强功能,该公司仍然需要加快步伐才能在与 ChatGPT(OpenAI)和 Gemini(Google)等强大竞争对手的竞争中保持竞争力。在最近的 50 周年庆典活动上,微软分享了Copilot 的多项更新,但其中许多更新似乎都只是在追赶 ChatGPT 和 Gemini 几个月前就已经推出的功能。
微软AI 首席执行官 Mustafa Suleyman 承诺深度个性化的 Copilot。未来该公司将如何实现这一愿景,还有待观察。