国际大模型竞技场LMArena最新评测显示,腾讯旗下混元图像3.0(hunyuanimage 3.0)在全球26款模型「盲测」中位居第一,被评为最佳综合文生图模型,赢过谷歌(Google)推出的「Nano-banana」(纳米香蕉)等顶尖闭源模型。
LMArena为美国加州大学伯克利分校推出的创新AI模型评估平台,评测内核方法是基于人类真实偏好的「盲测」机制,让用户对不同AI模型的回答进行匿名投票,衡量模型的表现。
腾讯于9月28日发布混元图像3.0,声称是全球首个工业级原生多模态生图模型。更是目前效果最强、参数量最大的开源生图模型,且效果能够对标业界领先的闭源模型。
据了解,该模型不仅能生成复杂文本、复杂漫画、表情包,还能生成生动有趣的科普插画。这些能力将大幅提高插画师、设计师等视觉创作者的效率,原来需要画几个小时的漫画,现在可能只需要几分钟就能实现。
举例而言,用户只需要输入提示词:「生成一个月全食的四格科普漫画」,模型就可以自主生成完整的月全食科普,无需用户逐格描述内容;意味过去需要数小时的创作,如今只需几分钟即可完成,这种效率对插画师、设计师等视觉创作者堪称革命性突破。
混元团队透露,混元图像3.0目前版本已开放文生图能力,图生图、图像编辑、多轮交互等版本将于后陆续发布。
Nano-banana即Gemini 2.5 Flash Image,原本在LMArena广受好评,其除了文本生成图片的基本功能,最大的亮点在于图像高端操作。只要提供一张图片,就能用简单指令进行替换、修改或重新构图,且能维持角色与风格的一致性。