【AI测评】从小米SU7发布27分钟50000大定海报图看文心一言、豆包等AI大模型的图片理解效果

AI测评1年前 (2024)发布 OneNav

177 0 0

【AI测评】从小米SU7发布27分钟50000大定海报图看文心一言、豆包等AI大模型的图片理解效果

该图片来自小米汽车微博

▌锅头导读

昨晚通过小米SU7发布售价验证了国产大模型的联网查询实时性，大家都表现得很棒。

随后发现大家都在转发小米SU7在27分钟大定突破50000台的海报图，锅头在想，当我把这张海报图发给各家AI后，他们会出现什么反应？是不是依然都表现很好？

想到就去做。

▌评分标准

在测试前，为了能更直观方便比较各模型测试结果，我们简单定义下测试评分标准，具体如下：

评分标准	分数
生成新闻与测试项的提示词描述完全相符	5
生成图像与测试项的提示词描述大部分相符	4
生成图像与测试项的提示词描述少部分相符	3
生成图像与测试项的提示词无法判别是否相符	2
生成图像与测试项的提示词完全不符，答非所问	1
无此功能或不支持生成	0

（注意：该评分仅供本次测试的感性反馈使用，非权威测试，请勿纠结。）

▌测试项

本次测试比较简单，就一项：

AI能不能正确解读“小米SU7在27分钟大定突破50000台”的海报图意思。

▌测试模型

Kimi
智谱清言-GLM-4
文心一言-文心大模型3.5
通义千问
豆包
讯飞星火
360智脑
百川大模型
腾讯混元助手

▌测试时间

2024年3月29日。

准备工作完成后，我们开始进入测试。

▌Kimi

【AI测评】从小米SU7发布27分钟50000大定海报图看文心一言、豆包等AI大模型的图片理解效果

结果：能正确理解图片内容并给出合理的分析表达，与预期相符，打5分。

▌智谱清言-GLM-4

【AI测评】从小米SU7发布27分钟50000大定海报图看文心一言、豆包等AI大模型的图片理解效果

结果：能正确理解图片内容并给出合理的分析表达，与预期相符，打5分。

▌文心一言-文心大模型3.5

【AI测评】从小米SU7发布27分钟50000大定海报图看文心一言、豆包等AI大模型的图片理解效果

结果：能正确理解图片内容并给出合理的分析表达，与预期相符，打5分。

▌通义千问

【AI测评】从小米SU7发布27分钟50000大定海报图看文心一言、豆包等AI大模型的图片理解效果

结果：能正确理解图片内容并给出合理的分析表达，与预期相符，打5分。

▌豆包

【AI测评】从小米SU7发布27分钟50000大定海报图看文心一言、豆包等AI大模型的图片理解效果

结果：无法上传图片，算是无此功能，打0分。

▌讯飞星火

【AI测评】从小米SU7发布27分钟50000大定海报图看文心一言、豆包等AI大模型的图片理解效果

结果：能正确理解图片内容并给出合理的分析表达，与预期相符，打5分。

▌360智脑

【AI测评】从小米SU7发布27分钟50000大定海报图看文心一言、豆包等AI大模型的图片理解效果

结果：无法上传图片，算是无此功能，打0分。

▌百川大模型

【AI测评】从小米SU7发布27分钟50000大定海报图看文心一言、豆包等AI大模型的图片理解效果

结果：不支持上传图片格式文件，算是无此功能，打0分。

▌腾讯混元助手

【AI测评】从小米SU7发布27分钟50000大定海报图看文心一言、豆包等AI大模型的图片理解效果

结果：无法上传图片，算是无此功能，打0分。

▌测评总结

本次测评结果汇总表如下：

【AI测评】从小米SU7发布27分钟50000大定海报图看文心一言、豆包等AI大模型的图片理解效果

【AI测评】从小米SU7发布27分钟50000大定海报图看文心一言、豆包等AI大模型的图片理解效果

经过这一轮测试下来，发现要么不支持图片理解功能，要么支持的都表现得不错（也可能是这种海报类型文字都很清晰，难度不大）。

支持图片理解的AI大模型有Kimi、GLM-4、文心大模型3.5、通义千问、讯飞星火，都得到了5分的成绩。

暂时还不支持图片理解的AI大模型有豆包、360智脑、百川大模型、腾讯混元助手。按现在的AI迭代速度，相信很快就会支持了。

让我们拭目以待。

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

2024最强 AI 集合！12个领域，47款AI工具，每一个都变态又好用！打工人必备！【建议收藏】

OneNav

220

【AI测评】国内AI大模型表格数据处理哪家强？智谱GLM-4、Kimi优秀（4000字详细测评过程+结果）

OneNav

175

超越MJ6和SD3，快手开源文生图模型Kolors

AiBots

177

【AI测评】用Kimi做AI新闻速览后，能从2小时缩短至10分钟吗？

OneNav

186

【6 款 AI 影片生成软体大评比】RUNWAY、可灵、LUMA、VIDU、HAIPER、PromeAI，谁才是最强 AI 影片生成器？

OneNav

181

深度测评：SD3模型表现如何？实用教程助你玩Stable Diffusion 3 ，最强SD3模型使用攻略，附ComfyUI实操

AiBots

181

暂无评论

暂无评论...