评分标准 | 分数 |
生成新闻与测试项的提示词描述完全相符 | 5 |
生成图像与测试项的提示词描述大部分相符 | 4 |
生成图像与测试项的提示词描述少部分相符 | 3 |
生成图像与测试项的提示词无法判别是否相符 | 2 |
生成图像与测试项的提示词完全不符,答非所问 | 1 |
无此功能或不支持生成 | 0 |
-
内容真实 -
新闻具有时效性 -
来源可追溯 -
按指定格式呈现
-
Kimi - 智谱清言-GLM-4
-
文心一言-文心大模型3.5 - 通义千问
- 豆包
- 讯飞星火
准备工作完成后,我们开始进入测试。





确认内容内容为真实内容后,测试项具体测试结果和评分如下:





但点击新闻链接进入的新闻详情页要么报错,要么无链接,不可追溯。


确认内容内容为真实内容后,测试项具体测试结果和评分如下:

▌文心一言-文心大模型3.5



确认内容内容为真实内容后,测试项具体测试结果和评分如下:





▌测评总结
本次测评结果汇总表如下:

© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...