都说大模型要超越人类了,今天就试试让kimi和通义千问做公务员考试题目,谁能考高分?
测评结果再次让人震惊!
问题提干:大小两种规格的盒装鸡蛋,大盒装23个,小盒装16个,采购员小王买了500个鸡蛋,大盒装一共比小盒装(),请问括号中填多少?
备注: 这里稍微改写了下原题描述,避免大模型搜索网上的答案。
Kimi考公
kimi上面的数学计算出现了错误。这是最简单的加减法错误。我告诉他错了。
通过上面的对话可以看出kimi开始给的方程式 23x + 16y=500对的,但是自己无法计算出结果。
后面经过几轮对话,我失去了耐心。。。。
放弃吧~
结论:kimi考公失败
通义千问考公
通义千问开始方程式和kimi一样:23x + 16y=500,但是他一开始认为无解,经过我二次提示,他给出了答案:x=16, y=7,且洋洋得意地计算464+112=500,这也是一个加法错误。
我尝试告诉他有其他答案,这个答案不对。
但是他却倔强地说这是唯一解。
算了算了。
你是唯一解,你没通过考验!
结论:通义千问考公失败
总结
通过上述对话可以看出kimi和通义千问都不具备根据逻辑题目分析和解析方程的能力。
即使使用最笨的方法,从x=1~x=21遍历也能得到答案。
kimi有尝试使用遍历方法,但是不知道为啥直接从x=1跳到了x=14,就跳过了x=12, y=14的题目答案,与答案失之交臂。
通义千问给出了错误答案,坚持到底。
如果您对测评结果有疑问,欢迎交流,更多大模型案例在公众号首发。
#AIGC #kimi #通义千问 #大模型