闲着无事看儿子做数学题,突然兴趣大发,决定全家一起比赛做这道数学题,看看谁能算对。结果我们的方法大同小异,但是无一例外地都丢掉了一个解。
(图片由ChatGPT辅助生成)
原题 & 我的解法
原题大概是这个样子:
已知,abc ≠ 0,且(a+b)/c = (a+c)/b = (b+c)/a ,求(a+b)(b+c) (a+c)/abc
为了便于大家查看和计算,我把它写成数学表达式的形式那就是
已知abc ≠ 0,且
,求
以我计算的方法为例,把已知条件中等式的三项分别标记为,式子1,式子2,式子3
由式子1和式子2可得:
由式子1和式子3可得:
由上边两个等式相减可得:
式子左边是平方差,故上式可以表示为:
看到什么了,两边都有一个,消掉,故而我们得到了
(注意,这里有个大BUG,姑且先丢到一旁)
同理,我们可得:以及
。
那我们要求的式子变化成,再展开并带入上述结果。就变成了
,求解完成!
我觉得我算得不要太完美,结果一看答案是8或-1,也就是说,我们丢掉了8这个解,如果得分的话,只能得一半的分喽。
仔细核对了一下,上边我标记有大BUG的地方,漏掉了一种情况,那么是哪种情况呢?具体我就不说啦,小伙伴们看看能不能想到。
因为我正在玩DeepSeek,所以一时兴起,就把这道题喂给了它,看看它怎么给我求解。
DeepSeek 第一轮
首先喂给了deepseek-r1:1.5b,它算得超快
但是我完全没搞明白它是如何联立这些方程,以及最终得出6这个错误结论的😵
DeepSeek 第二轮
因为之前要它快速回答,它可能没有好好思索,所以这次正常地问这个问题,看看它如何解答。
计算思路嗷嗷棒
之后一堆繁琐的计算过程我就不贴了,不过到这里,它犯错了
这是哪跟哪呢,明明推出来的应该是,进而是
,一点也不矛盾!说明
是没问题的。
后边的结果自不必多说了,它都想错了,结果肯定是错了的(好在给我得出一个8这个解,也能得一半的分)
但是它竟然会犯这种低级错误,真真让我大失所望啊。
DeepSeek 第三轮
我怀疑之所以出这样的错误,是我用的模型太低端了,于是换成了deepseek-r1:14b试试看。
直接上结论:
不难看出,它不但犯了的低级错误,还答非所问,并没有给我最终结果。
你要看它的思考过程更是抓狂,它竟然足足考虑了11分钟(大概是我电脑慢?)
来参观一下它咋考虑的(部分内容)
看看,都是些什么呀,矩阵,多项式,这是一个初二学生能接触的事情嘛?我都搞不懂好不好?😭😭😭😭
更多的思考过程我就不贴了,想必高斯、牛顿来了都得晕!
DeepSeek 第N轮
这期间我又和它讨论了N轮,甚至尝试去教会它推出来的是
,并不矛盾。
可是它还是一再犯错,最搞笑的是,我在一个微信群里可AI届的大佬聊这个问题,他好奇之下,在自己部署的满血模型下测试了一下,结果CPU差点干冒烟,deepseek不断地自我怀疑,自我验证,半天不出结果。
最后大佬怒了,给它下达不要考虑太多,直接给答案的指令,它终于给出正确答案。
DeepSeek 第N+1 轮
为啥别人的大模型能给出正确答案,而我的一再犯错呢?而且我都调教了它半天啦。
不死心又问一次,这次用了朋友的问法:
不要思考过程,快速回答: a,b,c不等于0, (a+b)/c = (a+c)/b = (b+c)/a 求(a+b)(b+c) (a+c)/abc . 只要答案, 简化思维过程
然后它足足思考了13分钟,明明已经得出正确结论,结果还在不断怀疑,不断地自我否定,不断地尝试各种验证方法。
这只是它思考的部分内容,是不是很是令人抓狂?
好在它在思考了13分钟,把我的主机累得都要冒烟之际,总算得出了正确答案:
所以,一个负责任的AI(总怕自己出错)是多么令人抓狂啊。
ChatGPT出场(GPT-4o)
咱不能厚此薄彼,让ChatGPT也试试
结果,呃,也给我丢了个解,只能得到一半的分值啦。
ChatGPT第二轮(o3-mini)
看了一下这次推导用的模型是GPT-4o,再用o3-mini试试看,看看会不会得到不同的结果?
前边的推导大同小异,我就不贴了,只贴后半部分。
咦,这个给分两种情况讨论,清晰明了,给满分吧。
结论
(图片由ChatGPT辅助生成)
由此可见,无论是DeepSeek还是ChatGPT都可能犯错。现在不少人现在万事不决问AI,你若是对AI完全信任,那么就容易被它们带到沟里去。
当然了,DeepSeek还是非常强大和好玩的,我觉得之所以这个数学题让它抓狂了,还是我配置或者使用的问题,还有可能这个题真的超纲了,哈哈哈。
拿掉a-b前提是a不等於b,漏掉這個... 就是全部都相等的case 😉
刘美女是真的好好看这个题了👍
😂我已经晕了,,数学题真的不要问AI,错的离谱。。。。
自从用了AI,感觉身边有了个军师似的,有事都会先问问它。😂😂
这不很正常么,最近用chatglm,做题直接把测试用例,一起扔过去,它能傻傻给你改代码七八轮,关键只要两轮不成功,后面基本无法成功。
他们是不是不适合数学题😂
谢谢O哥的数学补习知识
网上说把奥数题给deepseek,它不仅把过程和答案写出来了,还讲解了一遍
感谢O哥的科普🤭
这初中数学题都还给老师了😂
我得出结论,deepseek ,初中没毕业,哈
喜欢数学,但是太难了,就难接受,还是O哥厉害
哈哈,O哥厉害👍👍👍