当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
代码:
大家有什么小众旅游推荐的呀?
曼德拉是南非的罪人吗?
有什么是你去河南才明白的事?
postgres集群的选择?
网络小白如何建立一个网站,供别人下载文件(主要是PDF和MP3)?
上海房价会不会再跌百分之50%?
为什么感觉腾讯的风评越来越好了?
以色列是如何从三天前的不可一世要灭了伊朗到今天的哭哭啼啼要“为生存而战”的?
穿瑜伽裤爬山的女生会不会害羞?
为什么 Windows 没有比较成熟的第三方桌面环境(explorer.exe)?
34 岁教授王虹在北京大学开数学讲座,她或将成为首位获得菲尔兹奖的中国籍数学家,有多厉害?
小别胜新婚吗?
以色列为什么要打伊朗?
如何评价B站峰哥亡命天涯直播中说面包就是比馒头好吃,中国古代不吃面包是因为贫穷,没有足够的柴火?
为什么我的顺风车一直没人接单?
使用J***a开发简单CAD软件?
Python+rust会是一个强大的组合吗?
我的世界怎么租一个四个人的服务器?
为什么家里的长辈炒菜基本都会放葱姜蒜等调料,而对于部分年轻人似乎变得可有可无?
如何客观评价李小冉的长相?
中国军队有多强,在世界能排第几?
***拍大尺度片子时摄影师不会看光吗?