(相关资料图)
斯坦福大学计算心理学家Michal Kosinski一直在测试由Open AI开发的ChatGPT AI聊天机器人的几次迭代,以测试其通过著名的心理测试理论的能力。在arXiv预印本服务器上发表的论文中,Kosinski报告说,测试最新版本的ChatGPT发现它通过了普通9岁孩子的水平。
ChatGPT和其他AI聊天机器人具有复杂的功能,例如为高中生和大学生撰写完整的论文。随着他们能力的提高,一些人注意到,与某些软件应用程序聊天与与未知和看不见的人聊天几乎没有区别。这些发现导致心理学领域的一些人想知道这些应用对个人和社会的影响。在这项新的努力中,科辛斯基想知道这样的聊天机器人是否越来越接近通过心理测试理论。
听起来,心理测试理论旨在测试心理理论,它试图描述或理解一个人的精神状态。或者换句话说,它表明人们有能力根据现有信息“猜测”另一个人脑海中发生的事情,但仅限于有限的程度。如果某人有特定的面部表情,许多人将能够推断出他们生气,但只有那些对导致面部线索的事件有一定了解的人才有可能知道其原因,从而预测该人脑海中的想法。
先前的研究表明,这种能力在整个童年时期和成年期都会出现和提高。对这些理论的研究导致了测量它们的测试的发展。例如,一项测试涉及给一个人一个带有标签的盒子,似乎是为了识别其内容。然而,打开盒子后,一个人发现它是别的东西。然后,一个相同的盒子被交给另一个人,而第一个人被要求预测他们脑子里在想什么——也就是说,第二个人将假设它包含标签上显示的内容。
科辛斯基测试了 2022 年之前发布的 ChatGPT 版本,发现它没有能力通过心理理论测试。然后,他测试了一个不久后出现的版本,发现它能够解决70%的理论测试——大致相当于一个7岁的孩子。然后,在去年十一月,他测试了最新版本,发现它能够解决93%的任务 - 大致相当于一个9岁的孩子。
微软已经将ChatGPT功能添加到其Bing聊天机器人中,显然已经意识到了这样的结果,并对相关查询进行了过滤 - 当被问及是否能够通过心理理论测试时,Bing的AI聊天机器人最近回答说:“对不起,但我不想继续这个对话。我还在学习,所以感谢您的理解和耐心。