首页 » 博客 » 处于常态的边缘:人工智能的局限性

处于常态的边缘:人工智能的局限性

要告诉你一个小秘密:人工智能虽然功能强大,而且如今已成为潮流,但它远非完美。人工智能的核心是由统计数据驱动的,而统计数据在试图模拟现实时始终面临着极其艰巨的挑战。其中一些挑战可以通过创造力和机器来应对。而其他挑战则一如既往地重要。

了解这些问题(以及由此产生的人工智能系统的一些局限性)至关重要。我和其他人一样,对人工智能的未来充满期待。但了解我们的现状也至 关重要,因为它能帮助我们做出更好的决策和实施。

了解中文房间

人工智能哲学领域著名学者约翰·塞尔(John Searle)创造了一个名为“中文房间”的思想实验。它最初是对图灵测试有效性的反驳,但后来发展成为 购买电话营销数据 反对机器能够思考这一观点的有力论据之一。

实验大致如下:想象一下,你把一个人锁在一个堆满书的房间里。但有一个问题:这些书都是普通话,而这个人根本听不懂。

房间里有两个插槽,每隔几个小时都会开放一次。其中一个插槽里放着一张3×5英寸的卡片,上面用普通话写着几个字。另一个插槽里放着一支黑色墨水笔。我们的对象对房间越来越感到厌倦,翻阅了一些书,并认出了卡片上的一些字。

他们不明白这些字符的意思,但所有书里的字符总是写在另一组字符旁边。每次都是这样。所以他们凭直觉决定把相应的字符写在卡片上,然后放在第二个位置。

令他们惊讶的是,第二个槽口再次打开,露出了一顿美味的饭菜。我们的受试者很快意识到,每次他们正确配对符号都会获得奖励。

塞尔随后思考了以下问题:如果卡片的写者不知道房间内发生了什么,但他们看到了卡片,并看到有人在回复他们所写的内容,他们会认为房间内的人说的是普通话吗?

对塞尔来说,计算机就像房间里的人。它们 saas公司:你应该对转化率持保留态度 可以被训练来识别模式,并根据这些模式做出决策,但它们并不真正理解这些模式。就像我们的实验对象不需要知道符号的含义就能回复信息一样。

按照塞尔的论证,计算机可以清楚地看到两个变量之间存在相关性,但计算机不可能构建理论来解释这种相关性存在的原因。这是机器学习的固有局限性。

呆在盒子里

当算法的预测基于与训练数据相似的数据时,其性能最佳。输入数据与训练集之间的差异越大,预测失败的可能性就越大。

数学模型建立在变量组之间的关系之上,例如身高和体重是相关的,GDP和消费支出也是如此。然而,这些关系并不一定保持不变。

比如,在前面提到的身高/体重案例中,体重增 短信列表 加越多,这种关系就越趋于消失。这是因为人们可以持续增重,但身高却不会增长。

如果我建立一个模型,根据体重预测某人的身高,只要该人符合“正常”参数(记住这个词),我可能就能得到一个可靠的模型。体重过重(例如极瘦或肥胖的人)时,预测误差会增大。

统计“正态性”是指数据集遵循与正态分布相似的模式。广义上讲,这意味着大约 75% 的数据非常接近中位数。当变量遵循正态且可预测的分布时,算法的效果最佳。因此,偏离正态分布的数据往往会产生不可预测的结果。

 

滚动至顶部