非科幻思考（第4/12页）

至少目前人工智能还不具备这样的能力。且不说理解复杂的场景，仅仅就“树上蹲着五只鸟，开枪打下来一只，还剩几只”这样的问题，它们也还回答不上来。它们无法推断，鸟儿因为害怕，就会逃走。

正如著名心理学家、语言学家史蒂芬·平克所说：“如果不是建立在一个庞大的关于外部世界以及他人意图的内隐知识结构的基础之上，语言本身并不起作用。”缺乏对于他人心理的常识系统，使得人工智能仍然难以“理解”人类日常的语言。

未来人工智能有可能学会读懂人类的情感和意图吗？

很多人都提到，目前人工智能已经可以精细识别人类的表情，能够读懂人的情绪。是的，人类的情绪属于一种外显图像，是比较容易识别的，这和识别东北虎、识别癌细胞类似，是图像识别的一个范畴。但这和理解人的情感完全是两回事。即便它们未来能从图像上识别出一个人此时的情绪，想要“解释”此人的情绪，也需要远为复杂的对人心的理解。

也有很多人提到，人工智能可以通过与人对话理解人的情感。但这实际上也离得很远。目前它们能做的只是智能对应，当听到人类说出句子A，在语料库中寻求识别匹配最合适的行为或回应。当你说“我不开心”，它们可以匹配说“多喝点热水”，但不理解什么是开心。如果想让它们分析不开心的理由，推测不开心之后的做法，就远远不够了。其中的差别可以形容为：人工智能使用语言，是匹配句子和句子。而人类使用语言，是匹配句子和真实内心的感觉。

那如何让人工智能学会读懂人类的情感和意图呢？

一种可能的路径是让它学习足够大的数据库，记录下人的足够多情感和行为的数据库。“深度学习”的一个特点在于必须要足够大的数据库，拥有一亿数据的“深度学习”比只有一百万数据的学习效果好得多。任何一个领域想要有所突破，首先都需要足够大的数据库。因此有人认为，21世纪最宝贵的资源不是石油，而是数据。

那我们有可能建立如此大的人类情感和行为数据库吗？理论上当然是有可能的，靠各种摄像头视频和人类自己拍摄上传的视频。但这里面最大的问题，或者说我个人的疑问在于，人工智能对于人类的情感和行为，能否进行“非监督学习”。

所谓监督学习，就是每一个数据由程序员做一个标注：“这个数据是好的。”“这个数据是猫。”“这个数据是男人因为嫉妒而殴打老婆。”不管数据本身是数字、棋谱、语言、图像还是视频，都需要程序员先给数据做标注，才能让人工智能学会这些标注。但是对于人类的情感与行为的超级数据库一一识别和标注，实在是太过于烦琐困难的工作。而非监督学习就是完全没有人进行标注，只把原始数据丢给人工智能，看看它能学到什么规律。我相信非监督数据在很多工程领域可以自动进行，因为步骤和成败的结果是自然可观测的。但是在人类情感与行为领域，如果不以人的解释做标注，如果没有人来诠释情境中发生了什么故事，机器能够学习和领会吗？我觉得很难。

另一种可能性，就是每个人和自己的人工智能助理之间的数据学习。由一个人不断告知人工智能所有情感和行为的前因后果：他碰到我，所以我不高兴；他没有记得给我买东西，所以我不高兴；餐厅的灯光太昏暗，所以我不高兴。若所有人都将前因后果事无巨细地解释给人工智能听，就像父母将这个世界的机理解释给孩子，那么它肯定可以全都记住。如果足够详细，那它至少能学会这一个人的情感行为特征和心理因果特征。这相当于是每个人自己给行为数据做标记。这种路径在未来有可能成功，但取决于每个人是否愿意详细教它。

人工智能识别人类情感和意图，还有可能有更本质的困难，那就是人工智能无法以自己映照他人。

人类识别他人的情感和意图，并不是因为大数据学习。实际上人一生能遇见的人、交谈和交往的经历都是很有限的。人能够从少数经历中学到有关他人的很多情感和行为知识，能直觉感知他人的心境，不是因为人类头脑处理能力更快，而是因为人类能够以自己映照他人，将心比心。

最直接的映照，是镜面反射。人脑中有一些细胞，能够直接反射他人的行为意图，叫作镜像神经元。这种神经元不仅人类拥有，在较高级的灵长类动物头脑中也有。当一个人看见另一个人拿起锤子，自己即使手里没有锤子，与“动手砸”相关的神经元也会“亮”起来。

这种“读懂他人”属于生理性质的，大脑对他人的意图直接有反映，反映出来的意图，可以被观看者直接感受到，因此叫“镜像神经元”。人工智能可能生成这种直接的反映吗？缺乏生理共同点，应该不太可能。

另一方面，人们可以用自我观察映照出他人的情感和意图。面对一个情境的分析，人们可以把自己代入同样的情境，假想自己会有什么样的感情。能够让人悲欢离合的影视文学，就是因为人有代入感，才会让人喜爱。这一方面来源于人类的情感相似性，都有人之常情，另一方面人可以通过读取自己的心思过程，以己度人。

也就是说，人类对他人的理解，除了可以“外部观察”和“语言交流”，还能有“内部观察”。事实上，“内部观察”是如此强大，我们对于很多从来没见过的事情，只要代入自己想想，就能对其中的前因后果猜出个大概。现在的问题是，如果机器完全没有类人的情感，仅靠“外部观察”和“语言交流”，能达到同样的理解他人的效果吗？我不知道。

以上讨论全都是建立在人工智能没有类人情感的前提下，只考虑技术上如何学习理解人类情感。那么人工智能是否有可能产生类人情感呢？这是另一个问题了，本文结尾的时候会有一些讨论。

仅靠“外部观察”能否理解他人的情感和意图，还涉及另一个更客观的问题：大数据统计能否预知个体行为。

统计学永远只告诉我们系统信息，即便每个人都是完全不一样的随机数，在大数定理的保证下，也能呈现一些稳定的集体特征。然而这种稳定的集体特征并不能预测每一个个体，对“人类行为”的学习不等于对“个人行为”的学习。举个例子，如果一个人被人骂会怎样，这几乎是一个没法靠大数据统计学习得出答案的问题。有的人会忍，有的人会打人，有的人会报告执法机构，有的人会暗中寻求报复，有的人会嬉笑，有的人会哭，每类几乎都有很多。在大数据统计研究中，相关性会非常弱，最终你仍然不知道某个具体个人会如何做出回应。每个人的不同反应取决于个性、场景、社会地位、个人经历、文化群体、习惯等，而如果控制了所有这些变量，每个群体内的个体又会变得极少。外在条件相似的两个人面临同样的情境可能反应天差地别。所有这些个体差异，都给通过大数据统计预测个体行为带来很大的不确定性。人对他人最可靠的预测仍然来自对他人内心世界的理解。