为了阐明这一点,研究团队参照了认知心理学家的研究结果——他们发现,孩子们往往是通过归纳出偏好来消除许多错误推论,从而得出正确推论。这些典型的偏好包括
整体偏好(whole object bias)孩子们会更倾向于认为一个词指代的是整个物体,而不是它的组成部分(兔子未被关注的部分);
类别偏好(taxonomic bias)将一类物体归于类别中的某一种物体(所有动物都可能被当做“兔子”);
形状偏好(shape bias)孩子们往往会根据事物的形状,而不是颜色或条纹来描述一个物体。(所有白色的东西都可能被归类为“兔子”)。
在上面三种偏好中,DeepMind的研究团队选择了“形状偏好”作为检测神经网络的切入点,这是因为“形状偏好”在人类偏好研究中占据了很大的比重。
图丨从左至右原物体、形状匹配物体、颜色匹配物体
更为关键的是,在接下来的试验中,DeepMind 研究团队向深度神经网络展示三个物体的图像——原物体、形状匹配物体(形状相似但颜色不同的参照物体)以及颜色匹配物体(颜色相似但形状不同的参照物体)。同时,研究团队记录了原物体和形状匹配物体被归为一类的次数,以及原物体和颜色匹配物体被归到一类的次数。
在对上述归类次数进行比对后,研究人员发现,正如人类一样,该网络对形状的感知有着超过对颜色和材质的偏好——也就是说,神经网络也有着“形状偏好”。
图 | DeepMind在匹配网络中进行的认知心理学实验。A为形状匹配物体,B为颜色匹配物体。由于匹配网络对形状的偏好,会倾向于将原物体于A相匹配。
然而,除了观察到深度网络的形状偏好外,还有一些值得注意的结果
首先,形状偏好在对网络训练的早期就开始出现。这很容易令人联想到了人类思维方式对于形状的偏好。心理学家表示,儿童所展示的形状偏好比青少年要少,而成年人的形状偏好最为明显;
其次,取决于不同的组合和训练模式,深度网络对形状偏好的程度也不一样。所以当研究团队对深度学习系统进行测试时,必须使用大量的训练模型来得到可靠的结果,就像心理学家对不同对象的测试一样;
最后,即使形状偏好程度不同,每个网络在同种单次语义学习测试上的表现是一样的。这说明不同的网络可以针对同一个复杂问题找到同样有效的解决办法。
总之,DeepMind团队认为,此次实验的重大成功就在于证明了认知心理学在解释和推测神经网络行为方面的潜力。而由于人类在认知心理学研究领域具备丰富的知识储备,这将为解决人工智能“黑盒子”问题提供全新的思路,让人类更深刻的理解深度神经网络的行为。