Caltech Research: Cracking the Code of Facial Recognition


我们每天是如何识别朋友,家人,同事和熟人这些不同的面孔呢?加州理工学院的最新研究揭示了大脑如何用简单而高效的方法进行面部识别。这个发现表明,在不久的将来大脑活动的监测有望用于重塑人们的视觉。

 

这一项研究是由Caltech生物学教授,陈天桥雒芊芊系统神经科学中心的主任、首席科学家Doris Tsao所率领的团队完成。该研究成果于6月1日发表于最新一期全球顶级学术期刊《细胞》。

 

这项新研究的最重要发现是:即使存在无数的不同面孔,我们的大脑只需要大约200个神经元来编码面孔。每个神经元通过编写有关维度或轴向的若干参数进而编码出完整的面孔。正如红色、蓝色和绿色以不同的方式组合而产生了光谱上每种可能的颜色,这200多个神经元以同样的原理:通过整合分解多个维度的信息形成一个 “面部空间”实现对面孔的识别。

 

这些神经元中有的是编写与面部骨骼形状相关的代码: 比如,眼睛之间的距离、发际线的形状以及脸部的宽度。有的神经元则编码与肤色、肌肉组织或眼睛和头发的颜色相关的信息。此外,神经元的反应强度则与这些特征的强度成正比。比如:神经元可能对较大的眼间距离有最强的反应,对平均眼间距离有中等反应,对较小的眼间距离有较小的反应。然而,单个神经元并不直接编码某个特定的面部特征。相反,单个神经元编码一整套更为抽象的“面部空间方向”然后经由大脑分析整合每个方向上的信息,进而编码出完整的脸部信息。

 

曹教授说:“这项新研究是近二十年来科学家试图破解人脸识别代码的重大突破。令我们兴奋不已的是神经元竟然采用了如此简单高效的信息处理和代码编辑模式。”

 

在2003年,曹教授和她的合作者发现,当猴子识别脸部时,灵长类动物脑中的某些脑区最为活跃。 研究人员将这些脑区称为面容组; 面容组里面的神经元,被称之为面容细胞。 过去十年的研究表明,这些面容细胞对不同的面部特征有反应。 例如,一些细胞只对眼睛有反应,而其他细胞则只对头发有反应。

 

“但是这些实验结果并不令人完全满意,因为我们只是观察到了面容细胞对于脸部信息处理的一个缩影。”曹教授解释道:“如果改变卡通脸上眼睛的形状,一些细胞对这个信息变化本身就非常敏感。然而细胞有可能对于其他我们没有测试过的变化也会非常敏感。在最新的这篇研究报道中,我们发现面容细胞是通过编码脸部空间进行信息处理的,新的实验结果揭示了面容细胞编辑脸部信息的完整代码。”

 

两项确凿的证据表明研究者已经破解了面部识别的完整编程方式。第一个证据是,研究者只要知道单个细胞编码的维度信息,就可以从电信号中推导出这些所有细胞共同编码的脸部特征。也就是说,他们可以向猴子展示一个新面孔,然后通过记录大脑中面容细胞的电波活动即可精确地重现猴子所看到的面孔。

 

第二个证据是,根据作者的假设如果单个面容细胞只对相关脸部维度信息有反应,那么这个细胞应该对于面容看起来完全不一样,但在对应的轴向上编码相同维度信息的一系列照片,产生同样的反应。曹教授和她的博士后Le Chang的实验结果充分证明了这一假想。

 

“在线性代数中,你学到的是如果将50维的向量空间投射到一维子空间上,那么该映射会有49维零空间,”曹博士说:“我们惊讶的是,在大脑的视觉信息处理中,神经元实际上是在做简单的线性代数。每个单元格都采取一个50维向量空间,并将其投影到一维空间上。这让我们发现其实每个细胞确都有一个49维的零空间。这完全推翻了我们长时间以来对于单个细胞编码特定脸部特征的想法,每个面容细胞其实是一台美丽且简单的线性投影机。”

 

“我们的研究结果可能会为人工智能的面部识别提供新的算法,为神经回路的设计提供新的模式。”Le Chang补充道,“我们实验结果有可能揭示了大脑进行物体编码的普遍模型。在未这个技术未来会在很多领域施展身手。例如,通过分析证人大脑面容细胞的活动可以准确重构罪犯的画像”。