用声音建模世界


来自麻省理工学院和MIT-IBM沃森人工智能实验室的研究人员正在探索使用空间声学信息来帮助机器更好地预想其所处的环境。他们开发了一种机器学习模型,可以捕捉到房间里的任何声音将如何在空间中传播。因此,该模型能够模拟听众在不同位置听到的声音。

 

通过对一个场景的声学进行精确建模,该系统可以从声音记录中了解房间的基本三维几何形状。研究人员可以利用该系统捕捉到的声学信息来构建房间的精确视觉效果,类似于人类利用声音来估计其所处物理环境的属性。

 

除了有希望被应用到虚拟和增强现实中外,这项技术还可以帮助人工智能代理更好地了解周围世界。例如,电子工程和计算机科学系(EECS)的研究生、该模型相关描述性论文的合作者Yilun Du表示,相比单靠视觉,通过对其环境中的声音属性进行建模,一个水下探索机器人可以感知到更远的东西。

 

该研究得到了MIT-IBM沃森人工智能实验室和天桥脑科学研究院的支持。

 

阅读该论文