研究人员训练人工智能预测化学品的气味
谷歌大脑研究人员最近发表的一篇论文展示了研究人员如何根据传递到网络中的化学物质的结构来训练人工智能来预测物体的气味。正如《连线》杂志报道的那样,研究人员希望他们的工作能够帮助解开人类嗅觉周围的一些谜团,与我们的其他感官相比,人们对嗅觉知之甚少。
气味之间的差异是复杂的,分子中单个原子的变化可以将气味从令人愉悦变为令人不快。研究人员很难理解导致化学结构被我们的嗅觉解释为愉快或厌恶的模式。相比之下,在我们眼中呈现为颜色的电磁光谱模式更容易量化,科学家们能够进行精确的测量,从而告诉他们某些波长的光会是什么样子。
机器学习算法擅长在数据中发现模式,因此,人工智能研究人员试图使用机器学习来更好地了解人类大脑如何解释气味。利用机器学习算法量化气味的尝试包括 2015 年开展的DREAM Olfaction Prediction Challenge。一些研究从挑战中获取数据,并试图生成单分子气味的自然语言描述。
最近发表在 Arxiv 上的研究对Google Brain研究人员使用神经网络量化气味的尝试进行了分类。研究人员利用了图神经网络或 GNN。图神经网络能够解释图数据,图数据是由节点和边组成的数据结构。图通常用于表示各个数据点之间的网络或关系。在社交网络的上下文中,图将网络中的每个人都由一个节点或顶点表示。社交媒体公司使用此类图表来预测您当前网络外围设备上的人员并推荐新朋友。
为了解释气味,研究人员对网络进行了数千个分子的训练,每个分子都与一个自然语言描述符相匹配。GNN 能够解释数据并了解分子结构中的模式。研究人员使用的描述词是“甜”、“烟熏”或“木质”等短语。研究人员编制的 5,000 多个分子中约有三分之二用于训练模型,其余三分之一用于测试模型。
研究人员训练的模型运行良好,一旦完成第一次迭代,性能已经与其他试图将自然语言标签分配给化学结构的研究人员组达到的峰值性能相匹配。
参与该项目的研究人员之一 Alex Wiltschko 承认,他们目前的方法存在一些局限性。一方面,人工智能可以区分人类描述为相同的化学结构之间的差异,将两种不同的化学物质称为自然界中的“泥土”或“木质”,即使人工智能对它们进行了不同的分类。分类器的另一个问题是它不区分手性对,手性对是彼此镜像的分子。不同的方向意味着它们有不同的气味,但模型目前并不认为它们是不同的。
研究小组的目标是在他们未来的工作中解决这些限制。这项研究还有很长的路要走,但这是朝着了解分子的哪些特征与我们对某些气味的感知相对应的一步。谷歌大脑团队并不是唯一一个致力于人工智能应用以识别气味的研究团队。其他涉及气味的人工智能实验包括 IBM 对人工智能产生的香水的实验,以及俄罗斯科学家进行的一项检测潜在有毒气体混合物的实验。