声明:本文源自微信公众号GenAI新世界(ID:gh_e06235300f0d),作者李禾子,经微新创想授权转载发布。你还记得Google Nose吗?这个诞生于2013年愚人节的项目,曾宣称拥有涵盖1500万种气味的数据库,只需在谷歌搜索框输入关键词并点击“闻一闻”,就能在电脑旁嗅到新车、篝火甚至埃及古墓的气息。这个十年前看似荒诞却充满创意的玩笑,如今正逐步变为现实。今年9月,《科学》杂志刊登了一篇由初创公司Osmo(前谷歌子公司)联合莫奈尔化学感官中心等多团队的研究论文,提出AI模型可赋予机器超越人类的“嗅觉”。这一突破令人惊叹,毕竟嗅觉对大众而言远比视觉和听觉更为抽象。RGB颜色图谱能描述人眼所见,声音可转化为频率波长,但气味无形无色,难以量化。将气味数字化似乎是天方夜谭。该研究核心目标,正是构建一个能真实反映气味特征的人类嗅觉高维图谱——POM(Principle Odor Map)。那么,这项研究究竟是如何实现的呢?
气味是人类嗅觉系统对空气中特定分子的感知。当气味分子进入鼻腔后,会与嗅觉细胞上的受体发生反应,产生的生物电信号经神经传递至大脑,最终形成味觉认知。气味的构成远比色彩和声音复杂,存在数百万种类型,每种又由数百种化学分子组成,性质各异。人类约400个功能性嗅觉受体,远超视觉的4个和味觉的40个。面对如此复杂的嗅觉机制,研究人员首先开发了一种机器学习模型——消息传递神经网络(MPNN)。作为特定类型的图神经网络(GNN),该模型通过引入图分析技术,为非规则数据特征提取提供了新方法,特别适合学习复杂的气味特征。
模型构建完成后,研究人员需要为其提供学习素材。他们整合了Good Scents and Leffingwell & Associates(GS-LF)香精香料数据库,建立了一个包含约5000个分子的参考数据集。每个分子可对应多个气味标签,如果香、花香、芝士味和薄荷味等。通过将分子形状结构作为输入数据,模型能输出最能描述某种气味的对应词汇。为提升训练精度,研究者采用了多种优化方法:将GS-LF数据库按8:2比例划分为训练集和测试集,训练集进一步细分为五个交叉验证子集;同时运用贝叶斯优化算法进行数据交叉验证,并对GNN模型超参数进行精细调整。最终实验形成了如下所示的嗅觉高维图谱POM(局部):
这张图直观展示了各类气味的感知距离。例如,花香(floral)、肉味(meaty)和酒香(ethereal)等大类之间存在较大距离,而同类下更具体的气味,如百合花香(muguet)、薰衣草香(lavender)和茉莉花香(jasmine),感知距离则相对较近。论文将POM与基于摩根指纹的气味空间图(Morgan fingerprint-based maps)进行对比,发现后者无法体现上述感知距离差异。为验证模型效果,研究者招募了15位气味专家参与测试。每位专家需评价400种气味,从55个形容词中选择最贴切的描述,并打分评定。结果显示,模型在53%的测试分子上表现优于专家平均水平。此外,模型对30个气味描述词的预测结果,也超越了人类组的中位数(除麝香外)。
经过反复验证,研究者获得了稳定的分子结构-气味关系,并成功绘制了包含约50万种气味分子的图谱。这张图可视为上文感知距离坐标图的无限放大版,其中甚至包含许多尚未发现或合成的分子。若由人类专家逐一评价,需连续工作70年才能完成。这一突破性成果令人瞩目。
面对这一进展,网友纷纷畅想机器“嗅觉”的应用前景。有人认为可用于工厂污水处理的质量控制,或用于爆炸物、毒品、尸体的嗅探,甚至可能取代警犬和搜救犬。也有人期待借此研发更有效的除臭剂,改善运动后产生的异味。医疗领域同样备受关注,或可开发嗅觉丧失症疗法,通过气味检测疾病。香水行业从业者则表示,这能帮助他们判断同事是否喷洒过量香水。这些设想均颇具合理性。
首先,机器确实能弥补人类气味辨别的局限性。研究表明,每个人对气味的感知程度存在差异,受情绪、生理信号、经验、期望、个性或情境等多重因素影响。某些气味对人类至关重要:不良气味可能令人不适,而有害气体则直接威胁健康。机器辅助特定职业,或能提升作业效率和安全性。对调香师、厨师、设计师等职业而言,机器也能帮助创造更具功能的气味。研究表明,人类多数气味记忆源于婴儿及幼儿时期,而语言和视觉记忆则产生于10-30岁。气味引发的回忆往往更具情绪色彩,这揭示了人类与气味的紧密联系。
网友们的猜想也得到了论文作者之一Alex Wiltschko的印证。他在Osmo官网的文章中写道:“气味图谱是我们实现更宏伟目标的基础。若能开发出复制人类或犬类嗅觉功能的系统,我们就能更早发现疾病;AI将助力医生寻找更有效的药物,并辅助化学家和调香师的工作……我们的最终目标是,为改善人类健康和幸福奠定科学和商业基础。”然而,他也坦言研究仍存在不足:无法体现分子气味的浓淡,只能预测气味类型;目前仅针对单一分子,现实气味多为混合;即便技术成熟,气味复制和还原仍是巨大挑战。
最后,一位网友的评论颇具趣味:“我觉得这会让品酒失去乐趣。”