近日,上海科技大学免疫化学研究所特聘教授蒋华良院士团队在Journal of Medicinal Chemistry发表封面文章Pushingthe Boundaries of Molecular Representation for Drug Discovery with the GraphAttention Mechanism,介绍了一种基于注意力机制的图神经网络模型(Attentive FP)。该模型可以用于分子表征,在多个药物发现相关的数据集上的预测表现达到当前最优,并且该模型所学到的内容具有可解释性。可解释性人工智能(Explainable AI)是AI的前沿研究方向之一,聚焦于用系统性和可解释的方式呈现人工智能所学习到的复杂逻辑,让人工智能的预测依据更好地被人类理解。人工智能药物设计研究的重点之一也是如何针对性地开发了更符合化学背景,更易于解读的模型。在Attentive FP中,该团队使用图神经网络处理含有原子和键的分子图结构,并通过引入原子水平和分子水平的注意力机制,使得到的分子图模型兼具推理能力和可解释性。对模型隐藏层神经元进行可视化可以发现,Attentive FP可以自动从特定任务中学习分子结构内非局部的特征,因此可以帮助药物学家或化学家超越经验和直觉,从各种性质或活性数据中获取对该分子结构更深层的理解。
人工智能在人脸识别、语音识别、机器翻译和自动驾驶等方面的应用有时不需要关注智能算法学习到了什么,为什么会做出这样的判断,而只需达到足够的精度即可。但对于像药物发现这类科学问题,由于其中有更多的不确定性,在通用人工智能把整个新药发现流程包办以前,药物学家会更相信自己的经验直觉,但同时又希望从越来越多的药物研发数据中汲取新的见解。数据的积累和深度学习算法的应用可以建立更准确的预测模型,而这些预测如果是不能被解释,或者说难以被药物学家理解,那么将很难取得药物学家的信任,进而真正被应用而成为药物发现必不可少的环节。蒋华良团队开发的基于注意力机制的可解释图神经网络分子指纹Attentive FP是对人工智能的可解释性在药物发现中的有益探索,它将机器认知与人的认知连接起来,以期更好地利用机器的认知增强药物学家的认知,这类前沿且与药物研究需求紧密结合的探索,相信能产生更大的实际应用价值。
论文链接:https://pubs.acs.org/doi/10.1021/acs.jmedchem.9b00959
Attentive FP代码:https://github.com/OpenDrugAI/AttentiveFP