人工智能在新药研发中的应用现状与挑战(上)

  • 2021-10-26 15:47
  • 作者:刘晓凡 孙翔宇 朱迅
  • 来源:药学进展

人工智能作为一种新兴技术,是新药研发实现降本增效的重要方式之一,人工智能+新药研发已成为中国医药企业加速创新转型的重要驱动力。


当前,新药研发面临着成本高企、收益率下降的双重困境。新药研发具有技术难度大、投入资金多、研发风险大、回报率高和研发周期长等特征,随着疾病复杂程度的提升,新药研发难度和成本迅速增加,全球新药研发成功率呈明显下降趋势。2019年,艾昆纬(IQVIA)发布报告指出,新药从临床试验开始到研发结束的平均开发时间在过去10年里增加了26%,2018年达到12.5年;新药开发成功率不断下降,2018年降至11.4%。据Nature杂志报道,新药研发成本快速增长,2018年开发的平均成本约为26亿美元 。新药投资回报率不断下滑,德勤发布的报告显示,2017年全球前12大制药公司的研发投资回报率仅为3.2%,较2010年的10.3%下降7个百分点。


人工智能的发展,为新药研发带来了新的技术手段。通过机器学习(machine learning,ML)、深度学习(deeplearning,DL)等方式赋能药物靶点发现、化合物筛选等环节,大大提升了新药研发的效率,为降本增效提供了可能 。应用AI技术,可缩短前期研发约一半时间,使新药研发的成功率从当前的12%提高到14%,每年为全球节约化合物筛选和临床试验费用约550亿美元。


提升新药研发效率,对加快开发临床需求未被满足的创新药物,助力药企抢占“best-in-class”和“first-in-class”药物市场的机遇窗口期,从而提升药企全球竞争力具有重要意义。AI技术作为提升新药研发效率的重要驱动力量,正在加速对新药研发各环节的渗透。本文通过对AI技术、AI赋能新药研发应用场景,以及应用AI技术的企业主体进行总结梳理,并展望AI技术未来发展趋势,为AI+新药研发提供思路与参考。


人工智能+新药研发的应用模式


与AI在其他场景的应用类似,AI+新药研发的实现路径包括五大流程:获取目标训练数据集;AI 自主学习算法建模;多次训练优化模型;测试集应用以评估模型性能;基于模型实现分子筛选、预测、分析等预定目标。算法、数据集和模型这3个要素是必不可少的部分,其中,算法和数据是实现应用的关键。


人工智能+新药研发应用算法 


AI技术涵盖ML和DL,如表1所示。ML算法在新药研发领域被广泛用于分类和回归预测等方面,常见的ML算法包括决策树(decision tree)、随机森林(random forest)、支持向量机(supportvector machine)、k-最近邻算法、朴素贝叶斯分类器等;DL算法包括深度神经网络(deep neural network,DNN)、卷积深度网络(convolutionalneural network,CNN)、循环神经网络(recurrentneural network,RNN)和自编码器(autoencoder,AE)等。DL 算法适合处理大数据,模型也更为复杂。随着计算机性能的提高和数据量的积累,DL算法在新药研发中的应用越来越广。


DNN是最早应用于药物发现的DL算法之一,最早来源于1943年McCulloch等提出的计算模型。CNN是一种前馈神经网络,它在图像识别领域的表现优异。RNN是一类用于处理序列数据的神经网络,具有记忆能力,可用于处理基因和蛋白序列数据等。自编码器的目的在于重构输入数据,可生成学习模型,在药物分子生成方面应用前景广阔。DNN、CNN、RNN 等 DL 算法模型通过定量结构性质关系(QSPR)或定量结构活性关系(QSAR)等预测药物分子的物理化学性质以及药物的吸收、分布、代谢、排泄和毒性(ADMET)。


表1:人工智能常见应用算法

表1:人工智能常见应用算法

来源:火石创造根据公开资料整理


面向新药研发的AI分子筛选技术入选《麻省理工学院技术评论》发布的2020年“全球十大突破性技术”。AI技术的发展正从传统的大样本训练向小样本学习、反馈学习的模式转变,小样本学习、零样本学习将逐渐在药物研发中应用和推广。


人工智能+新药研发应用数据 


新药研发过程涉及大量的数据,包括文献资料、化合物数据、靶点数据、专利数据、临床试验数据、真实世界数据、药品审评审批数据、市场销售数据等。面对海量、多源、异质性的数据,AI技术应用已逐渐跳出以靶点和分子筛选为核心的传统新药研发模式,形成以数据为核心的研发模式。


IBM公司开发的Watson系统,通过阅读2500万篇文献摘要、100万篇完整论文和400万篇专利文献,来预测RNA结合蛋白(RNA binding protein,RBP)与肌萎缩侧索硬化(ALS)的相关性。英国生物科技公司Benevolent Bio从全球范围内海量的学术论文、专利、临床试验结果、患者记录等数据中,提取对新药研发有用的信息;Atomwise公司利用其核心技术平台AtomNet识别重要的化学基团,如氢键、芳香度和单键碳,分析化合物的构效关系,从而用于新药发现和评估新药风险。


人工智能+新药研发的应用企业 


近年来,越来越多的企业布局AI+新药研发,探索如何用AI技术实现新药研发的降本增效。据Deep Pharma Intelligence 统计,截至2020年,全球共有240家AI+新药研发企业,主要分布在美国、英国和加拿大,国内也有一些从事此类工作的企业。目前,探索AI+新药研发的企业主要有三类:一是AI药物研发创新企业,如Exscienta、BenevolentAI、Atomwise、Relay Therapeutcs、晶泰科技、燧坤智能等;二是IT巨头,如Google、微软、腾讯、阿里巴巴集团等;三是大型制药企业,如罗氏、阿斯利康、强生、葛兰素史克(GSK)等。


新药研发IT巨头倾向于利用自身的互联网基础与平台优势进行技术布局,进入方式为自主研发相关产品,开发相关领域针对性技术以赋能行业应用,业务领域不断下沉,或者通过外延并购扩张业务版图。例如腾讯进军AI+新药研发领域,发布首个AI驱动的药物发现平台“云深智药(iDrug)”;谷歌计划斥资4亿美元收购AI企业DeepMind。


图1:人工智能+新药研发企业图谱

图1:人工智能+新药研发企业图谱

来源:火石创造根据公开资料整理


AI+新药研发企业多以技术优势切入1个或多个应用场景,如Benevolent AI构建判断加强认知系统(judgment augmented cognition system,JACS)技术平台,针对包括阿尔茨海默病和罕见肿瘤在内的4个不同领域的疾病进行10 多种药物的研发;晶泰科技组建Renova AI新药研发平台,提供“计算+ 实验”新模式下的药物设计与固体形态研究服务。


大型药企则以自建AI研究团队、投资并购或与AI技术公司合作的方式,布局AI新药研发。辉瑞、GSK和诺华等制药公司也在内部建立了大量的AI研究团队。当前全球十大制药公司均已布局AI+新药研发,诸多大型制药公司开始与AI 初创公司开展合作,例如艾伯维与AiCure、阿斯利康与BergHealth、拜耳与Sensyne Health、百时美施贵宝(BMS)与Concerto Health AI,以及辉瑞与IBM Watson等。 


由于AI+新药研发创新公司缺少新药研发的相关数据、成熟的研发管线以及资深的药物专家,而这恰好是传统制药巨头所具备的优势。因此,大型药企和AI+新药研发技术公司联合是目前主要的业务模式。从开展合作的情况来看,随着AI+新药研发的发展,现有制药生态系统正从执行研发的传统利益攸关方逐渐转向更加多样化的技术支持伙伴关系。


我国AI+新药研发起步较晚,目前尚处在初期阶段。据火石创造统计,国内涌现了晶泰科技、深度智药、云势软件、望石智慧等一批创新企业,主要分布在北京、上海、杭州和深圳等城市。然而,国内AI+新药研发企业并不多,总数不足20家。


近年来,随着我国医药产业创新发展的加速推进,国内医药行业在AI+新药研发领域的跨界合作也在增加:医药巨头与AI+新药研发技术公司合作,例如恒瑞医药与百奥知、豪森药业与Atomwise的合作;药企与IT巨头合作,如正大天晴通过与阿里云合作获得一种全新的化合物筛选方法;CRO企业与AI+新药研发技术公司合作,如药明康德和Schrdinger合资成立了Faxian Therapeutics,将药明康德的先导化合物优化服务与Schrdinger的药物设计软件平台相结合,从而加速新药发现;药明康德和Insilico 合作开发了一种ML模型,用于从头设计DDR1蛋白(一种与纤维化等疾病有关的激酶)的小分子抑制剂。


(责任编辑:刘思慧)

分享至

×

右键点击另存二维码!

    相关阅读
网民评论

{nickName} {addTime}
replyContent_{id}
{content}
adminreplyContent_{id}