龙空技术网

人工智能在生物医药领域新应用

浦东国际人才港 118

前言:

现在各位老铁们对“对应分析可以用来表示”大概比较看重,咱们都需要分析一些“对应分析可以用来表示”的相关资讯。那么小编也在网上收集了一些有关“对应分析可以用来表示””的相关资讯,希望你们能喜欢,你们快快来了解一下吧!

近年,AI在生物信息数据分析、蛋白质结构解析、药物早期发现和疾病分子分型等领域得到了广泛应用,加速了新药研发进程,拓展了疾病诊疗方案。随着新技术的兴起,AI在新药研发和疾病诊疗应用研究中有哪些进展?面临的挑战有哪些?未来发展方向如何?

5月26日,上海市药物研发协同创新中心与浦东国际人才发展中心共同举办第47期 Science Café 活动。本期活动特别邀请了复旦大学药学院付伟教授、上海交通大学医学院附属仁济医院泌尿科陈锐副主任医师和斯微生物高级总监陈庚博士,与大家共同交流与探讨人工智能在生物医药领域的新应用。

嘉宾精彩报告总览

● AIDD和CADD赋能新药发现

· AIDD与新药研发融合现状

· CIDD与新药研发融合现状

● 人工智能在前列腺癌诊疗中的应用

· 前列腺癌诊疗研究现状

· AI在前列腺癌中的应用现状

· ChatGPT能否替代医生诊疗

● 人工智能在mRNA疫苗研发中的应用

· AI在mRNA疫苗研发中的应用

· mRAN疫苗优势

· mRNA疫苗研发面临序列优化的挑战

· AI在mRNA序列优化中的应用

· AI在mRNA个性化肿瘤疫苗开发中的应用

· SmartNeo分析平台

01 AIDD和CADD赋能新药发现

付伟教授从药物设计领域详细解读了AIDD与CIDD的发展历程、研发现状和各自优势,并分享了团队在AIDD与CIDD领域的探索。

传统新药研发存在大型数据利用率低、周期长和研发成本高等问题,与传统的药物研发相比,人工智能辅助药物设计(Artificial Intelligence for Drug Discovery,AIDD)和计算机药物辅助设计(Computer Aided Drug Design,CADD)优势明显,可对抗传统药物开发的低效和不确定性问题,提高药物开发效率,降低研发成本,加快药物研发进程。

AIDD与新药研发融合现状

AI技术应用贯穿了新药研发全链条,包括从靶点发现、化合物合成和筛选等药物早期发现阶段,晶型预测、药理作用评估、制剂研发等临床前研究,临床患者招募和临床设计优化等临床研究阶段,以及药物重定向和批量生产等审评上市阶段,均有AI技术的参与,AI可为药物研发节约大量时间和费用。目前,AI制药还处于爬坡阶段,主要集中在早期发现和临床前阶段的项目开发,治疗领域多为心血管疾病和抗肿瘤药领域,分子类型包括化药小分子和生物大分子,化药小分子占比更多,创新程度仍以me-too/me-better药物占主导。

◽ AIDD三个要素

AIDD包括ABC三个要素,即算法(Algorithm)、算力(Computing power)和大数据(Big data)。随着计算机的不断发展,计算资源基本能够满足AIDD的需求,而算法也在不断开发优化,越来越完善,但大数据仍然制约着AIDD的发展,究其原因是数据来源及获取困难,很多AI制药公司的数据涉及商业机密很难共享。

◽ AI竞争格局及资本市场情况

从初创公司数量来看,AI制药初创企业持续增加。截止2019年,美国AI制药公司数量全球居首,中国排名第五。目前,国内初创公司数量已从2019年的五家增长到了十几家,这些公司业务贯穿了药物研发的全链条,涉及各个研究领域。

从资本市场情况来看,2020年后,全球AI资本市场进入了融资爆发期,2018年至2021年,融资金额年增长率为110%,2021年全球AI制药投融资规模达到了32.8亿美元,同比提高了2.5倍。我国AI制药起步相对海外略有滞后,2015年起开始出现少量融资事件,2020年是我国AI制药领域转折性的一年,融资项目数量实现翻倍,融资总额同比增长约7倍。2021年资本市场规模达到了61亿元。

◽ ChatGPT等AI技术在新药研发领域中的应用

ChatGPT是一个基于机器学习和神经网络的自然语言处理模型。ChatGPT的思维方式主要基于大数据和算法进行推理和学习,而人类大脑是通过神经连接和脑区之间的协调来实现的思维和认知。近几年,基于ChatGPT辅助药物开发的产品很多,主要包括:华为开发的盘古,盘古是药物分子模型的药性预测的准确率比传统的方法高20%;微软开发的BioGPT,它是基于PubMed超过1500万篇摘要的庞大语料库上进行了预训练,在PubMedQA的检测中,模型预测的准确率高达81%;此外,Profluent开发了具有蛋白设计功能的ProGen软件,可设计新型有功能的蛋白。

CIDD与新药研发融合现状

◽ CADD的基本流程

CADD是研究化学小分子与生物大分子相互作用模式,进而进行基于结构的药物设计发现活性小分子的过程。从小分子化合物数据库和蛋白质数据库筛选出药物分子和靶标蛋白,使其相互作用形成复合物,通过X-Ray、NMR、电镜等技术手段对复合物的结构进行测定和量子化学、分子力学,分子动力学计算,对小分子化合物和蛋白质的结构不断的优化与设计,得到一个小分子和蛋白复合物的三维结构,再经过活性构效关系和药代/药效动力学构效关系的循环测试,最终得到了临床前候选化合物。

◽ 传统CADD应用场景和局限性

传统CADD的应用场景包括了蛋白质结构预测、小分子结构构建、小分子-蛋白相互作用、自由能计算、基于结构的药物设计(SBDD)、药效团,基于性质的药物设计(PBDD)、ADME/T、蛋白质的构象、蛋白质结构和功能的关系等。传统CADD贯穿了药物早期发现的各个环节,但由于传统CADD是基于静态结构进行药物分子设计,而药物和靶点相互作用是一个动态过程,存在着构象的变化,CADD没有考虑到小分子和蛋白质形成复合物的构象变化,即对蛋白质的柔性考虑不足,因此,CADD预测的准确性受到一定限制。

◽ 团队探索CADD技术在新药研发中应用

为解决CADD的局限性问题,付教授团队开发了动态虚拟筛选技术,通过分子动力学模拟,研究蛋白质的动态构象变化,采用一系列计算的技术,包括活性位点探测和聚类分析,通过建立多个药效团模型进行先导化合物的发现。该动态虚拟筛选技术方法已开展了多种药物的设计与发现,包括靶向A-GPCR的药物设计与发现,在中枢神经疾病领域开展镇痛药物的设计与发现;靶向核受体的药物设计与发现,开展抗炎免疫疾病领域药物研发;以及在递药系统分子设计与机制研究以及尿酸酶生物药领域开展研究。

G蛋白偶联受体约占药物靶标45%,人体味觉、视觉、嗅觉等感官和痛觉都与该受体有关,团队利用CADD技术从96个化合物中筛选发现了20多个活性化合物,基于这些化合物做了一系列的改造,对接中枢神经系统中多巴胺受体和5-羟色胺受体的各个亚型,发现其中部分活性分子的骨架是抗肿瘤药物的分子结构,但它也是5-羟色胺-2A(5-HT2A)的结合剂,且具有多靶点和拮抗特征。在这些研究基础上,团队开发了5-HT1AR激动剂,采用了动态虚拟筛选的技术,通过大规模动力学模拟,构建多重药效团模型,设计发现出了一系列活性分子,经过45个化合物分子进行活性测试,最终筛出了10个全新结构化合物分子,功能活性可达7 nmol量级,经过优化,发现了具有抗精神分裂和抗抑郁药效的新结构候选药物分子。另外,团队还利用CADD技术开发了强效镇痛药物,发现了300多个高活性分子,其中PCC分子的活性是吗啡的50-100倍,且具有很强的癌痛镇痛疗效,可作为广谱的镇痛药物,该类激动剂已获得7项专利授权。截止目前,在GPCR领域团队发表了有四十多篇左右文章,授权了有13项专利,1项专利已进入到美国市场。

未来展望:AIDD和CADD优势互补

AIDD是一个大规模的训练模型,更依赖于算法和算力,对药物分子活性结构的考虑不足,而CADD更倾向于药物构效关系的分析,运用药效团和基于片段药物设计的概念,AIDD和CADD各有优势,付教授团队即采用了CADD和AIDD融合的新药研发思路,在AIDD基于图的分子表征方法的基础上,融入CADD基于药效团及活性片段的分子生成的理念,进行药物分子设计,应用于中枢神经系统领域镇痛药物的开发。付教授表示,未来AIDD和CADD的发展方向是互相融合优势互补,方可更好地赋能新药开发。

02 人工智能在前列腺癌诊疗中的应用

陈锐医生从前列腺癌诊疗研究现状出发,介绍了前列腺癌诊疗面临的挑战,并分享了AI在前列腺癌影像诊断、病理诊断、构建患者分子分型中的应用以及团队通过人工智能模型分析多模态体检数据辅助早期诊断的相关研究。

前列腺癌诊疗研究现状

◽ 前列腺癌流行病学数据

前列腺癌是全球男性发病率第二的恶性肿瘤。虽然过去我国前列腺癌发病率不高,但近年来其发病率逐年增长,已从排名第十三位跃迁至第六位,年增长率为13%。随着我国肿瘤筛查的普及和老龄化趋势的加剧,前列腺癌将成为影响老年男性健康主要疾病。

◽ 前列腺癌诊疗面临的挑战

目前,我国前列腺癌的诊疗已经走在世界前列,陈医生所在的团队的微创手术技术已经处于国际一流水平,达芬奇机器人、国产机器人等技术不断更新迭代,手术治疗效果越来越好。

但是,前列腺癌诊疗仍然面临着两个难题:第一是早期诊断。首先,早期的前列腺癌缺乏症状,许多病人直至转移都很难发现。其次,不同病人的肿瘤差异程度不同,有些恶性程度高,进展快的肿瘤是最需要尽早诊断并及时治疗,而有些肿瘤恶性程度较低,可以进行积极地主动监测。所以如何诊断出高度恶性的前列腺癌是一个具有挑战性的问题。陈医生团队探索了研究诊断新方法,通过将欧美人群中研发的PSA指标“中国化”,提出符合中国病人的诊断策略,同时也研发出新型的分子诊断标志物,提高了诊断效果。第二个难题是晚期阶段的治疗。前列腺癌发展到晚期以后,可以选择的治疗方法非常有限,急需对耐药的晚期前列腺癌患者进行分子分型,从而有针对性地找到合适的治疗药物。陈医生所在团队也致力于前列腺癌的晚期分子分型和精准治疗方面,提出了相关的治疗策略,疗效获得一定的改善,但距离满意的治疗效果仍有差距。

AI在前列腺癌中的应用现状

2023年2月,由长海医院、仁济医院、华东理工大学的学者组成的医工融合团队探讨了人工智能在前列腺癌诊疗中的应用,结合团队研究成果,编撰了《人工智能在前列腺癌诊疗中的应用》一书。目前,人工智能在前列腺癌领域最成熟的应用是前列腺癌病理诊断和影像学诊断。

◽ AI在前列腺癌影像诊断中的应用

很多病人的肿瘤指标PSA升高,但不一定都患有前列腺癌,盲目对所有患者进行穿刺会给没有肿瘤的患者带来不必要的麻烦。针对这样的情况,影像科医生开发了多参数磁共振,它能同时获取多个加权图像的信息,提示出前列腺组织可疑区域,再根据可疑区域进行穿刺活检,被称为“磁共振引导的靶向穿刺”,目前这种精准的方法已经在临床得到应用。但是,经验丰富的前列腺影像科医生数量非常有限,通常集中在大城市、大医院,导致了很多中小城市及小医院无法完成获得很好的读片效果。目前,已经有团队将AI应用于磁共振图像中的肿瘤病灶识别并获得了很好的效果,预计这一技术很快将进入临床辅助影像科医生和泌尿外科医生进行前列腺穿刺的决策。

◽ AI在前列腺癌病理诊断中的应用

数字病理和人工智能的应用,正在不断地改变以往的病理诊断方式。数字切片扫描仪可以将病理切片数字化,一张如大拇指般大小的病理切片,可以放大后扫描为数据量高达2-3GB的清晰全景病理扫描切片。通过让人工智能学习人工勾画的肿瘤区域,训练人工智能模型,从而帮助病理科医生筛选出其中的肿瘤区域,目前也有相对成熟的模型,可以减轻病理科医生的负担,也将在近几年投入临床使用。

◽ 探索AI辅助建立前列腺癌患者的分子分型

乳腺癌的分子分型已走在多种肿瘤的前列,医生可根据患者不同的分子分型采取不同的治疗方案。相比之下,前列腺癌的分子分型还处于起步阶段,科研团队尝试利用人工智能,结合已有临床患者的大数据,探索前列腺癌分子分型的研究。目前已经取得了初步的研究成果,未来也有望应用于临床诊疗决策中。

◽ 人工智能分析多模态体检数据,实现前列腺癌高风险的人群预警

随着人口老龄化,我国前列腺癌筛查的负担将不断加重,如果能用常规的体检信息作为前列腺癌筛查依据,将有望减少不必要的穿刺,减轻医疗机构负担,降低国家医疗成本。陈医生团队综合包括上海、南京、韩国首尔、中国香港等地区的多家医院的数千人的临床数据进行分析,运用XGBoost人工智能算法构建了具有可解释性的诊断预测模型,这一模型可以在保证检出率的同时,减少38%的不必要穿刺。

ChatGPT能否替代医生诊疗

今年JAMA内科学杂志报道了一项研究,研究从国外的医患咨询网站收集问题,用这些问题测试ChatGPT的性能,结果显示,与医生的在线回复进行对比,研究结果显示ChatGPT的评分甚至优于医生的在线回复。

同期,陈医生团队也在国际转化医学期刊Translational Journal of Medicine上发表了ChatGPT在前列腺癌问诊、咨询、医学教学中应用的研究。团队设计了22个患者可能会询问的与前列腺癌诊疗相关的问题,研究人员发现ChatGPT针对大部分问题都能给出很好的答案,尤其是前列腺癌分期、分级、常规治疗方法等常规问题的回答非常准确;但针对有一定挑战性的、需要综合分析患者病情的问题,ChatGPT尚且不能很好地回答。

该研究共评估了ChatGPT、Perplexity、YouChat等多种主流的语言模型,研究人员发现ChatGPT是评分最高的模型,相比其他模型有更高的准确率、更好的人文关怀、更强的稳定性。陈医生认为目前ChatGPT还不能替代医生,但是可充分利用ChatGPT更好地辅助诊疗。另外,基于法律以及伦理的考量,人工智能无法承担误诊所带来的后果和法律责任,这也是人工智能在医疗产业中应用时需要考量的一个问题。

未来展望

未来人工智能如何帮助医生提升疾病诊疗效果?设想人工智能系统可将病患的健康信息与筛查中心联网,对病患数据进行分析,包括常规体检信息、生活习惯以及肿瘤标志物的情况,判断病患是否有患病风险,是否需要做穿刺病理等进一步的检查。针对需要穿刺的患者,人工智能可辅助医生进行图像分析;针对需要手术的患者,人工智能可以辅助医生开展机器人手术;术后也可利用人工智能优化随访方案,提高随访效果。最后,陈医生表示,面临前列腺癌诊疗的诸多挑战,需要更多信息工程学、药学领域的研究者联手合作,共同攻克难题。

03 人工智能在mRNA疫苗研发中的应用

陈庚博士从技术层面介绍了AI在mRNA疫苗研发中的应用,包括mRNA序列的优化、个性化肿瘤疫苗的开发和用于鉴定肿瘤新生抗原的SmartNeo分析平台的搭建。

AI在mRNA疫苗研发中的应用

人工智能技术在mRNA领域能发挥非常重要的作用,可应用于mRNA各相关领域。例如:在各mRNA疫苗研发管线的上游重要环节中,AI可基于生物信息学进行靶点筛选,也可优化mRNA序列。

mRAN疫苗优势

mRNA技术具有多方面优势,与传统的灭活疫苗相比,mRNA疫苗研发生产的周期短,而且安全性好、易于放大生产等

mRNA疫苗研发面临序列优化的挑战

mRNA疫苗的研发基本都会涉及到序列优化。因为mRNA疫苗的研发通常基于抗原设计,抗原是氨基酸序列,绝大部分氨基酸都可由至少两个密码子编码。一个完整的mRNA结构,通常包含5’端的帽子和非编码区(UTR),及3’端的UTR和Poly(A)尾巴,中间是编码抗原的编码区。因此,mRNA每个元件都可能会影响 mRNA的翻译效率和稳定性。把抗原转化为mRNA序列来编码会面临诸多挑战,究其原因是密码子与氨基酸的复杂对应关系。比如人体有64个密码子,但这些密码子只编码20种氨基酸,所以一个氨基酸可能对应多个密码子,每个氨基酸选择哪一个密码子来编码非常讲究。以新冠的刺突蛋白为例,它有超过1200个氨基酸,如果通过密码子去编码刺突蛋白,编码氨基酸序列有10的632次方种可能,究竟选择哪一条mRNA序列好极具挑战,人工智能技术可以帮助筛选优化mRNA序列。

AI在mRNA序列优化中的应用

已有研究表明,密码子的选择会影响mRNA序列的稳定性和翻译效率。因为有些密码子在细胞里使用频率较高,但是有些编码同一个氨基酸的密码子使用频率可能会较低,所以选择使用频率较高的密码子可潜在提高mRNA翻译成抗原的速度。但也不能单一地选择使用频率高的密码子编码氨基酸,这样可能会造成mRNA序列的不稳定,序列设计需要综合考虑多方面的因素。

斯微与百度合作开发了名为LinearDesign的AI算法,用于mRNA序列优化与设计,成果刚发表在Nature正刊上。这个算法是从mRNA最小自由能(MFE)和密码子适应指数(CAI)综合考虑,进行mRNA序列的设计与优化。理论上,mRNA的二级结构越稳定,在细胞内表达时间越长,而密码子适应指数可反应mRNA翻译成蛋白的速度。如果mRNA翻译速度快且稳定,则蛋白表达量就能越高。因此,综合考虑这两种重要因素才有可能设计出理想的mRNA分子。这篇Nature文章中的研究结果显示,利用LinearDesign算法优化后的新冠mRNA疫苗序列,不仅能够提高mRNA的稳定性和蛋白表达量,而且该疫苗能够在体内诱导更高的结合抗体、中和抗体和细胞免疫水平。同时,在测试水痘和带状疱疹mRNA序列中显示,优化的mRNA序列也具有更高的稳定性和蛋白表达水平,并在体内诱导产生了更高的结合抗体。

显然,人工智能在mRNA序列设计及优化上面能发挥非常大的作用,能够快速设计出表达高且稳定性好的mRNA序列,极大地促进了mRNA疫苗的研发。

AI在mRNA个性化肿瘤疫苗开发中的应用

◽ mRNA个性化肿瘤疫苗开发流程

通常是首先获取患者肿瘤组织样本进行测序,鉴定肿瘤新生抗原,设计相应的mRNA疫苗,再将mRNA疫苗注射到患者体内,人体内的抗原呈递细胞摄取这些抗原,包括DC细胞或者是B细胞,把抗原呈递给T细胞,激活患者体内CD8细胞和CD4 T细胞,然后CD8和CD4 T细胞识别肿瘤表面呈递出来的特异性抗原,并对这些肿瘤细胞进行相应的杀伤或消灭。

鉴定具有免疫原性的高质量新生抗原是mRNA个性化疫苗开发上游的关键。

目前,已有研究表明,肿瘤新生抗原产生的方式多种多样,包括基因组层面各种突变产生的抗原,也包括RNA层面可变剪切或编辑,还有一些非经典的翻译以及蛋白翻译后修饰等方式,都能产生肿瘤新生抗原。并且,已有研究表明,不同种类的肿瘤,其突变负荷和肿瘤新生抗原产生的频率都不一样,相对其他癌种,黑色素瘤、肺癌和胃癌等瘤种的肿瘤突变频率和新生抗原产生频率均较高,这些患者可能更容易筛选出更多的新生抗原。另外,即使同一个癌种里面,不同个体之间肿瘤新生抗原产生的频率也有很大差异。因此,设计一个好的个性化mRNA肿瘤疫苗,需要鉴定具有免疫原性的高质量新生抗原。

鉴定高质量新生抗原犹如大海捞针,原因在于:每个肿瘤患者的肿瘤细胞可产生成千上万的能够改变蛋白序列的突变,相关研究表明含有突变的肽段能够被人体的MHC结合的比例可能只有1%左右,能够被T细胞识别的可能只有0.5%左右,在肿瘤细胞里面能够有效处理并进行抗原呈递的可能只有0.3%左右,最终能够激活患者体内T细胞免疫反应的会更少。因此,鉴定真正具有免疫原性的新型抗原需要克服多方面的困难。所以,研究人员可利用人工智能帮助鉴定与筛选高质量的新生抗原。

SmartNeo分析平台

陈博士带领团队开发了一个能鉴定高质量肿瘤新生抗原的SmartNeo平台。该平台能够基于患者多组学测序数据,进行数据质控,鉴定患者肿瘤组织中特有的突变,分析患者的HLA分型,获得肿瘤组织中基因和转录本表达图谱,以及突变在不同组学维度的特征等,最终基于相应的AI方法和模型,鉴定筛选出高质量抗原HLA-I型和HLA-II型新抗原,形成了一站式的分析平台。

为了测试分析SmartNeo平台鉴定高质量新生抗原的性能,以2020年发表在cell上的TESLA (Tumor Neoantigen Selection Alliance, 肿瘤新抗原选择联盟)的标准测试数据集为基准,对比近年文献报道其他新生抗原分析平台,研究发现SmartNeo平台与其他平台相比,分析速度能够提升至少两倍,而且能够鉴定更多高质量的新生抗原。收集斯微国内外开展的临床实验结果,显示SmartNeo平台预测引起免疫反应的抗原比例也高于其他的文章报道。整体上,SmartNeo分析平台相对其他平台更具优势。

总结

人工智能在生物医药领域发挥着越来越大的作用,不仅可降低研发成本,缩短研发周期;在mRNA领域的序列优化方面,AI能够快速地鉴定筛选出表达更高、稳定性更好的序列;在mRNA个性化肿瘤疫苗研究方面, AI能够帮助鉴定高质量的新生抗原,更高效分析测序大数据。

Science Café 沙龙

Science café 沙龙是由上海市药物研发协同创新中心与浦东国际人才发展中心共同举办,集信息交流、头脑激荡、创意融合的跨界协调合作的平台。一期一会,一杯咖啡,汇聚集体智慧,多角度探讨生物医药的创新前沿话题。自2014年起,已累计举办40余期品牌沙龙活动。

若您有感兴趣的生物医药创新前沿话题或有合作意向,欢迎通过以下方式与我们取得联系,期待与您携手共进。

联系人:凌女士

联系电话:58336301、15000788873

end.

文章、图片来源:上海市药物研发协同创新中心公众号(改)

如有侵权,请后台联系小编删除

标签: #对应分析可以用来表示