您现在的位置:首页 > 职场快讯 > 职讯 >

解决志愿者招募难题:临床试验中的人工智能

来源:澎湃新闻 | 发布时间:2019-11-30 23:52:23 |  访问:1701

原创: 爱看书的 复旦青年

青年副刊为《复旦青年》学术思想中心出品:共分为思纬、研论、天下、读书、专栏、同文、诗艺、灯下八个栏目,与你探讨历史、时事、艺术等话题。

书必同文,多闻阙疑。同文为您译介多领域优秀的外文文章,为您打破语言壁垒,提供新的观点和视角。

临床志愿者的招募始终困扰着美国医疗试验的研究人员们,这对于他们而言太过花费时间精力,却又难有进度,实验要求的志愿者条件特殊,而符合条件的患者与研究人员之间,又不一定有着良好的沟通途径。近来,一些项目正尝试着通过大数据与算法的综合运用来加速临床试验的推进。没有试验者的试验,已经成为可能。

原文作者:marcus woo

原文标题:trial by the artificial intelligence

来自《自然》2019年9月26日刊

复旦青年记者 段旭昶 肖淑芳 翻译

复旦青年记者 何本华 编辑

▲原文插图:totto renna/图源《自然》杂志

临床志愿者的招募始终困扰着美国医疗试验的研究人员们,这对于他们而言太过花费时间精力,却又难有进度,实验要求的志愿者条件特殊,而符合条件的患者与研究人员之间,又不一定有着良好的沟通途径。近来,一些项目正尝试着通过大数据与算法的综合运用来加速临床试验的推进。没有试验者的试验,已经成为可能。

凯文·休斯(kevin hughes)急需志愿者。1994年,在波士顿的麻省总医院(massachusetts general hospital)的这位乳腺癌外科医生开展了一项临床试验,他们希望探究手术后使用他莫昔芬(tamoxifen)这种药物并进行放射性治疗的有效性。尽管这非常普遍,但其有效性仍值得商榷,尤其是针对那些高龄的妇女。

研究者试图寻找年龄70岁以上,罹患一定大小的特定种类乳腺肿瘤的患者来开展研究。在美国,每年大约有4万女性符合试验标准,他们打算从中征募636人。虽然636人并不多,但对临床实验来说已经足够,然而,征集志愿者却花费了他们整整五年时间。志愿者征集是临床实验开展的困境之一。“在很多情况下,医学研究效率极其低下,”美国加利福尼亚州拉由拉市(la jolla)斯克里普斯转化医学研究所(scripps research translational institute)主任埃瑞克·托普尔(eric topol)这样说。一项针对从2000年1月到2019年4月临床试验成功率调查的分析显示:大约只有12%的药物临床实验最终获得成功。大多数临床实验失败的原因在于它们没有阐明一项医疗措施的有效性或安全性,或是研究设计存在漏洞,或是经费短缺,或是参与者中途退出。无法招到足够数量的志愿者也使临床实验宣告失败。实验的过程中输入和拷贝数据、统计参与者使用剂量,也存在着延迟、不准确等大量无效性因素。

为提高临床试验成功率,学术界和制药工业的研究者们将目光转向了ai。输入大量人体健康数据后,在精巧的算法助力下,ai就拥有助力临床试验,扩展治疗手段和节省大量金钱的潜力。“临床实验的改善将取得一大进展。”休斯说。

▲临床实验成功率的统计/图源《自然》杂志

理解人类语言

休斯带头的这个试验是成功的一例。尽管放射疗法这额外的一步降低了乳腺癌复发率,它却并没有对患者整体的存活率产生影响。至少对年纪较大的女性来说,多出的开支及放射疗法带来的风险可能超出这一疗法本身带来的好处。一项后续的研究得出了同样的结论。休斯说,如果他和他的同事们能够更快地招到人,他们或许可以更快地得出结论,这样也就能更早地通知女性患者。此外还可以让研究者们转而投入其他亟待解决的问题上。

招募工作通常是试验中最费时间和金钱的一步。2016年的一个研究表明,在美国国家癌症研究所国家临床试验网络(us national cancer institute’s national clinical trials network)2000年到2011年期间开展的癌症试验中,有18%的癌症试验经过三年甚至更长时间的寻找之后,仍然招不到它所需要患者数量的一半,或者因为报名的志愿者实在太少干脆放弃了该项试验。经估算,20%的癌症患者适合参与类似试验,但真正参与的不超过百分之五。“志愿者招募是临床试验的第一障碍,”来自纽约哥伦比亚大学(columbia university)的生物信息学家翁春华(chunhua weng)说。

很多人希望ai能够改变这一困境。ai的一个分支,自然语言程序(natural language processing,nlp),使电脑能够分析出手写和口述的字词。如果运用到医学上,该技术就能让算法对医生给病人写的笔记和病理报告进行搜寻,从中找出适合参与特定临床试验的人。

一个挑战是上述文件的内容很多是自由形式,且不成框架,而有价值的信息可能是隐晦的,需要一定的背景知识和语境才能理解。比如医生可以用几种方式描述同一个概念------心脏病发作可以被称作心肌梗塞,心肌梗死亦或简单的“mi”。但一个nlp算法也能学习已经被研究者注解过的医学记录样本,经过这样的训练以后,获得挑拣同义词的能力,然后用自己获得的知识去解读那些未经注解的医学记录。

人们正在为电脑能够更好解释临床试验记录而努力着。试验中包括或未包括进去的标准都常以普通文本的格式写下。所以医院想要在患者数据库中搜集适合参与试验的人,就必须先以标准化的且编码化的问题表格将这些标准翻译成数据库能够理解的东西。翁春华和她的同事开发了一个叫做“标准查询”(criteria2query)的资源开放式网络工具,通过运用nlp,使得研究者和管理者不需要掌握数据库查询语言就能够进行数据库检索。

▲开源网站criteria2query便利研究者搜索数据库

图源《自然》杂志

ai同样可以帮助患者自己查找临床试验。习惯上,人们依赖医生告诉他们适合自己参与的研究。临床试验网(clinicaltrials.gov)列出美国及其他209个国家开展的多达30万个研究项目供患者查找。除了令人目眩的庞大规模,专业性强的选拔标准也让公众感到很难理解。“太复杂了,”哥伦比亚大学内科医生和生物信息学家爱德华·肖特利弗(edward shortliffe)谈道。

为了帮助患者弄懂选拔标准系统,翁春华和她的同事创造出另一个资源开放式网络工具,名为“dquest”。这个软件读取临床试验网上的试验,用通俗的文字表述其问题,例如“你的bmi是什么?”之类,以此检测使用者的资格。一项初始评价显示,经过50个问题之后,这个工具能够过滤掉60%~80%的不符合试验要求的使用者,精准率超过60%。

商业利益

翁春华研发的工具还具有很大的提升空间,机器算法依赖大量的学习,为了开发出它们的潜能,ai需要大量的有效数据。但是,标记数据所需的重要特征(这是训练nlp算法所必需的)是非常耗时的,翁春华说,“学术界所面临的一大问题就是数据和人力都相当有限。”

相比之下,工业更有克服这些障碍的能力,过去的几年中,他们就开展了大量的活动。例如,纽约市的一家数字健康公司开发了一种帮助人们寻找实验参与者的软件,不少关注医疗保健的公司都用它寻找参与者。另一款由加州帕萨迪纳市(pasadena)人工智能试验招聘公司“deep 6 ai”开发的软件,被加州洛杉矶雪松-西奈·斯密特心脏研究所(cedars-sinai smidt heart institute)的研究人员用来寻找实验对象,他们在一小时内找到了16名合适的参与者,而传统的方法在六个月内只能找到两个人。

明尼苏达州罗彻斯特市(rochester)的梅奥(mayo)诊所进行的另一项试点研究中,ibm的“沃森临床试验匹配系统”(watson for clinical trial matching system)使乳腺癌试验的月平均注册人数增加了80%。该系统由ibm的沃森超级计算机提供动力,虽然许多计划中的应用还没未取得成果,但将参与者匹配到临床试验是其重要的一步。今年3月,ibm与健康调查系统(health quest systems,现成为美国一家非盈利医疗机构努云斯健康的分部 )签署了一项协议,这家由纽约和康涅狄格州的四家医院组成的非盈利网络将使用ibm的试验匹配系统,以帮助他们的实验。

虽然这类科技大多看上去具吸引力,但它们仍然有局限性。“它们不像传闻中那样神奇”,哥伦比亚大学生物医学信息学家诺艾米·埃尔哈德(neomie elhadad)说道。

例如,为了训练nlp算法,大量数据标记需要手工完成,截至目前还没有替代方法。“现在没有一个nlp引擎可以理解从医生那边获取的所有临床记录。”埃尔哈德指出,医学领域和ai之间的差异太过悬殊。“我们都在努力,但要让ai读懂所有的临床文献,我们还有漫长的路要走。”

并非所有的人都相信花费在寻找试验者的努力是值得的。“病人匹配被大肆炒作”,纽约辉瑞(pfizer)药业公司开发部前主任克雷格·李普塞特(craig lipset)说,“但说实话,许多的临床实验不需要智能来推动匹配。”大多数研究的选拔标准并不复杂,他说。并且即便人工智能算法相较于传统算法可以更快识别合适的人,或者找到可能被遗漏的人,使用第三方工具的研究人员将必须在不违反隐私政策的基础上应对和个人联系的挑战。

但一些调查人员认为调配好这些系统将会有可观的回报。在2014年,全世界86%的临床实验参与者是白人。2019年的一项研究发现,79%的基因数据来自欧洲地区,即便他们只占世界人口总数的16%。ai驱动的病患匹配算法可以为任何有需要的人提供参与的机会,从而形成更加多样化的实验群体,而并不仅仅是对那些认识对应的医生或者住在大型健康实验机构附近的人进行实验。“这真的会将医学推向平等,”埃尔哈德说。

优化设计

ai还可用于临床实验的设计,每一项临床试验都遵循一份详细实验步骤,实验过程中出现任何需要修改步骤的问题,都可能会导致数月的延误,并增加数十万美元的成本。李普塞特说:“如果步骤是正确的,药物开发就会更快、更便宜。”

在设计一项实验时,研究人员通过多种来源获得信息,包括比较实验、临床数据和监管信息。ai不仅能更快地处理这些问题,相较于人,它还能核对更多的数据。李普塞特说:“这是一个利用ai的机会。”

建于加州圣地亚哥(san diego)的公司“trials.ai”将其人工智能工具描述为设计更好试验方案的数据驱动指南。它使用nlp和其他人工智能技术来收集和分析公开数据,例如期刊论文和药品标签,以及和该公司合作的药物或医疗设备公司拥有的私人数据。从这些数据中,公司的软件可以帮助客户确定计划实验的各方面,例如其选拔标准的严格程度,可能对成本、时间或参与者保留率等因素有何影响。“我们想看看不同的成功标准与什么有关。”该公司的首席科学家大卫·福格尔(david fogel)说。

例如,如果一个客户想要测试一种治疗糖尿病的药物,调整人们参与试验所需的最低糖化血红蛋白(一种用于诊断糖尿病的血液蛋白)水平,就可能会导致不同的试验结果。如果合格标准太低,药物而导致的改进可能很难检测到。但如果门槛过高,就可能没有足够多合资格的参与者。查阅文献,进行试验的过程借助人工智能的算法,可以让研究人员快速统计出整个人群的糖尿病数据,并确定合适的水平。

人工智能软件最终提供的不仅仅是指导。李普塞特说:“最终的目标,是让机器写出初步的实验步骤。”

即使是设计良好的试验方案也需要参与者遵循指示。一个简单的错误,比如忘记在正确的时间服药,都可能会威胁到研究结果的准确性。纽约的数据分析公司“aicure”正在开发一种可能的解决方案。它提供了一个平台,让人们可以用智能手机记录自己服药的视频。通过使用计算机视觉算法分析这些图像,“aicure”的软件可以识别患者和药片,并确认是否按处方服用。一项针对精神分裂症患者的研究显示,使用“aicure”平台的患者中,约90%的人按处方服药,相比之下,有72%的患者在服药期间会受到针对他们的定期监控。该公司表示,这种软件甚至可以分辨出人们的面部表情和跟踪他们对治疗的反应,这可以指导治疗的进程。

寻求验证

总的来说,人工智能在临床试验上,在医疗保健领域中的许多功能,都被夸大了。“这样的事情大多发生在理论领域,托普尔说。这就引出了该领域的一个主要挑战:如何证明人工智能技术确实能够改善试验。“验证是关键,”李普塞特说,“我们需要知道它是有能力的。我们需要向监管机构出示证据,让他们也有信心。”

但除了少数试点研究和案例研究外,对人工智能如何改善临床试验的评估很少。托普尔说,即使是更先进的人工智能技术,如用于医学图像分析的技术,也缺乏严格、大规模的试验。承诺和证明之间还有很大的差距。他说:“希望不久我们就能填补这一空白。”

企业正在采取行动,评估它们ai的性能。例如,“trials.ai”公司的首席执行官兼联合创始人金?沃波尔(kim walpole)表示,他们正试图量化技术对试验设计的改善程度。她希望这些信息将使得trials.ai可以计算出这款软件将为潜在客户节省多少金钱和时间。

翁春华表示,问题在于缺乏一个评估人工智能工具的共享系统。尽管她的病人匹配软件是开放资源,但是大多数公司仍然用各自的工具,以一种标准化的方式对这些技术进行比较和评估是很难的。

如果这些技术能够发挥其潜力,其影响将是巨大的。休斯说,即使是随机试验——临床试验的典范——也可能会过时。如果来自数亿人的数据是可用的,而且人工智能工具可以精确地分析这些数据,那么像他的乳腺癌试验这样的研究就不需要招募任何人了——这些数据已经存在了。

试验治疗可能仍然需要对照。但即便如此,拥有庞大数据集(如健康电子记录)的人工智能系统也有可能模拟出一群人对治疗的反应。托普尔说,这种性质的虚拟临床试验可以避免制药公司进行一项失败的大型现实试验。这样的模拟在很大程度上是理论性的,但我们可以在一些统计模型中找到起点,例如,这些统计模型被用来模拟心跳不规则的虚拟病人对一种血液稀释药物的反应。

休斯预测,在一种药物被批准后,电子健康记录将显示更广泛的人群的反应,这会取代原来的试验,无论它是否是虚拟的。随着人工智能系统和数据有效性的持续发展,更多的临床研究可能会发生在随机试验的框架之外。“人工智能的真正可能性,”休斯说,“是废除临床试验。”

微信编辑 | 秦思晶

往期精选

对话梁永安:大学生写作的无限可能

当文字照进现实:网络文学中的复旦情怀

原标题:《解决志愿者招募难题:临床试验中的人工智能》

阅读原文

推荐:更多湃客 请关注 今日招聘官方微信公众号

注:本站稿件未经许可不得转载,转载请保留出处及源文件地址。

【 责任编辑:今日招聘网 】

版权与免责声明

【1】凡本网注明"来源:今日招聘"的所有文字、图片和音视频稿件,版权均属于今日招聘网,转载请必须注明今日招聘网,违反者本网将追究相关法律责任。

【2】本网转载并注明自其它来源的作品,是本着为求职者传递更多信息之目的,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。

【3】如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系。

未经招聘网同意,不得转载本网站之所有招工招聘信息及作品 | 招聘网版权所有 2007-2018 |浙公网安备 33010802002895号

网站经营许可证:浙B2-20080178-14 公司招聘招人好网站,就在招聘网 人力资源服务许可证 备案号:浙B2-20080178-14