欢迎进入UG环球官网(环球UG)!

新2手机管理端网址(www.9cx.net):AI新算法登Nature封面!解决医疗数据隐私问题,逾越联邦学习?

admin3个月前34

欧博亚洲

欢迎进入欧博亚洲(www.aLLbetgame.us),欧博官网是欧博集团的官方网站。欧博官网开放Allbet注册、Allbe代理、Allbet电脑客户端、Allbet手机版下载等业务。

,

智器械(民众号:zhidxcom)

编译 | 杨畅

编辑 | 李水青

智器械6月15日新闻,机械学习领域新希望又一次登上国际学术期刊《自然》(Nature)封面。

德国波恩大学的研究职员团结惠普公司以及来自希腊、德国、荷兰的多家研究机构配合开发了一项连系边缘盘算、基于区块链的对等网络协调的漫衍式机械学习方式——群体学习(Swarm Learning,以下简称SL),用于差异医疗机构之间数据的整合。

研究职员基于1.64万份血液转录组和9.5万份胸部X射线图像数据,使用SL为白血病、肺结核和肺部疾病、COVID-19开发疾病检测分类器,发现SL在知足保密规范的同时优于单个医疗机构开发的分类器。算法识别出患病个体的准确率,在血液转录组数据集中平均为90%,在X射线图像数据集中显示为76%-86%。

该论文问题为《用于 *** 化且保密临床数据剖析的Swarm Learning机械学习手艺(Swarm Learning for decentralized and confidential clinical machine learning)》,于5月26日揭晓在Nature上。

论文链接:

一、比联邦学习更平安,SL可保障医疗数据共享精准医疗的目的是能快速准确地检测出患有严重疾病和异质性疾病的患者,而机械学习有助于实现这一目的,例如凭证病人的血液转录组数据来识别是否患有白血病。然而,应用到现实还存在许多问题。

基于人工智能(AI)的疾病诊断方式,本质上不仅依赖于适当的算法,更依赖于大型训练数据集。由于医学数据自己是涣散的,医疗机构内陆的数据量通常不足以训练出可靠的分类器。因此,凭证医疗数据构建出的模子,仅能解决内陆问题。

从人工智能角度,将各地医疗数据举行集中处置是更好的选择,但这存在难以阻止的缺陷。包罗数据流量问题,以及对数据所有权、保密性、隐私性、平安性和数据垄断等情形的担忧。

因此,需要更有用、准确、高效的解决方案,而且能够在隐私和道德方面实现保密要求,还要举行平安和容错设计。

联邦学习方式(Federated Learning)解决了其中的一些问题。数据保留在数据所有者内陆,保密性问题获得解决,但参数设置仍要中央协调员协调。此外,这种星型架构降低了容错能力。

相比于已对照盛行的联邦学习方式,更好的选择是接纳完全 *** 化的人工智能解决方案,即SL来战胜已有方案的不足,顺应医学领域固有的涣散式数据结构以及数据隐私和平安律例的要求。

SL具有以下优势:(1)将大量医疗数据保留至数据所有者内陆;(2)不需要交流原始数据,从而削减数据流量;(3)提供高级其余数据平安保障;(4)能够保证网络中成员的平安、透明和公正加入,不再需要中央托管员;(5)允许参数合并,实现所有成员权力均等;(6)可以珍爱机械学习模子免受攻击。

从看法上讲,若是内陆有足够的数据和盘算机基础设施,机械学习就可以在内陆举行。

对比几种机械学习方式,研究职员发现,基于云的机械学习(Central Learning)会发生数据集中移动,可用于训练的数据量大大增添,相比于数据和盘算在不相关地址的Local Learnling方式,机械学习的效果获得改善,但存在数据重复、数据流量增添以及数据隐私、数据平安等方面的问题。联邦学习方式使用专用参数服务器认真聚合和分发,其他中央结构仍被保留。SL,省去专用服务器,通过Swarm网络共享参数,而且在各个节点的私有数据上自力构建模子。

四种机械学习方式对照

SL提供平安措施以支持数据 *** ,这由私人允许的区块链手艺实现。每个介入者都有明确的界说,只有预先授权允许的介入者才可以执行生意。新的节点加入是动态的,有适当的授权措施来识别网络介入者。新节点通过区块链智能合约注册,获取模子,并执行模子的内陆训练,知道知足界说的同步条件。接下来,模子参数通过Swarm应用程序编程接口(API)举行交流,并最先下一轮,合并确立一个具有更新参数设置的更新模子。

在每个节点,SL分为中央件和应用层。应用环境包罗机械学习平台、区块链和SLL。应用层则包罗模子,例如剖析来自白血病、肺结核和COVID-19患者的血液转录组数据或放射影像等获得的模子结构。

二、训练样本削减50%时,SL性能仍更优研究共展示了四个案例:

案例一是,使用12000多位患者的外周血单个核细胞(PBMC)转录组数据组成的三个数据集(A1-A3,包罗两种类型的微阵列和RNA测序),以及默认设置的延续深度神经网络算法来举行测试。

针对每个真实天下场景,样本被分成不重复的训练数据集和一个全局测试数据集,用于测试在单个节点上SL确立的模子。训练数据集以差其余漫衍方式被“隔离”在每个Swarm节点上,来模拟临床医疗上的相关场景。

新2手机管理端网址

www.9cx.net)实时更新发布最新最快最有效的新2手机管理端网址,包括新2手机网址,新2备用网址,皇冠最新网址,新2足球网址,新2网址大全。

急性髓细胞白血病(AML)患者的样本作为病例(cases),其他所有样本作为对照组(controls)。模拟中的每个节点,都可以代表一个医疗中央、一个医院网络、一个国家或任何其他自力的组织,这些组织会发生有隐私要求的内陆医疗数据。

SL检测白血病

首先,把病例和对照组不平均的漫衍到节点(数据集A2)和节点上,发现SL效果优于单个节点的性能。在这种情形下,中央模子的显示仅略好于SL。使用数据集A1和A3测试同样有异常相似的效果,这强烈支持了SL性能的提高跟数据网络或者数据天生手艺(微阵列或RNA测序)无关的看法。

另外五个场景同样在数据集A1-A3上举行了测试:(1)在测试节点使用平均漫衍的样本,其病例和对照组比例与第一个场景中的相似;(2)使用平均漫衍的样本,但未来自特定临床研究的样本脱离,使训练节点和节点之间有差其余病例和对照组比例:(3)增添每个训练节点的样本巨细;(4)在专用训练节点使用差异手艺天生的伶仃样本;(5)使用差其余RNA-seq手艺。在这些场景中,SL的显示都优于单节点性能,而且靠近或者和中央模子性能相同。

急性淋巴细胞白血病(ALL)患者的样本同样在这几个场景下举行了测试,将诊断局限扩展至以四种白血病类型为主的多类问题。

案例二是,用SL从血液转录组数据中识别肺结核患者。

基于肺结核样本,将病例和对照组比例平均漫衍在各节点中。效果显示,在这些条件下,SL的性能优于单节点性能,而且显示略好于中央模子。研究仅对流动性肺结核举行诊断。将隐蔽熏染的肺结核患者作为对照组,样本和对照组保持平均漫衍,但削减用于训练的样本数目。在这些更具挑战性的条件下,虽然SL整体性能有所下降,然则SL性能仍然优于任何单节点性能。

训练样本削减50%时,SL仍然优于单节点性能,不外这时单节点和SL性能都对照低。然而与一样平常条件下的考察效果一致,SL性能与中央模子对照靠近:训练数据增添时人工智能的显示更好。将三个节点的训练数据分成六个较小节点时会降低每个节点的性能,然则行使SL发生的效果并没有变差。

SL检测肺结核

由于肺结核具有地方性特征,肺结核样本可以用来模拟潜在发作的情景,以便确定SL的优势和潜在限制,进而研究确定若何解决这些问题。

由节点模拟的三个自力区域已经有足够的但差异数目的病例样本,在这种情形下,SL的效果险些和之前没有什么转变。而案例和对照组最少的节点性能显著下降。测试节点的案例比例降低导致节点性能变差。

案例三是,使用一个大型的公然胸部X射线图像数据集来解决多类展望问题。SL在展望所有放射学发现(肺积水、渗透、浸润和无发现)方面优于每个节点的性能,这解释SL也适用于非转录组数据领域。

案例四,讨论了SL是否可以用于检测COVID-19患者。虽然通常COVID-19是使用基于PCR的检测方式来检测病毒RNA。但在病原体未知、特定病原体检测尚不能能、现有检测可能发生假阴性效果等情形下,评估特定宿主反映可能是有益的,而研究血液转录组有助于领会宿主的免疫反映。

SL检测COVID-19

作者通过在欧洲招募更多的医疗中央来获取数据,这些中央在岁数、性别和控制疾病的水平上有差其余患者漫衍,由此天生了八个单怪异定中央子数据集。

SL可以应对性别、岁数或双重熏染等误差,并在区分轻度和重度COVID-19患者时,SL的显示优于单节点性能。证据解释,来自COVID-19患者的血液转录组代表了一个可以应用SL的特定领域。

三、SL远景广漠,加速全球精准医疗协作随着各方都在关注若何增强数据隐私和平安问题以及削减数据流量和重复, *** 化的数据模子将成为处置、存储、治理和剖析任何类型的大型医疗数据集的首选方式。

稀奇是在肿瘤学方面,基于机械学习的肿瘤检测、亚型剖析和效果展望都取得了阶段性乐成,然则其希望受到数据集规模有限的阻碍,现在的隐私律例使得开发集中式人工智能系统的吸引力降低。

SL作为一种 *** 化的学习系统,取代了当前跨机构医学研究中数据共享的范式。

对于试图损坏Swarm网络的人,SL的区块链手艺提供了强有力的应对措施。SL通过设计提供了保密的机械学习,可以继续差分隐私算法、函数加密或加密专用学习方式方面的新希望。

全球协作和数据共享异常主要,而且SL在这两个方面存在固有优势,而且更大的优势是不需要数据共享而直接转化成知识共享,从而实现完全数据保密条件下的全球协作。

事实上,立法者强调的隐私规则在发生大规模盛行病时完全适用。稀奇是在此类危急中,人工智能系统需要遵守道德准则而且尊重人权。像SL这样的系统——允许公正、透明和被高度羁系的共享数据剖析同时珍爱数据隐私——将受到青睐。

研究职员以为应该探索SL凭证X射线图像或CT扫描效果、结构化康健纪录数据或者来自于疾病跟踪的可穿着装备数据,来对COVID-19举行基于图像的诊断。

SL用于转录组学(或其他医学数据)剖析是异常有前途的方式,可以在医学领域的推广人工智能的使用,同时提高数据保密性、隐私和数据珍爱水平,以及削减数据流量。

结语:全球疫情靠山下,期待SL施展作用这篇研究证实晰SL的性能的可靠性。在全球疫情一直连续的情形下,病毒不停发生新的变种,对于各国医疗机构都是一种挑战。若是行使SL手艺在数据保密的情形下对全球相关的医疗数据举行整合剖析,更快诊断病情,可能对控制疫情会有主要辅助。

上一篇 下一篇

猜你喜欢

网友评论

  • 2021-07-08 00:00:53

    usdt跑分平台菜包钱包(caibao.it)是使用TRC-20协议的Usdt第三方支付平台,Usdt收款平台、Usdt自动充提平台、usdt跑分平台。免费提供入金通道、Usdt钱包支付接口、Usdt自动充值接口、Usdt无需实名寄售回收。菜包Usdt钱包一键生成Usdt钱包、一键调用API接口、一键无实名出售Usdt。都不用我夸了

随机文章
热门文章
热评文章
热门标签