阅读: 13
一、隐私计算背景
我们正身处于一个信息化世界,信息数据已成为当今时代的核心要素。在党的十九届四中全会决议通过的《中共中央关于坚持和完善中国特色社会主义制度推进国家治理体系和治理能力现代化若干重大问题的决定》中,我国首次将数据增列为生产要素,要求建立健全由市场评价贡献、按贡献决定报酬的机制[1],数据的高效使用及流转是当前时代发展必不可少的一大环节。为了规范化数据的使用、保障数据的安全,我国在2021年陆续颁发了《数据安全法》和《个人信息保护法》[2][3]。但是随着社会信息化的进一步深入,数据使用上的安全性事件层出不穷,有关国家重要单位的数据泄露事件也屡屡发生。
那么如何在保证数据合法、安全的前提下实现数据的高效流转?针对于这个问题,一个新兴的技术逐渐走向了大众的视野——隐私计算。
隐私计算是指在提供隐私保护的前提下,实现数据价值挖掘的技术体系[4],目前主要包括三大核心技术,分别是:联邦学习(Federated Learning)、安全多方计算(Secure Multi-Party Computation)和可信执行环境(Trusted Execution Environment)。 隐私计算基于同态加密和密码学底层协议,可以实现“数据可用不可见”的效果,在满足法律法规和数据安全的条件下,加速数据的流转。
二.医疗行业信息化现状及展望
随着信息化时代的深入,机器学习和深度学习等技术在医疗行业的使用频率逐渐增加,医疗诊断、治疗、康复和监测等环节也逐渐趋向信息化和智能化[5]。据艾瑞咨询预测,我国2021-2025年区域医疗信息化市场空间复合增长率为27.9%,2025年我国医疗信息化市场空间将达到1245亿元[6]。
图1:2021-2025中国区域医疗信息化市场空间(图源:艾瑞咨询)
医疗数据作为一项重要的资产,是医疗卫生领域重要的生产要素,也是反映国民幸福指数的根本依据[7]。但医疗数据往往涉及个人隐私信息,医疗相关人员由于安全性及隐私性等问题,往往不愿共享医疗数据。根据美国HIPPAJournal数据,2009至2020年间,全美共有超过2.68亿份医疗记录遭泄露,这一数字占美国人口的比例超过81.72%[8]。从现实情况来看,大部分医院不同科室的信息不会直接共享,医院和基层机构、药企、医保等多方数据中心也尚未建立合理的信息共享机制[6]。
体系建设的要求势必带来医疗数据的交互利用,而隐私计算则是目前医疗数据合规利用中一项急需应用的技术[8]。
三. 隐私计算在医疗行业的应用场景
根据我们的调研,当前隐私计算在医疗行业主要有四大应用场景,分别是:智慧医疗、医学科研、药物研发和医疗保险,下文将对这四大应用场景进行展开讨论。
3.1 智慧医疗
智慧医疗指的是通过打造健康档案区域医疗信息平台,利用最先进的物联网技术,实现患者与医务人员、医疗机构和医疗设备之间的互动[9]。随着信息化时代的深入和5G技术的完善,智慧医疗在智能诊疗、远程手术、智能电子病历、智慧机器人、移动医护等领域已有了多个典型的应用[10]。
根据我们的调研,隐私计算在智慧医疗领域主要有3个应用场景,分别是:智能医学影像分析、智能电子病历和智能辅助诊断[12]。
3.1.1智能医学影像分析
随着现代医学发展,传统医学影像管理方法已无法适应现代医学影像管理的要求,无胶片化影像科和数字化医院已经成为现代化医疗发展的必然趋势[6]。但目前传统医院正在面临患者多、影像设备多、读片医生少等问题。对于医生而言,每一位患者都需要人工翻阅数百张影像图片,耗时耗力[11],且每个医生的经验、知识水平并不相同。目前来看部分厂商正尝试利用AI技术辅助医生进行诊断,但面临着数据样本有限、数据质量较低等问题(尤其是罕见病例),因此仍无法对多种类型多种器官病灶进行精准的特征描述,也无法对疾病进行精准的预后评估[11]。
通过利用隐私计算的技术,可以安全有效利用影像学数据进行多中心数据协作,提高训练样本数据量和质量,以此提升模型精度和训练效果[12],从而帮助医生更好进行辅助诊断。
3.1.2智能电子病历
电子病历是信息技术和网络技术在医疗领域的必然产物,是医院病历现代化管理的必然趋势,其在临床的初步应用,极大地提高了医院的工作效率和医疗质量[11]。但目前大部分医院面临着电子病历数据不开放共享的现实问题,因此医生临床诊断的准确率和效率无法得到质的提升。
通过利用隐私计算的技术,可以实现区域内医疗信息的安全共享(如:远程病患信息的传输和共享),在隐私计算平台之中可以给医生提供患者各种疾病发生的概率(如传染病预警信息、危重症提示信息等),从而帮助医生更好的对患者进行临床诊疗和指导。
3.1.3智能辅助诊断
上述的智能医学影响分析和智能电子病历有着一个共同的重要作用——辅助医生进行临床诊断。
在我国信息化高速发展的当下,临床决策支持系统(CDSS)已进入规模化的应用阶段,CDSS已较广的覆盖了国内的三级医院。CDSS是基于人工智能、深度学习等技术,结合医学知识、临床案例和患者病情,辅助医生分析病历,制定准确有效治疗方案的工具,具备减少医疗差错、提高医疗效率、控制医疗费用支出等优势[6]。但目前CDSS普遍存在不同医院数据不共享,信息跨级调用难等问题,因此并不能构建完整、专业的医疗知识库,从而无法高效地帮助医生进行辅助诊断。
通过利用隐私计算的技术(主要为联邦学习),可以在多家医院数据不出本地的前提下,共同完成模型的建立,实现“数据可用不可见”的效果,实质上发挥各个医院的数据价值。通过隐私计算,CDSS可以从技术层面上彻底解决数据不共享,信息跨级调用难等问题,从而更好地帮助医生进行临床诊断。
3.2 医学科研
在近代以来,医学科研高速前进、不断发展。但医学科研一直面临着一大难题——医疗数据难获取。医疗研究单位由于数据安全、数据隐私等问题,一般不会直接共享自己的医疗数据;同时医院就诊病人的信息也不会直接提供给科研部门。解决医疗数据孤岛,是促进医学研究的关键,而隐私计算技术的出现在一定程度上解决了该难题。
通过利用隐私计算的技术,可以实现多个医学科研单位及医院数据的安全共享。国外联邦学习在医学科研的实际应用已经逐步展开(见图2[13])。近年来,我国高度重视罕见病病例诊疗信息登记等相关工作,罕见病相关的政策也陆续发布[14][15][16]。建立一个从罕见病诊疗登记、数据挖掘研究分析、科研价值和诊疗方案输出为一体的隐私计算解决方案,将极大程度满足医务工作者、政府职能部门、研究人员工作和科研的需求[11]。对于全基因组关联分析(GWAS)等这类依赖大样本量的研究,通过隐私计算,也可以解决单一机构样本量不足,导致研究结果可信度下降的问题[12]。
图2 联邦学习在医疗领域的应用
3.3药物研发
新药研发领域有一个广为人知的“双十定律”:研发一款新药平均需要花费10亿美元并历时10年之久。随着人工智能的发展,数据对于药物设计、发现、临床验证等各个环节的重要性日益凸显。不过与全行业相比,任何一家制药企业、研发机构所拥有的数据量都十分有限,数据量已经成为制约人工智能药物研发成败的关键因素[17]。
隐私计算可以打破数据孤岛、高效利用数据的同时保证数据的安全。合理的利用隐私计算将大大缩短药物研发的时间,提高研发效率的同时降低研发的成本(辅助新药研发,进行药物疗效研究、药物市场分析、药物副作用研究监测等)[12]。
在2022年,全球10家顶尖药企宣布携手合作,利用隐私计算等技术推进新药的研发(10家药企分别为:安进、阿斯利康、拜耳、勃林格殷格翰、葛兰素史克、杨森制药、默克、诺华等)。这一合作项目,旨在打破不同主体间的“数据孤岛”,探索一条数据共享的全新模式——利用多家制药企业的数据,创建更准确的模型,为药物开发筛选最有效的化合物[17]。
3.4医疗保险
随着我国人口老龄化的加速,我国医疗费用的开销也在迅速增加,医保风控一直是一个热门的研讨话题。医保风控极具挑战的核心因素在于医保数据,而医保数据目前存在质量参差不齐以及数据难共享计算的难题[18]。目前来看,隐私计算是破解该难题的关键技术。
通过使用隐私计算的技术,可以实现数据的“可用不可见”,有效整合医疗数据资源,消除“信息孤岛”现象,实现不同机构之间数据的安全共享。
四、“数安湖”隐私计算平台
针对于上一章所述的医疗行业的应用场景,绿盟科技“数安湖”隐私计算平台凭借着本身的优势不仅可以满足业务场景上的需求,而且还具有“更便捷”、“更安全”、“更强大”等优势,真正做到在满足法律法规和数据安全的前提下,实现数据的高效流转,加快我国医疗行业信息化建设的步伐。
绿盟科技在数据安全研究领域积累多年,2022年在隐私计算方向也得到了多方的认可。 2022年8月1日,绿盟科技入选为“FATE社区首批成员单位”(首批成员单位共有19家,其中安全厂商仅有两家)[19];2022年9月9日,绿盟科技入驻华东大数据交易中心(为入驻该交易中心的首个安全厂商)[20]。
2022年9月21日,绿盟科技与海光公司联合对外发布了隐私计算新产品:“数安湖”隐私计算平台[21]。通过结合海光独立研发的可信执行环境CSV(China Secure Virtualization),“数安湖”隐私计算平台可以在CPU内构造出一个安全的TEE可信执行环境,保证主机管理员或其他用户无法访问TEE内的数据,同时“数安湖”隐私计算平台也支持启动度量和运行时远程身份认证,保证运行的是合法的用户程序。
“数安湖”隐私计算平台目前覆盖了联邦学习、安全多方计算和可信执行环境三种隐私计算的核心能力,具有数据可用不可见、核心数据“拿不走”、恶意行为“跑不掉”等产品特点。在保证数据安全及符合《数据安全法》和《个人信息保护法》等法律的前提下,“数安湖”隐私计算平台加速了数据的流转和使用,更加高效化、安全地实现了数据的价值。
五、总结与展望
我国医疗信息化市场规模正呈逐年递增的趋势[6],医疗行业逐渐深入信息化时代的同时,也带来了许多新的数据安全问题。隐私计算作为实现数据可用不可见的“技术解”,近年来受到了医疗领域的持续关注,根本原因也是因为医疗数据已经进入了必须安全又必须共享的新时代[8]。
然而从现实情况调研来看,目前隐私计算在医疗行业的实际应用可谓凤毛麟角,一方面是由于隐私计算属于一个新兴的技术,仅有极少数企业推出了基于隐私计算医疗行业成熟的解决方案;另一方面也是由于实际应用方并不清楚隐私计算能给他们带来的实际价值,从而减缓了隐私计算实际落地的进程。
但我们相信,随着国家相关法律的颁布和人们对数据安全逐渐的重视,未来隐私计算将会在信息化时代扮演着越来越重要的角色,隐私计算在医疗行业的实际应用也会变得非常普遍。
- https://www.ndrc.gov.cn/xxgk/jd/wsdwhfz/202003/t20200310_1222768.html?code=&state=123
- http://www.npc.gov.cn/npc/c30834/202106/7c9af12f51334a73b56d7938f99a788a.shtml
- http://www.npc.gov.cn/npc/c30834/202108/a8c4e3672c74491a80b53a172bb753fe.shtml
- 2019“UN Handbook on Privacy Preserving Computation Technique”
- 华佳烽. 面向医疗数据查询计算的隐私保护方法研究[D]. 西安电子科技大学.
- https://report.iresearch.cn/report/202203/3942.shtml
- https://www.cn-healthcare.com/articlewm/20220812/content-1417084.html
- https://www.cs.com.cn/ssgs/gsxl/202108/t20210831_6200103.html
- https://baike.baidu.com/item/%E6%99%BA%E6%85%A7%E5%8C%BB%E7%96%97/9875074
- https://new.qq.com/rain/a/20220325A03EP800
- https://www.basebit.me/solution1.aspx
- https://www.nvxclouds.com/solution/medical
- https://doi.org/10.1007/s41666-020-00082-4
- http://www.gov.cn/fuwu/2019-02/28/content_5369203.htm
- http://www.gov.cn/zhengce/zhengceku/2019-11/13/content_5451656.htm
- http://www.gov.cn/zhengce/zhengceku/2020-01/06/content_5466958.htm
- https://www.sohu.com/a/554638161_121360292
- https://www.163.com/dy/article/G1E3C3HN0531I6Y1.html
- https://cn.chinadaily.com.cn/a/202208/16/WS62fb1070a3101c3ee7ae3f3d.html
- https://mp.weixin.qq.com/s/HYIIUYgLf-s9VuciPRKcWQ
- https://mp.weixin.qq.com/s/fu1lNdK2_jIqa1B4-v6WLw
版权声明
本站“技术博客”所有内容的版权持有者为绿盟科技集团股份有限公司(“绿盟科技”)。作为分享技术资讯的平台,绿盟科技期待与广大用户互动交流,并欢迎在标明出处(绿盟科技-技术博客)及网址的情形下,全文转发。
上述情形之外的任何使用形式,均需提前向绿盟科技(010-68438880-5462)申请版权授权。如擅自使用,绿盟科技保留追责权利。同时,如因擅自使用博客内容引发法律纠纷,由使用者自行承担全部法律责任,与绿盟科技无关。