健数联邦学习平台创新性应用于医学多中心数据安全共享

2022-01-14 17:09

1月10日,健康数据凭借在隐私计算领域多年的技术积淀、专病科研大数据产品优势以及对医学场景和数据的深刻理解,成功中标中山大学孙逸仙纪念医院基于联邦学习的多中心协作乳腺癌诊疗能力提升平台项目,助力广东省科技创新战略专项任务“中国乳腺癌产学研创新联盟”课题研究。


本项目旨在通过临床数据治理、联邦学习、区块链等技术和框架,为中山大学孙逸仙纪念医院建设一个完善的多中心协作乳腺癌诊疗能力提升平台,构建基于文本数据和影像数据的中国人群乳腺癌预后风险预警模型,助力乳腺癌患者的诊疗水平提升。




近年来,乳腺癌已经超过肺癌成为世界新发病例最多的恶性肿瘤,中国女性乳腺癌发病率也呈逐年上升趋势。不同患者的生活方式、地域环境,各地的医疗水平差异,均会对乳腺癌患者的生存预后产生影响。推动乳腺癌临床诊疗同质化、治疗方案系统化和多中心协作势在必行。


大数据的发展,为乳腺癌治疗决策提供了有力的支撑。临床医生和科研人员通过大量的乳腺癌临床数据研究,能更好地论证和优化治疗方案,进一步探索乳腺癌的防治策略。


医疗健康数据涉及患者个人隐私、基因信息、生物识别数据等高度敏感信息。在医疗数据互联互通的大趋势下,推动乳腺癌医疗质量提升,需要不同医疗机构间进行更多的数据共享、联合建模工作。


数据安全与数据共享如何兼得?隐私计算是解决这个问题的灵丹妙药。


联邦学习是为了应对数据隐私的挑战提出的分布式机器学习方法,也是隐私计算的重要技术手段。联邦学习技术的应用能使多个参与方在不交互数据的情况下,通过安全机制交互模型参数,将分散在各医疗机构的数据进行整合共享和机器学习联合建模,打破数据孤岛现象,实现医疗大数据AI协作,满足临床和科研多方医疗成像和疾病预测模型构建的需求。


区块链本质上是去中心化且寓于分布式结构的数据存储、传输和证明的方法,存储于其中的数据或信息,具有“不可伪造”“全程留痕”“可以追溯”“公开透明”“集体维护”等特征。区块链技术的应用,为各医疗机构共享的临床科研数据装上“安全盾”,实现数据的规范化管理,提高科研数据的可靠性和真实性。


采用区块链+联邦学习构建的平台,可安全合规地连通各医院数据,提高数据使用安全性和公平性:

联邦学习满足用户隐私保护、数据安全和政府法规的需求。在不共享原始数据的基础上,通过算法与区块链结合,多方进行数据的联合训练,既满足医疗主要的应用场景的需求,又保障了数据所包含的个人隐私信息的安全。区块链可以使得所有医疗数据变更全部记录在中心数据库上,便于数据的真实性、可追溯性、安全性。




健康数据专病科研大数据平台,依托自主设计研发、面向智慧医疗的数智中台开发,安全保障医疗数据互联互通,给予临床医生一站式科研流程支持。目前,健康数据已实现乳腺癌、肺癌、心房颤动、肾病、多发性骨髓瘤等多病种、多学科的专病科研应用场景落地。


利用多模态数据采集、数据标注治理、数据分析建模、数据安全管理、数据共享交换、数据能力开放等核心技术能力,可打造院内(单中心)一体化科研平台,加速科研产出和科室学科建设;亦可构建多中心科研合作体系,在严格保障信息安全和知识产权的前提下,提升研究质量。


1、建立专病科研数据标准

构建院内或多中心的专病智能分析和研究平台,根据国家权威专病领域的数据标准规范定义数据规范,进行数据处理、转换,提出明确的数据集规范、接口规范、数据传输规范、字段内容规范、对外信息发布规范等。


2、打造数据治理服务能力

按照权威专病科研数据标准,将院内各数据中心系统的数据,利用ETL和NLP技术自动化采集、清洗、转换、结构化、标准化处理,按照定义好的接口标准和规范进行输入、转换和输出处理,依据各疾病例特点,联合多个分中心构建基于多中心的专病数据库,对每个细分的病例分类进行精细化管理,同时形成各专病标准数据集。


3、建设专病数据库平台

运用大数据的分析和挖掘技术,实现历史医疗资源的再利用,并借助大数据的思维和方法进行研究,解决过去无法解决的问题,使得数据加以利用,形成从量变到质变的过程,同时通过多维度的分析研究,实现对医疗数据的高效精准检索、后结构化、分析计算、多中心协作研究。


4、建设区块链及联邦学习平台

在多中心搭建联邦学习框架,中心模型综合分析引擎部署在某一家医院。基于具体的科研课题配置算法,通过医院同步到前置机的影像数据,在数据不出医院的前提下,完成分布式模型汇总到中心模型训练,得出整体数据科学研究结果。同时,通过构建专病数据区块链平台,将专病数据平台中的数据进行确权、存证共享和交易。


5、打造一体化科研服务平台

基于多中心联合构建的科研协作平台,满足临床医生科研需求,辅助医学专业人士进行科研统计分析。具体实现功能包括:统计分析工具和建立预测模型。统计分析工具用以对科研数据进行统计学分析,并以可视化的方式展现;通过联合协作科研平台,在预处理后的数据基础上,构建预测模型。


联系我们