数据价值安全共享通用解——蚂蚁隐私计算框架“隐语”的探索实践
温馨提示:这篇文章已超过1015天没有更新,请注意相关的内容是否还可用!
2022 年 2 月 26 日,WAIC2022 上海人工智能开发者大会在上海临港顺利举办,大会重要组成之一「隐私计算 Workshop 」围绕“隐私计算赋能数据要素安全流通”这一主题展开,产学研用各届知名专家学者相聚,深入探讨隐私计算如何赋能数据要素安全流通。
方法论已烂熟于心 实践的第一步落足何处?
2021 年被称为隐私计算元年,一方面政策法规与标准规范频频出台落地,给数据权责分明提出更高要求,使得隐私计算资源和市场需求激增;另一方面虽然众多厂商在金融、电信、医疗、政务等场景纷纷落地应用,但是距离真正成熟还有很长的路要走,隐私计算的技术和应用发展都还存在不确定性。
隐私计算技术厂商汲取着 FL、MPC、TEE、HE、DP 等等主流技术的养分深深扎根安全土壤,早已熟读了“互联互通”、“开放共建”的方法论,迫切需要的是可复用、可灵活变换的公式,让隐私计算更广泛地应用到 AI ,数据分析等场景中。而上层的的业务需求方迫切需要的则是开箱即用的方案,是由繁杂的技术细节实现的具体功能。
何以解忧?唯有通用。“通用是指对外的功能上要通用,能够支持从数据分析到建模、策略全流程的通用数据处理能力;同时隐私计算框架本身设计上要通用,能同时支撑包括 MPC,FL,TEE 等多种现有的隐私计算主流技术。”蚂蚁集团隐私计算总监王力在 Workshop 演讲中对这种隐私计算行业所需求的“通用”展开分析并分享了蚂蚁集团在这方面的实践经验。
方法论辩证洞察市场 明确核心原则
当前隐私计算被炒的火热,各种隐私计算技术百家争鸣,隐私计算应用场景百花齐放。但当前还处于业务、技术、监管三方相互博弈、相互促进的过程中,我们希望能通过一套开放统一的架构,汇聚多方的力量形成技术合力,来共同加速隐私计算技术的发展。
然而,如何在技术和应用的发展都还不确定性的情况下,设计一套相对确定的技术框架,是非常大的挑战。王力表示:“我们的思路是,在不确定中把握确定性的内容,基于这些确定原则,让隐私计算框架具备最大限度的包容和扩展能力,以应对未来隐私计算技术和应用的发展。”这些确定性的原则包括:
1.完备性:支持各种可能的技术,且可以灵活组装,以适应不同场景的需求,避免错失赛道;
2.透明性:构建统一的技术框架,底层技术迭代尽量做到对上层应用透明,避免从上到下推翻重来;
3.开放性:让不同专业背景的人都能便捷地参与到框架建设中,加速隐私计算技术的发展;
4.联通性:不同底层技术支撑的场景中的数据,也能够相互联通。
蚂蚁隐私计算框架“隐语”
基于此,蚂蚁以安全、开放为核心设计理念,自主研发了通用隐私计算框架“隐语”,内置 MPC、TEE、同态等多种密态计算虚拟设备供灵活选择,提供丰富的联邦学习算法和差分隐私机制。其开箱即用的隐私保护数据分析及机器学习等功能,降低了隐私计算开发者和使用者的技术门槛,可让隐私计算更广泛地应用到 AI、数据分析等场景中,解决隐私保护和数据孤岛等行业痛点。
良好的分层设计对“隐语”的功能和性能至关重要,其框架由下至上分为这样几层:
1.资源管理调度层:通过对 K8S 和 K3S 进行二次开发实现,主要承担两方面职责,一是面向业务交付团队,可以屏蔽不同机构底层基础设施差异,降低交付的部署运维成本。二是通过对不同机构的资源进行集中式管理,构建一个高效协作的数据协同网络。
2.明密文计算设备和混合调度层:设备是隐语对计算能力的统一抽象,主要包括密文计算设备和明文计算设备两类。密文计算设备是对各个主流隐私计算技术的抽象。混合调度则是为了将下层的明密文设备串联,形成一套统一的计算框架。
3.隐私计算算法层:这一层可以屏蔽隐私计算技术细节,但保留隐私计算的概念,降低了隐私计算算法开发门槛,提升开发效率。方便隐私计算算法开发同学根据自身场景和业务特点,设计特化的隐私计算算法,来满足自身业务和场景对安全性、计算性能和计算精度的平衡。在这一层上,隐语本身也会提供一些通用的算法能力,比如 MPC 的 LR/XGB/NN,联邦学习算法,SQL 能力等。
4.业务算法层:这一层可以彻底屏蔽隐私计算的概念,让通用算法和策略开发同学,可以无缝地在这一层进行数据分析和算法建模。
5.产品层:隐语的目标并不是做一个端到端的产品,而是为了让不同的业务都能够通过快速集成隐语而具备全面的隐私计算能力。因此我们在最上层提供一层较薄的产品 API 及一些 SDK,降低业务方集成隐语的成本。
套入业务实践 验证、打磨技术成果
在金融风控应用中,蚂蚁展开与银行的技术、数据合作。基于蚂蚁隐私计算框架“隐语”,运用多方安全计算技术,在保护用户隐私和数据安全的前提下,开发风控模型。参与方得以充分挖掘各自数据价值,提升独立自主风控能力。与单一数据源模型相比,多方数据协作模型可以将模型 KS 值提高 12%-23%,识别超过 14.5 万名高风险客户,阻止了数十亿人民币的高风险贷款发放,识别 37 万名低风险客户、约 80 亿元人民币潜在授信,帮助银行拓展了零售信贷服务可支持的客户面。“隐语”这一实践也是入选 IDC《开放金融数据共享中隐私计算的平衡之道》报告的唯一案例。
聚合技术能量 让美好猜想成真
当现代社会第一生产力“科技”与第五大生产要素“数据”相碰撞,激发的是我们对未来种种可能性的美好猜想。
当现代社会第一生产力“科技”与第五大生产要素“数据”相碰撞,激发的是我们对未来种种可能性的美好猜想。
对于行业,一方面监管体系初步形成但尚未明晰,另一方面隐私计算大规模应用依旧在路上。一手紧抓技术硬实力让每一次发声都掷地有声,一手紧握各方伙伴以丰富的形式持续扩大影响力。金融保险、生物医疗、广告营销、制造零售、政务民生……需求所在之处皆是可以挥洒汗水让技术生根发芽的黑土地。
对于社会,“隐语”在已有的实践中为自身在提升社会效率、促进社会资源合理配置、提高人民生活便利程度中所发挥的作用充满成就感,也谦虚的认识到在智慧城市、智慧生活的快速发展进程中,过往皆是“浅尝”,但绝不会“辄止”,有了多方共建反哺,“隐语”将有更广阔的视野和天地,以更强大的功能面貌在科技向善的时代发挥更大的社会价值!
“隐语”正在知与行的相互作用中不断求索进步,目标是构建一个可以让多方共同参与的、开放的隐私计算架构,想要做好其中的任意部分,都需要大量的技术投入,“隐语”即将开源拥抱共建,在脚踏实地的路途中,期待与用户/开发者共同仰望浩瀚星空。
-End-
九七分享吧所有文章来源于网络收集整理,如有侵权请联系QQ2387153712删除,如果这篇文章对你有帮助或者还不错的请给小编点个小赞(◠‿◠),小编每天整理文章不容易(ಥ_ಥ)!!!
还没有评论,来说两句吧...