隐私保护计算平台RealSecure
2023/5/22 15:34:00      关键字:     
隐私保护计算平台RealSecure,由北京瑞莱智慧科技有限公司(以下简称“瑞莱智慧”)研发和实施。瑞莱智慧由清华大学人工智能研究院发起设立,荣誉院长张钹院士、基础理论研究中心主任朱军教授共同担任瑞莱智慧的首席
企业名称:北京瑞莱智慧科技有限公司

产品概况:

隐私保护计算平台RealSecure,由北京瑞莱智慧科技有限公司(以下简称“瑞莱智慧”)研发和实施。瑞莱智慧由清华大学人工智能研究院发起设立,荣誉院长张钹院士、基础理论研究中心主任朱军教授共同担任瑞莱智慧的首席科学家。
平台通过瑞莱智慧的全景式隐私保护计算技术,为实际应用场景提供可靠可信可用的数据保障,使得不同来源、不同类别的归属于不同持有方的数据,能够在安全合规高效的前提下高效地实现多方共享和联合使用,打通业务链路,最大化发挥数据价值。

关键技术指标:

为了使相关行业各单位能够合法合规地使用数据,在保障安全的前提下最大化实现数据流动的价值,综合运用多方安全计算、联邦学习等技术打造数据安全共享的基础设施,实现数据可用不可见,连接数据孤岛,为数据合作提供业内独家全景式隐私保护计算平台。
多方安全计算,是指在无可信第三方的情况下,多个参与方共同计算一个目标函数,并且保证每一方仅获取自己的计算结果,无法通过计算过程中的交互数据推测出其他任意一方的输入数据。
联邦学习实现了在本地原始数据不出库的情况下,通过对中间加密数据的流通与处理来完成多方联合的机器学习训练。
隐私保护计算平台RealSecure主要包括数据中心、项目中心、开放市场、管理中心模块。通过不同机构分别部署隐私保护计算节点,计算过程中实现加密因子的加密交换,完成联合建模、多方安全计算和匿踪查询任务,也规避数据泄露风险。
在产品集成方面,平台实现交互层与调度层互联互通。其他隐私计算产品只需支持交互层的API-Client,能解析并正确执行RestFul API即可。实现在前端用户无感的情况下,互联互通不同的隐私计算产品。
在模块嵌入方面,各个具体的联邦学习等算法组件的执行环境,算法协议保证了多方之间数据以密文形式交互,同时代理层(proxy)引入国密机制。
在协议互通方面,任务层提供了编译器模式,将算法的数据流图自动编译成联邦数据流图,而数据流图可被看做联邦模式下的执行协议。各厂商可将内部联邦算法抽象为数据流图模式,部署到相应任务模块内,执行各个厂商的数据流图,实现在协议层面的互联互通。
隐私保护计算平台RealSecure支持可信硬件、通用计算资源加速和隐私计算软件产品结合,降低隐私计算技术使用门槛,提供高性能的安全解决方案。
隐私保护计算平台RealSecure,实现了实验训练、离线跑批、在线预估等多项功能。在不同机构分别部署节点,于建模过程中实现模型参数的加密交换,最终完成联合建模,规避数据泄露风险。平台对数据生态域、系统功能域和方案模板域提供全体系全周期服务支持。已实现在隐私保护前提下达到的模型效果等同于将数据集中在同一台机器上训练所得。
逻辑架构上,主要分成基础架构层、数据层、服务层、业务层和展示层。系统模块上,包括联合统计模块、联合建模模块、匿踪查询模块。同时在上层完成jupyter与GUI前端工程研发。

产品创新点:

1.全球首创联邦编译器
自主研发的联邦编译器,是全球唯一一个活字印刷级产品。联邦编译器具有通用性,可适配上层多种机器学习算法。其自动编译能力,极大地方便联邦学习算法开发,以及后续算法的不断更新。同时使得新机器学习算法(例如SVM, Matrix-Factorization)的集成更为容易,而无需针对每个参与方编写对应的计算逻辑。
可以直接复用现有积累的数据开发团队和经验,实现算法和应用的一脉相承,机器学习生态与隐私保护机器学习生态相统一。
算法:传统算法与隐私保护版本算法是继承关系,而非完全重构,可实现两大生态的自动化统一;
应用:原有数据开发人员随用随调,提供上万种算子,同时支持jupyter等经典使用形式。

2.世界领先的全同态加密技术
本平台所应用的全同态加密技术,有着显著领先于业内其他全同态加密应用的技术研究和工程化实现。相较于半同态Paillier、仿射同态加密等,具有在全同态下支持的密文算法更多、安全性更高、性能优势更明显、应用场景更丰富的特点。具备显著的高性能优势,支持无幂运算,支持SIMD批量计算。在大规模数据集的密文运算中,比开源联邦学习和其他主流产品有远超40倍的性能提升。支持LR、XGBoost、NN、线性回归、SVM等算法且在不断扩充中。

3.性能卓越的数据对齐技术
本平台的数据对齐,在所有安全的PSI技术路线中性能最快,与朴素哈希方案(MD5撞库)性能在统一数量级。具有OT空间转置加速的核心技术,通过执行固定次数的OT,来实现任意数量的OT传输。同时,可以实现时间复杂度的降维。

4.全新的匿踪查询实现路径
本平台的匿踪查询通过全同态加密的技术来实现。传统的OT技术实现路径中,每查询一次需要返回多条结果,且密文解密延时长,在很多商业场景的实用性不佳。而本平台采用全同态加密的技术来实现匿踪查询,每查询一次只返回一条结果,性能快,支持高并发,在绝大多数商业场景均有良好的适用性。

5.高效安全迭代
本平台实现了编译器自动寻踪最优计算路径,高效加密算法赋予明文处理级运算能力,共同驱动极致安全与效能。无冗余最优计算路径,最小化模型迭代消耗。

6.实现全方位安全评估验证
可以面向客户提供“协议模型及安全性假设 ? 技术实现原理 ? 数据抓包监测 ? ”全方位的安全评估验证。
协议模型及安全性假设:基于业务场景及目标,RealAI提供对应的密码学及数学问题描述,包括问题的安全性假设条件。
技术实现原理:基于协议模型及安全性假设,RealAI提供隐私计算的每一个步骤的具体技术实现原理。
数据抓包监测:RealAI提供对数据交互参与方的通信数据抓包监测,以论证数据交互的隐私保护及安全性。
运算日志审计:RealAI提供隐私计算每个步骤的操作执行日志,并将其打印输出,可作为技术实现原理的佐证。

7.独有可视化、可追溯的安全性
独创以底层数据流图的视角揭示算法和对应的分布式联邦学习算法的联系,使得运算流程透明可见、可审计。并通过数据流图变换完成两者间的自动转换。

8.抗恶意攻击
通常的匿踪查询技术是基于半诚实对手假设实现,而本平台的匿踪查询技术,支持在恶意对手攻击情况下,仍然保证安全性。同时具有高安全性,可抗量子计算攻击。

9.自动可验证
可自动编译生成联邦计算逻辑,把算法实现抽象为IR的方式,规避复杂的程序实现。通过密码学证明与联邦学习的深度结合,给出联邦算法的安全性证明。

10.高易用性
平台大部分功能对使用者实现零编码和低门槛。相较于ART、Foolbox等开源工具,无需使用者具备专业的模型安全算法知识和开发经验,上手操作更简单。

国内外市场推广情况:

截止目前,隐私保护计算平台RealSecure已服务包括清华大学、中国信息通信研究院、北京智源人工智能研究院等在内的机构、院所,和中原银行、国家电网、蚂蚁金服、浦发银行等在内的企业、单位,收入达数千万元级规模。

微信扫描二维码,关注公众号。