随着AI在各行各业的深度应用,数据正变成像空气、水一样的基本生存物资,构成各类大数据应用的基础,用于人工智能模型优化,便利人们的生活。而数据共享的安全问题也日益引发社会关注。出于保护商业利益、法律风险等考量,包括金融机构、手机应用平台等大数据方纷纷收紧数据共享,无形中构成新的数据壁垒,阻碍人工智能的应用落地,对于迫切寻求数据运营支持的中小企业而言更是雪上加霜。
作为一家专注于为世界提供普惠金融服务的科技企业,蚂蚁金服长期通过科技创新,打造开放、共享的信用体系和金融服务平台,为全球消费者和小微企业提供安全、便捷的普惠金融服务,历经多年研发的共享智能就是其对外输出的重要技术成果,现已在金融业的智能信贷、智能风控等领域获得广泛应用,成就连通大数据应用的“高铁”。
据了解,在现实的大数据应用场景中,数据的管理者和使用者往往并不是数据的所有者。一旦在数据共享的过程中,出现数据泄露,数据滥用,数据的管理者面临的不只是商业利益受损,也有可能因为没有尽到数据管理的责任,而遭到监管部门和数据所有者的法律追责。在这种情况下,一些缺乏数据共享安全保障技术的企业更加倾向于避免数据开放,形成大数据孤岛,导致难以发挥出完整的数据价值。因此,打通数据壁垒连接数据孤岛,成为当前人工智能和大数据发展中面临的一个关键挑战,也是迈向未来的必经之路。
针对人工智能应用的这一痛点,早在2016年,蚂蚁金服就开始从事共享智能的相关技术研发。由蚂蚁提出的共享智能,就是为解决数据协作需求与隐私泄露和数据滥用之间矛盾的技术解决方案,探索在不直接共享数据的前提下,打通大数据孤岛,实现多方数据可用不可得,让数据流通起来,真正发挥价值。
相较于行业中联邦学习等数据共享解决方案,共享智能有四个基石性的研究方向,分别是多方安全计算,可信执行环境,差分隐私,以及联邦学习。
多方安全计算和可信执行环境侧重解决计算过程中的数据安全问题,差分隐私侧重保护计算结果里的隐私泄露,而联邦学习擅长解决大数据孤岛带来的人工智能算法收敛性及效率问题。单独的一个方向并不能解决多方数据可用不可得的问题,共享智能的研究既包括推动这四个基础方向的进步,又包括对这四个方向的融合创新,从而提供满足不同实际需求的多种产品与服务。
经过实践检验,蚂蚁金服自主研发的共享智能平台具有安全可靠性、高可扩展性、完备性以及易用性等特点,具有覆盖场景面广,支持算法丰富,支持工业化、规模化发展等优势。
目前,蚂蚁共享智能主要有以下特点:
● 多种安全计算引擎整合,可基于不同业务场景来选择合适的安全技术。既有基于TEE的集中式解决方案,也有基于MPC的分布式解决方案;既可满足数据水平切分的场景,也能解决数据垂直切分的诉求;既可以做模型的训练预测,也可以做数据的探查和分析。
● 支持基于SQL语法的数据分析、各种数据预处理算子和多种机器学习算法。支持的算法包括但不限于LR,GBDT,Xgboost,DNN,CNN,RNN,GNN等。
● 大规模集群化。支持大规模集群化,提供金融级的高效、稳定、系统化的支撑。
纵观全球,包括欧盟的GDPR、美国的CCPA,到中国的数据安全法、网络安全法、个人信息保护法等等都在对数据管理失责,和数据滥用,提出更为严格的规范,促进人工智能深度应用的健康发展。
特别是在金融行业,由于非常容易出现不合规行为,我国对于数据的应用和管控更加严格。例如用来投资,被标为非公开信息的数据会被禁止使用;而关于个人用户隐私层面的管控可能更严等等。因此,蚂蚁共享智能得到蚂蚁内部及合作伙伴方的智能信贷、智能风控等金融场景应用,一方面意味着能够适应不断严格的监管需求,另一方面经受住金融等严苛场景的考验,显示出具备向其他行业复用的前景,进一步凸显数据的价值。
面向未来,伴随着人工智能的深度应用,蚂蚁共享智能发展或将迎来更加广阔的发展机遇,推动更多“AI+”的场景商用,释放人工智能的潜能,在降低数据共享的安全担忧同时,成功打破大数据孤岛,推动企业发展转型升级。