同盾科技李晓林:联邦学习如何守护数据隐私?| 嘉宾观点
付费阅读

嘉宾观点 · 2019-10-23


10月11日,同盾科技副总裁兼人工智能研究院院长李晓林受邀出席由嘉宾大学联合主办的“仁AI智行——2019·中国怀仁二次元经济与人工智能峰会”,并发表“联邦学习——携手智能风控守护数据”的主题演讲。

 

演讲中,李晓琳介绍了联邦学习的技术原理,并着重讲了联邦学习在智能风控方面的应用。他表示,联邦学习核心要解决的问题是设计一套AI系统,既能保护用户的数据隐私,同时又能更高效、准确地使用孤立的数据,最终学习到更好的模型。




联邦学习打破数据孤岛



人工智能本质上是数据智能,其核心是利用大数据进行模型的训练学习。但在实际场景中,却存在一个个数据孤岛,无法形成有效的大数据支持模型训练。而随着监管制度越来越严格,数据隐私和数据安全更受重视,这也对人工智能的发展提出了更高要求。
 
“数据孤岛和数据隐私问题制约着AI的发展,利用大量数据只能进行很简单的小任务。”10月11日,同盾科技副总裁兼人工智能研究院院长李晓林在由嘉宾大学联合主办的“仁AI智行——2019·中国怀仁二次元经济与人工智能峰会”上演讲时称。
 

同盾科技副总裁兼人工智能研究院院长李晓林在“仁AI智行——2019·中国怀仁二次元经济与人工智能峰会”现场进行

主题演讲


如何在保护数据隐私、利用相对较少数据的基础上完成复杂的任务?李晓林表示,联邦学习具有开放不共享(模型开放、数据不共享)的特征,可以在保证数据隐私安全的前提下,针对分布在不同客户的数据,采用去中心化的协作方式,构建机器学习模型。
 
联邦学习(Federated Learning)是一种加密的分布式机器学习技术,其中的参与各方可以在不披露底层数据和底层数据的加密(混淆)形态的前提下共建模型。谷歌率先提了基于个人设备的算法框架,微众银行AI团队随后提出了基于联邦学习的系统性通用解决方案,可以解决个人(2C)和公司间(2B)联合建模的问题。通过此类解决方案,各个企业的自有数据不出本地,通过加密机制下的参数交换方式,就能在不违反数据隐私法规情况下,建立一个虚拟的共有模型,打通数据孤岛,走向“共同富裕”。“这就像一个小孩去图书馆看书,书没拿出来,知识拿出来了。”李晓林解释。
 
李晓林所在的同盾科技成立于2013年,是一家智能风控和分析决策服务提供商,将人工智能与业务场景结合,为银行、保险、汽车金融,以及基金理财、三方支付、航旅、电商等十余个行业提供智能营销、智能信贷风控、智能反欺诈、智能运营等服务。截至目前,该公司已获五轮共计数亿美金融资。
 

联邦学习加强智能风控



为金融机构提供智能信贷风控是同盾科技的核心业务之一。李晓林介绍,通过金融机构之间或与相关电商和金融科技公司之间的联合建模,可实现数据本地化、数据库独立。对共有用户,通过数据属性互补建立更全面的金融服务模型,而对非共有用户,则采用集成学习、元学习、深度学习提升覆盖能力。
 
联邦学习分为跨样例和跨特征两种模式,跨样例模式更多的是同构数据,而跨特征模式则更多的是异构数据。不同电商之间的数据相对是同构的,属于跨样例模式。而淘宝与抖音之间的数据则是异构的,属于跨特征模式。对于反欺诈和信贷风控来说,跨特征的异构数据非常重要。李晓林举例,义乌的小商贩在银行那里不是优质客户,在银行如何获得贷款?尽管缺少银行信贷数据,但他们有社交数据,通过微信、水电费、企业经营、仓储等数据,可以得到个性化画像。这些数据在银行的数据模型中不合规,但用联邦学习形成的模型却可以反映出经营情况,帮助商贩获得贷款。
 
在P2P暴雷的时期,同盾推出了一款叫“多头宝”的产品。由于银行、信贷平台之间数据不通,有些人在各银行、信贷平台之间拆东墙补西墙的现象屡见不鲜。通过联邦学习的方式进行建模,在无需查看用户隐私数据的条件下,可以对用户的贷款行为特征进行多方计算,阻止其过度借贷。
 
除了信贷风控,联邦学习也可以应用于数字精准营销、无感认证等场景。在精准营销方面,使用模型对本地数据进行处理之后,就可以得到某个消费者的消费特征,并判断其偿付能力,以此来进行精准的广告投放。而在无感认证方面,如果某个用户的手机被盗,长时间没有人使用,或者某个陌生人进行了操作,则可以进行关机。
 
“联邦学习核心要解决的问题是设计一套AI系统,既能保护用户的数据隐私,同时又能更高效、准确地使用孤立的数据,最终学习到更好的模型。”李晓林表示。



您可能感兴趣的