微众银行首席人工智能官杨强:用联邦迁移学习补上AI落地的最后一公里 | 腾讯科学家系列
转载来源:腾云 微众银行首席人工智能官杨强:用联邦迁移学习补上AI落地的最后一公里 | 腾讯科学家系列 http://mp.weixin.qq.com/s?__biz=MjM5NTA0MzIyMA==&mid=2649914614&idx=1&sn=f92e9e6781e3c84691bb9f45062e7fef&scene=45#wechat_redirect
数据孤岛、监管加强等原因,导致理想中的 “大数据 ”时代并未真正到来,也进而为 AI 实际应用增添了新难题。如何破局?且看本文。
?采访/撰文:徐可
机器学习有一个最重要的假设,就是我们拥有足够多的数据。但AI在真正落地的过程中,这一假设越来越受到质疑,我们理想中的“大数据”时代并未真正出现。
首先是数据孤岛。数据散落在不同的行业、不同部门里,而且数据也是异构的,质量也参差不齐,相互不连通,也就是常说的“部门墙”。
同时,GDPR(欧盟《通用数据保护条例》)的颁布也给数据的获取增添了法律障碍,在数据监管趋严的背景下,AI领域惯用的以差分隐私理论(Differential Privacy)来保护隐私的做法,变成了违法。因为只要有隐私被泄露的可能性,数据的交换就会被禁止,这给AI的实际应用增添了新的困难。
在6月29日召开的“人工智能开源软件论坛”上,中国人工智能开源软件发展联盟(AIOSS)发布了《信息技术服务联邦学习参考架构》,标志着国内首个联邦学习标准正式出台,核心是解决AI行业应用中的“数据孤岛”问题与数据隐私保护问题。
这一标准由国际著名人工智能专家杨强所领导的微众银行AI团队牵头发布,以杨强团队提出的“联邦迁移学习”新方法和它打造的开源“联邦学习”框架FATE(Federated AI Technology Enabler)为支撑,意味着联邦学习这一解决行业性难题的关键前沿技术向着成熟化、标准化、产业化的方向发展,为各界共建联邦生态打下了基础。
这也是杨强一年前辞去香港科技大学计算机与工程系主任一职,加入微众银行以来,交上的一份受业界和学界瞩目的成绩单。
此前,在微众银行位于深圳的办公室里,杨强接受了《腾云》杂志的专访。他谈及AI如何为金融赋能,从学界到产业界的转身,以及如何领导好一支“创业公司中的创业团队”。
▌AI为金融赋能的N种可能
杨强最早是作为微众银行的独立董事开始接触AI金融,很快他发现微众银行的独特之处,是通过互联网手段把复杂的银行服务产品简化,推向千家万户。
以前通过私人银行、私人理财才能获得的服务,现在普通人也可以通过互联网产品得以享受。像微众银行面向中小客户的“微粒贷”,面向中小企业的“微业贷”等产品都是互联网创造的需求。在短短三、四年时间里,微众银行用户数已经过亿。
然而,互联网产品往往会因为服务体验跟不上用户扩张的速度而产生矛盾,人工智能就因此成为填补鸿沟的重要手段。金融领域有丰富的数据,既有人的行为数据,也有高质量的银行征信数据。用AI的手段可以把两种数据联系在一起,并带来金融服务领域的革命性变化。
杨强指出,在微众银行,AI技术除了被用于支持客服和风险控制等常规业务,还在不断发现改变行业的新机会。他分别从AI+大数据、AI+运营、AI+营销、AI+资产管理的角度,解释了人工智能在金融领域方兴未艾的场景落地。
场景一:AI+大数据
——用联邦迁移学习打破数据墙
在杨强看来,他所开创的联邦迁移学习,是克服大数据数据孤岛和部门墙的有效的解决办法。
简单来说,“联邦学习”就是让模型在各方之间走动,而数据原地不动。以前是数据在各方走动,然后去建模。现在是模型走动。模型在走动的过程中都加密到一定程度,使得任何一方都没有办法反推其他方的数据,所以是非常安全的手段。通过联邦学习可以形成一个数据联盟,加入联盟的各方都会受益,可以提升模型精度,对用户的刻画更精确,同时满足各种隐私监管的法规。
而“迁移学习”的思路是将模型从大数据迁移到小数据。模型在一个数据比较大的领域取得成功以后,迁移到一个小数据领域。在金融的场景下,就常常遇到这样的例子。例如豪华汽车的贷款,属于小概率事件,数据很少,但是每一笔贷款数额又特别大。
数据少就意味着很难去建模,深度学习也就用不上。利用迁移学习的思路,可以先在一个小额贷款数据上去建模,因为小额贷款数据量更大,再把它迁移到大额贷款,找到它们的共性。
联邦学习和迁移学习结合在一起就是“联邦迁移学习”。这一新方法早已超出了概念的范畴,成为解决AI在行业中落地的重要手段。
场景二:AI+运营
——千差万别的需求
银行运营,最重要的是要保证安全。首先是对客户进行识别,包括证件识别和人脸识别。例如在开户的时候,银行需要了解客户,知道你是谁,怎么确认是本人,就是所谓的KYC(Know Your Customer,了解你的客户)。这就包括人证对比,以及人脸和图像的对比。
对于证件上面的字体识别叫做OCR。在杨强看来,OCR和人脸识别并非外界想象的那样已经是小菜一碟。即便在实验室环境下的识别技术赢得了世界大奖,但是在实际应用中还会遇到问题。例如,对于在出租车颠簸的情况下或在光线不足的情况下拍摄的照片,或者身份证残缺,字迹不清,如何做到准确识别,这些千差万别的需求都需要AI去解决。
反欺诈也是银行运营的刚需。“坏人也在学AI,会试图绕过银行监测系统骗贷款,骗账号,道高一尺魔高一丈,每一天都在与坏人做斗争”,杨强说。
他强调微众银行自建AI研发团队的原因是,AI 技术在金融界的应用,并不是一个封装好的商业产品可以解决,因为它的需求每天都在变化。经过一年左右的磨合和努力,微众AI在人脸识别、语音识别、对话系统、自然语言处理等方面已经达到世界一流的水平,完全可以支撑所有以上的运营业务。
场景三:AI+营销
——给中小企业画像
杨强指出,金融广告也是微众AI团队正在研发的主要创新业务之一 。金融广告比一般互联网广告的的点击率低很多,这是因为普通用户对金融产品的需求不高,但是每点一次,如果真能实现转化,它的价值又非常高。买一个理财产品往往都是几十万,甚至几百万。所以就形成了金融广告的特点:低频、高价值。
另外一个显著差别是,金融广告对广告受众非常挑剔,广告主只希望那些靠谱的用户看到并点击。对于不靠谱的用户压根儿都不想让他看到广告。所以金融广告还有风险控制的问题。此外,金融广告还有“长链路”的特点,广告反馈的时间很长。一个客户在点击了广告以后,可能需要考虑很久才去购买。
微众银行AI团队利用自主研发的强化学习系统对广告平台进行优化,落地尝试都取得了很好的效果,比如微业贷广告的应用效果明显。只有找到靠谱的小微企业主,又有资金需求,同时满足这些条件时才推送广告,而且是个性化的“原生广告”。
场景四:AI+资产管理
——给行业画像
AI在金融领域的另一个方向是资产管理。例如机构在进行大笔投资时,需要对行业进行画像,要跟宏观经济数据相结合,运用各种经济学模型作预测。AI可以融合不同的数据,对未来做出预测。
杨强指出,国内目前资产管理已经开始起步,今后5到10年将会有非常大的变化。微众银行作为开放平台,可以把上述AI赋能金融产业的案例对行业开放,“我们觉得非常激动,机器学习和人工智能正在改变整个金融业态。”
▌带领团队制定联邦学习的行业标准
2017年,杨强当选为国际人工智能联合会(IJCAI)理事会主席,是该机构历史上的首位华人主席,他经常有机会与各国政要会晤。在一次和瑞典科技部长的对话中,他问到, GDPR对于个人数据的强监管措施对于欧洲AI公司而言,是否是阻碍创新的障碍?部长回答,这看上去是绊脚石,实际上是动力。因为大家会研制下一代的AI,而美国因为没有同等严苛的标准,技术会因此落后一代。
因此,杨强坚定地认为,联邦学习将成为解决人工智能数据瓶颈的必由之路,应该通过制定标准加以普及和实施。除了牵头制定国内标准,构建生态,微众银行也在同时领衔推动联邦学习IEEE国际标准的制定,目前已经有30多家企业参与其中。
“标准一旦建立,大家就可以加入这个联盟。参与方都可以获益,也可以打破GDPR时代AI公司噤若寒蝉的局面。大家不敢沟通,是不知道怎样的沟通才是合法,有了标准就可以解决这一问题。”
研究、制定和推广标准需要一个漫长的过程,因此杨强的团队中配备了相应的专业人才。除了有核心的机器学习人才,还有专门研究法律、博弈论、加密算法、分布式计算的专家。以AI为中心,大家一起分工合作。
他以博弈论对联邦学习的贡献为例加以解释,“比如建立一个很好的模型做风控,坏账率降低了,相当于参与的每一个人都有收益。为了使得收益分配公平,鼓励大家有动力继续参与,就需要用到博弈论设计参与机制。”
杨强说,领导一个多元化创新团队的挑战,首先是发现和定义一个伟大的目标以激励参与者,让每个人看到自己能够发挥的作用,并且让大家都觉得遵循这个目标可以得到成长。第二,不能只有伟大的理想,还要有短中长期的目标,让人觉得宏大的目标是可以实现的。第三,一定要有骨干帮助促成目标的实现。
“这个团队的骨干都是我的老师,我跟有的人学架构,跟有的人学管理,跟有的人学经济,跟有的人学加密算法。所以,我们是一个互相补足的团体。”杨强谦虚地说。
▌曾经继承父亲衣钵学天文
杨强学术成果等身,桃李满天下,对于将学术研究付诸实践的追求又驱使他在学界和产业界间游走自如。平易近人、儒雅谦虚而又不失幽默,是杨强给人留下的印象。他说自己的为人处世受父亲的影响很大。
杨强的父亲杨海寿是中国著名的天文学家,曾经在北大任教33年。2013年杨强在一篇文章中怀念父亲那“永不休止的热爱科学探索的头脑,幽默豁达的天性和对大自然的热爱”。父亲爱好广泛,文理兼备,除了博览群书、还热爱音乐和锻炼身体。这些爱好也都反映在了杨强身上。
他提到父亲说过的一句话影响了他的职业选择,“物理学家和哲学家都会拿物理书去看,但是物理学家看完每一章以后,会认真地做后面的习题,哲学家会跳过去。所以,他希望我脚踏实地,做物理学家。”
杨强本科选择就读父亲创办的北大天体物理学专业,并在上世纪80年代考取了李政道先生设立的CUSPEA项目赴美国留学。
在美国做硕士论文的过程中,他借助一台笨重的计算机来研究天体物理的各种信号,也因此接触到了人工智能和自动化。他发现通过计算机可以模拟机械方面的专家,于是想象未来会由机器人来完成建筑、工程、配件、仪器的制造过程,甚至连天体物理的很多研究过程也可以自动化,天文学家的部分工作可以交给机器去完成。这让他觉得非常神奇。于是,他决定转向人工智能领域。
他的博士论文是研究如何通过计算机把探索的过程自动化,而“探索”这件事本身对于很早立志成为科学家的杨强而言,正是人类认识周边世界、发现新知识的手段,对于人类的未来意义重大。
从天文学到人工智能,从任教到创业,从AI到AI+X,杨强一直在不同的领域继续他的探索。教会机器干聪明的事情,解决人力不及的难题。
▌产业互联网也有“最后一公里”难题
在采访最后,杨强也分享了对产业互联网的看法。他说产业互联网的推进应该从AI领域吸取教训。
他指出,AI在过去60年最大的困境就是没有解决“最后一公里”的问题,“大家比较喜欢去摘低垂的果实,而低垂的果实却不是AI落地最需要的。举个例子,大家花了40年的时间,研究逻辑和形式化知识的表达,比如:知识工程、知识图谱,最后发现完全没用。这是因为没有办法把这些知识付诸实践,没有办法被感知。直到深度学习才把最后一公里填上了。”
产业互联网可能也会走一些弯路,也会发现做了一个非常好的决策系统,却没有人用。因此,他认为,产业互联网的推进应该是自下而上产生,需要去了解下面的需求是什么,把实现的每一条假设都搞明白,加以解决应对。
“产业互联网不是坐在实验室里高高在上地闭门造车就能解决的。所以,这也是我为什么我要来微众银行的原因,要从实践出发,亲力亲为,解决最后一公里的挑战。” 杨强说。
杨强简介:
杨强是国际人工智能的顶尖专家和领军人物,在学术界和工业界做出了许多杰出贡献,尤其近些年为中国人工智能(AI)和数据挖掘(KDD)的发展起了重要领导和推动作用。
他是国际人工智能界“迁移学习”(transfer learning)领域的发起人和带头人,也是国际“联邦学习”(Federated Learning)的发起人之一及带头人。
他于2013年7月当选为国际人工智能协会(AAAI)院士,是第一位获此殊荣的华人,之后又于2016年5月当选为AAAI执行委员会委员,是首位也是至今为止唯一的AAAI华人执委,2017年8月当选为国际人工智能联合会(IJCAI,国际人工智能领域创立最早的顶级会议)理事会主席,是第一位担任IJCAI理事会主席的华人科学家。
丨往期回顾
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。 项目经理在线