张小龙缺席的2020微信公开课:全面开放NLP能力,语义匹配模型准确率达最高水平
作者 | 钰莹、刘燕
AI 前线导读: 这是一次没有张小龙出席的微信公开课。虽然没有出现在现场,但张小龙通过视频为本次公开课发表了开场致辞。本次公开课的主题是“未完成 Always Beta”。今年,微信 9 岁了,尽管已然是一个拥有 11.51 亿月活的庞大国民级应用,然对于张小龙和微信来说,仍有许多未竟之事。
2020 年,微信的下一步将向何处去,新一年微信中还会出现哪些机会?本次公开课对这些问题作出了“回答”。AI 前线团队整理了本次主会场的重要内容,并在文章末尾附上了张小龙的视频演讲内容速记。
更多优质内容请关注微信公众号“AI 前线”(ID:ai-front)
微信 AI:全面开放各层次 NLP 能力
微信 AI 公布最新开放方案,为开发者搭建开放共享平台。
微信 AI 的三大“牌面”:腾讯小微 2.0、腾讯对话开放平台,NLP 原子化能力。腾讯小微是微信 AI 团队打造的智能对话解决方案。接入腾讯小微的硬件设备可通过智能语音对话使用音乐、新闻和视频通话等技能。腾讯对话开放平台是以智能对话为核心的开放技能配置平台。企业主、个人可以零门槛搭建智能对话系统。
微信 AI 致力于语音识别、自然语言处理、计算机视觉、数据挖掘和机器学习等人工智能技术的发展。微信 AI 主要研究方向为语音和音频,即提供精准的语音识别等技术服务;自然语言处理;图像和视频,包括文字识别、人脸识别、内容理解和增强现实等技术;数据挖掘和文档理解,即依托微信公众平台文章内容,专注于主题聚类分析、信息分类、非结构化知识抽取、文本理解和热点追踪等技术研究;分布式机器学习平台,用于支持微信研究中对机器学习和深度学习等算法的训练。
在智能问答的定制化和语义泛化层面,微信的语义匹配模型在中文公开数据集 LCQMC 上准确率达 88.8%,达到业界最高水平。
基于微信平台,微信 AI 已实现语音输入转文字、扫一扫的扫码 / 封面和翻译、聊天机器人、摇一摇 - 音乐 / 电视、声纹锁等功能。目前,微信 AI 团队已拥有微信智言与微信智聆等技术,其中,微信智聆每天处理超过 4 亿条语音,识别准确率为 97%,服务于腾讯内外超过 100 项业务,在微信语音输入、语音转文字、王者荣耀、QQ 音乐等产品中都提供了技术支持。在这微信智言和微信智聆两大技术的支持下,团队推出“微信对话开放平台”和“腾讯小微”智能硬件两大核心产品。
最后,微信全面开放各层次 NLP 能力,截至目前已经积累出了 20 项 NLP 能力,期待可以为开放者带来帮助。
企业微信
前不久,企业微信发布了 3.0 版本,这也在微信公开课的现场被重点介绍。根据官方介绍,在企业成员使用企业微信添加客户微信后,客户可以清晰地看到导购的企业信息、实名认证等。企业成员还可以为不同的客户打上标签,以便在进一步的服务时更有针对性。在解决完“获客”的信任问题,对客户资源进一步沉淀后,精细化运营成了企业的重点。
在 3.0 版本中,企业微信外部群聊人数升级至 100 人,企业成员可以基于客户标签运营客户资源,把客户拉进外部群聊,并提供多对一或一对多的伴随式服务。
此外,小程序、小游戏、微信支付等关键性的微信生态产品也在现场亮出了一年来的成绩单以及新的一年来的发展规划。
小程序
小程序上线 3 周年,已覆盖超 200 个细分行业,小程序的生态不断拓展、丰富,截止 2019 年 11 月 13 日,小程序日活跃用户超过 3 亿。在 2019 年的演讲中,微信公开课讲师杜嘉辉表示:你们只管去做小程序,剩下的交给我们。今年,杜嘉辉再次提出新的愿景:希望帮大家打造自己的商业闭环。
过去一年,微信推出了小程序评测和评分,可以看到优秀小程序的数量越来越多,质量得到了整体提高,活跃数量也在稳步增长。2020 年,小程序搜索将成为微信小程序团队的重点,正如张小龙所言,希望搜索能进入到每一个小程序的内部,这样海量的小程序可以支撑起各种长尾的搜索需求。
2020 年 1 月 9 日,小程序框架正式开放,可支持小程序在硬件运行。2020 年,小程序即将上线直播组件及交易保障能力,致力于提升用户在小程序购物的信任感和体验。同时,2020 年,微信小程序将持续升级开发支持,提升运营服务意识,为开发者搭建商业场景进行“保驾护航”。
小游戏首提商业爆发力:增速超 35%自 2017 年 12 月 28 日小游戏正式上线以来,小游戏的用户规模、从业者、内容数量实现了快速增长,至 2019 年,小游戏平台已经累计为超过 10 亿用户提供过内容服务,小游戏以其极轻极快的形式实现了对大众用户的不断渗透。此次公开课,微信小游戏首次披露的商业价值和成长空间备受瞩目:2019 年小游戏的商业价值实现快速增长,整个平台的商业规模较 2018 年增长超 35%,到 2022 年随着数据通讯速度的提升,还将飞跃发展。微信公开课讲师李卿表示,经过两年的快速发展后,未来两年小游戏商业规模可能以 38%-40% 的速度高速增长,有巨大想象空间;对于开发者来说,2020 年小游戏仍值得入场。
微信支付
微信支付具备增值的产品 - 微信支付分,希望这可以成为第二张身份证,提高彼此之间的信任,见分如故友,这是产品,更是生活。
2019,微信支付的用户突破 1 亿,超过 80% 的押金用户不再缴纳押金,使用更为安全便捷的支付分免押服务。支付分用户在下沉城市增长更快,用户年龄在 20-35 岁之间,每个用户平均每月使用支付分服务 3.8 次。通过使用微信支付,无人冰柜行业的坏账率降低至原来的 1/5。
未来,这一功能将进入生活,扩大外延,推出微信先享卡产品,降低用户决策门槛,锁定用户。建立开放的生态,在商户自有体系积累价值,灵活性高,自由配置约定和玩法,商户小程序签约,用户留存于用户体系,有效消息触达渠道,也会增加更多社交元素,引入社交玩法。
以上就是 2020 年微信公开课主会场的重要内容,下附张小龙视频内容速记。
附张小龙本次公开课的视频演讲实录:
公开课的朋友们,大家好。
又到了一年一度的微信公开课。很抱歉这次没有来到现场,在这里跟大家打个招呼。
其实我是故意不来现场的。记得第一次公开课,我提到说,参加各种会议可能是很浪费时间的。
我还说过,用产品说话,才是我们应该做的。大家也看到,微信从来没有开过发布会。我认为,新版本的启动页,就是微信的发布会,它直接覆盖几亿用户。
但同事们说服我说,公开课不是发布会,而是面向开发者的会议。确实,外界可能也会对微信有好奇甚至误解,所以公开课确实是一个微信对外阐述自己想法、理念的一个很好的机会。
但去年,我就想,微信团队现在这么大了,我们面临的问题,从早期的“怎么做”,到现在的“做什么”。早期我们聚焦于每一项功能,思考怎么做才是最完美的。
现在是思考,什么才是我们应该去尝试的,以及如何组织起来做。对团队来说,早期是考验我们的产品能力,现在更考验的是我们的组织能力。
我希望我们团队,在每一个领域都有杰出的深入的思考者。所以去年,我就在想,我不一定每年都来公开课讲。今年,我更乐意把时间让给我的同事们,让他们来给大家带来我们团队的思考。
当然,我个人也有一些小的思考点,可以在这里分享给大家。
信息互联的影响
可能从来没有一个时代,每天有数亿人花这么多时间,花在手机里面浏览各种信息。而微信,可能是人们花时间最多的应用。
所以我也经常会思考,微信作为一个基础的信息传递的工具或者说平台,我们一个不经意的动作,可能会引起信息洪流的流向的变化。
我们知道,基因编辑是一种非自然的选择。因为人类强行的改变了自然进化的进展。类似的,技术的进步同样改变了自然的选择。
人们看到屏幕上的视觉信息,超过了现实中眼睛看到的信息。人们看到的是远方的图像,听到的是远方的声音。从前一个人的世界,他的大小,是由他的脚的行走半径来决定的,现在一个人的世界的大小,是由他所获得的信息的宽广度来决定的。信息的宽广度和质量,一直是微信要解决的问题。
但人类对于信息的广泛连接带来的影响的思考,是落后于网络的发展速度的。网络的发展,尤其是最近几年移动互联网的发展,使得人人都随时在线,并且面临海量的信息。
这在历史上,甚至十年前,都是难以想象的。人们真的能驾驭这种信息互联吗?还是说,技术在引导甚至控制人们的生活方式?
可以从几个维度来看一看这种影响,包括隐私的出让,信息获取的被动,社会关系的扩大和复杂,信息传播的快速,信息选择的困难、信息的多样性,搜索的困难。
一. 隐私的出让
从历史来看,科技越发达,个人隐私会越少。人们在获取便利性的同时,其实也在不知不觉地一点一点把自己的隐私范围缩小。
比如精准广告和用户隐私其实是有矛盾的。作为平台,因为我们有大量的数据,什么该用,什么不该用,其实是我们一直思考的问题。我们在这里也倡导同行一起重视这个问题。
二. 信息获取的被动
你所看见的,或者说,你所阅读的,决定你是什么样的人,会有什么样的想法。互联网让信息唾手可得。可是,从信息的海洋中获取什么样的信息是个很有挑战的问题。
事实上,很多人并不愿意主动去获取信息,而是更倾向于被动获取。记得好几年前,我说过一句话,“推送改变世界,因为用户更懒了”。包括微信,也是基于推送的。你收到的每一条消息,都被你把优先级排得比你要真正要获取的信息的优先级要更高一些。
那么,推送什么信息,决定了用户会看什么信息,决定了他在一个什么样的世界里。这是一个我们要经常思考的问题,也是我们在努力的方向。
所以,我很少说分发这个词,我觉得推荐可能更尊重一些。
三. 社会关系的扩大和复杂
人是社会关系的总和。而如今,社会关系越来越多地体现在微信好友,群,朋友圈的互动里面。比如,中学、大学同学,因群而活跃起来。
过去,学术上有个词,叫邓巴数,是说一个人最多有 150 个好友。但在微信里,显然它被打破了。人们对于好友的维系能力,和移动互联网之前的年代相比,突然增大了很多。
之前我们限定一个人最多 5000 个好友,现在有将近一百万人已经接近 5000 好友。虽然不是真正意义上的好友,但也促使我们要扩大好友数目了。
我记得附近的人上线时,我自己其实都有隐隐的不安,因为从前我们和附近的人的界限将被打破,我不知道它是好是坏。
这种思考,其实会一直贯穿在微信的进化里面。就像我们扩大 5000 好友这个限定非常容易,但是对于它带来的影响,说实话诚惶诚恐,我们会反复思考。
四. 信息传播的快速
一方面,是信息比之前更快速地传播,可能一个瞬间,一个事件就可以迅速在很多个群里面,迅速的几何级数的传播。
另一方面,有一句话叫“谣言传千里”,耸人听闻的内容,可能能获得更大的传播机会。这是人性使然。
我们可能很难用技术手段作为一个判定内容的质量的标准,但作为信息传递的平台,我们也有很多办法,譬如说用更多的参与者和强大的机制,来帮助平台作出仲裁,就像我们对待原创和抄袭的做法很类似。
五. 信息选择的困难
看似我们面对海量信息可以自由选择哪一些看、哪一些不看,但事实上,我们不可能有时间去一一筛选,导致我们看到的总是局部。
包括公众号,看似可以随便关注,但是你的选择其实是有限空间的。我们在看一看里实验了社交推荐,看起来效果还不错。它是一种通过好友之间的互相推荐来扩大人的选择范围。
六. 信息的多样性
虽然头部大号会有最大的浏览量,但是在一个人人皆可创作的年代,我们希望长尾的小号都有自己的生存空间。这也是之前公众号一个忽略了的部分。等一下会再讲一下。
七. 搜索的困难
与 web 互联网相比,移动互联网的各个 app 更加割裂,信息难以打通、搜索。我们做小程序,就有一个梦想,希望搜索能进入到每一个小程序的内部,这样海量的小程序可以支撑起各种长尾的搜索需求。
当然,小程序仍然是我们一直要改进的领域,只有小程序足够繁荣,才能支撑起搜索的内容的丰富度。
关于“信息的多样性”的延伸
这里讲了我们对于信息普及、对于生活的影响,其中提到信息的多样性。这里也要说一下。
在微信的起步阶段,我就说过,我们基于手机来做 app,不基于 pc 来做。pc 端只是辅助。如果不是这样的话,我们没有办法将我们的产品普及到每一个人都能用。
回过头来看,我们当年有两个小小失误,一个是,公众平台。很长时间都只有 pc web 版,这限制了内容创作者的范围。
另一个是,也是更重要的,公众平台的原始想法是取代短信成为一种基于连接品牌和订户的群发工具,并且有效地避免垃圾短信。
群发的内容并不是重点,应该是各种各样的形式的内容都应该是可以的,如文字,图片,视频等。
但我们一不小心把它做成了文章作为内容的载体,使得其他的短内容的形式没有呈现出来,那使得我们在短内容方面有一定的缺失。这也是为什么之前我说,公众号本身并不是为媒体准备的这样一个原因。
我们很重视人人都可创造的内容。朋友圈之所以默认是发照片视频的,是因为当时我有一个认知,对于十亿人来说,让每个人发文字是不容易的,但是,发照片是每个人都可以做到的。
所以,相对公众号而言,我们缺少了一个人人可以创作的载体。因为不能要求每个人都能天天写文章。
所以,就像之前在公开课所说的一样,微信的短内容一直是我们要发力的方向,顺利的话可能近期也会和大家见面。毕竟,表达是每个人天然的需求。所以这里,也是作为一个对新版本的小预告吧。
春节即将到来,我们在红包上,也有一些新的创造,可能也会吸引你来发挥你的创造力,这里也预告一下。
今天我的分享就到这里。虽然这次我没有参与现场的演讲,但是我相信我的同事们同样会给你带来精彩的报告。
再次感谢大家。
活动推荐 更多人工智能与机器学习相关实践请持续关注 QCon 北京 2020,来跟业界大牛关注人工智能领域中正在兴起的技术和关键进展,探讨应用于机器学习问题的工程挑战及解决方案。目前大会 8 折报名中,点击【阅读原文】或识别二维码了解更多。有任何问题欢迎联系票务小姐姐 Ring:17310043226(微信同号)
今日荐文点击下方图片即可阅读
AutoML 取人代之?四个工程师两个数据集将之干翻!
你也「在看」吗???
阅读原文
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。 项目经理在线