2017年4月5日,北京中关村清华科技园,快手CEO宿华在快手总部接受南方周末记者采访。(南方周末记者张涛/图)
(本文首发于2017年4月27日《南方周末》,原标题为《快手的“无形之手”》)
为了让机器更加公平和公正,快手的工程师们给机器定了一个“公理”,建立了一个数学里的规则社区。
跟大多数有智能分发功能的互联网产品一样,快手的产品模式是,把人和信息做精准匹配。
快手CEO宿华介绍,一个快手的新用户,在冷启动的时候,机器首先会根据用户的注册资料、手机机型、地理位置和周边用户等情况,对用户做一个特征分析。当用户有了使用行为,浏览了内容后,快手的机器会根据用户的兴趣和爱好,升级用户特征库,进而给用户匹配更精准的内容。目前快手的用户特征库已经高达数百亿条。
如果这个用户开始发视频,快手的机器会对内容进行识别,把这个内容匹配和分发给其他可能对这个内容感兴趣的用户。
机器要实现对用户兴趣的精准识别,需要一定时间。比如宿华从小喜欢二胡,这并不是一个大众爱好,一开始系统并没有发现他这个爱好,过了一段时间机器才开始给他推荐一些二胡视频。宿华说,很难说机器用了多久发现这个兴趣,没有一个特别清晰的临界点和边界,像交朋友一样。
由于去中心化定位,所以快手的算法机器的作用就更大,因为一切注意力资源,都交给了机器来分配。这只快手上的无形之手,决定了你的内容被推荐给谁,被推荐给多少用户,也决定了是否给你直播权限。
这个机器是快手的人工智能技术和核心算法。它的作用是,理解用户上传的内容,然后把这个内容跟其他可能对这个内容感兴趣的用户进行匹配。
宿华介绍,快手人工智能技术的核心是三点。一是对内容属性的理解,二是对人的属性的理解,三是人与内容的互动。
内容属性的理解主要是识别照片、文字和视频内容。目前互联网行业的技术,在识别文字和照片的技术已经相对成熟。不仅能识别出一篇文章的类别(军事、体育和娱乐等),还能识别出一篇文章的情感(高兴、悲伤、贬低或赞扬)。但视频内容的识别技术还有待突破,目前只能识别场景(市内室外、酒吧、操场)。
宿华举例说,一段恋人拥抱的视频,人能简单分辨出来这是分别的拥抱。但机器识别不了这个拥抱是久别重逢还是短暂分别,是开心相聚还是悲伤离别。
“机器能识别是一只宠物,但是猫还是狗?是狗的话,什么狗?这些是更需要突破的技术。”宿华举例说,他发了一个自己小孩坐在玩具车上打瞌睡的视频。机器能判断视频里有一个孩子和一辆车,但机器目前还识别不了这是真车还是玩具车。
这个视频又不能简单地推送给发过孩子视频的用户。因为那些用户可能只喜欢自己的孩子。就算用户喜欢别人的孩子,但到底喜欢胖孩子还是瘦孩子,这些细节的差异,都需要机器去学习。
为了精准匹配,机器会进一步发现这个视频里其他细微的特征。
“每一个特征都是机器在猜测,然后做验证,这是一种弱决策,但很多弱决策叠加在一起之后,就变成了强匹配。”宿华说,这些特征在快手是百亿级存量。
对人的属性理解,则分成短期属性、中期属性和长期属性三块。其中,长期属性是出生年月和地区等。中期属性是兴趣爱好。最难识别的是短期属性,比如一个人搜索“苹果”,今天可能是想吃苹果,明天可能是想买一个苹果手机。这些属性是瞬息万变的,也最难识别和判断。
判断一个人的短期属性很难,但也更有价值。曾光明举例说,一个人是皇马的球迷,他希望看到皇马的消息,但可能不太想看到皇马输球的视频,如果你在不恰当的时候把皇马输球视频推送给他,他可能很不高兴。
人与内容的互动则指的是用户之间的点赞、关注和评论等行为。这些数据有助于机器预估一个人的兴趣爱好。数据互动最难的是需要时间沉淀、用户量积累和用户活跃度。
曾光明说,为了让机器更加公平和公正,快手的工程师们给机器定了一个“公理”,建立了一个规则社区。
在这个法治社会里,即便是宿华本人,如果没有上升力的内容,也很难被自己开发的机器所认可。宿华透露说,他的粉丝只有九十多个。