- ·上一篇文章:智能音箱变窃听器:你的私人对话已录音并发送
- ·下一篇文章:Facebook首席AI科学家:正设计自主芯片过滤视频直播内容
一点资讯技术副总裁王元元:信息流的未来与人工智能的机会
块分析下,算法特别容易去解决刚才说的5秒钟记忆的内容分发问题。为什么?它只需要做到一点,只需要做到一个很精准的点击率预估就行了,不需要对内容进行更多的分析,不需要对用户的长期行为跟踪做出更多的监测,以及针对长期行为的优化。我们看到算法一般产生效率,之前也提到了,所谓的数据和目标的设定就决定着它的效率。高的效率就来源于海量的数据和易于优化的目标,我们要克服这个问题,就需要针对数据和目标来进行处理。现在的数据,如果都是用户的一些行为数据,这个系统里面没有专家的数据参与进来,大量都使用无监督的学习方法,当然效率非常高。但是,我们永远没有可能想要的内容和推荐系统迭代的状态。目前绝大多数的用户行为数据,也是通过用户的被动反馈来的。意味着算法只是为了讨好用户,我们收集来的数据是有上限的。一方面从流量角度来讲,要注重分发的效率。另外从主动引导的角度,可能牺牲一部分的流量,也需要去试探用户更多的兴趣,这两方面的结合,也可以让数据的价值不停提升。从目标角度来看,现在有很多的像点击率或者是时长这样的目标,也是能够被很好地去优化推荐系统,但是好的系统可能不只考虑点击率目标,可能还需要把用户的时长分享,甚至于他阅读的行为连贯性,甚至仔细程度都刻画进来。短期收益和长期收益指什么?我们的算法只是很短视,只看他当前点不点这篇文章,这个系统实际上非常短视的,可能给点击率高的内容。但很可能来了,怎么样用算法延长他的刷新次数,和提升观看率,这个时候算法是比较难做的。刚才讲到个性化分发和内容价值的问题,我们也提出了以兴趣分发的核心系统。不希望仅仅通过深度学习、效率优先的方法,同时把人的知识补充在预先的结构中,会主动去思考每一种人群的兴趣是什么?每一个兴趣下面最优质的内容又是什么?这些主动的思考,一定会推送给用户更加有价值的内容。我们看到传统的媒体都在往PGC内容发展,这不仅意味着简简单单换个名字,也意味着他们创作内容的方式和筛选内容的方式,也是朝着新媒体、个性化资讯平台的需求演变。自媒体平台的发展近期可以看到,整个行业内自媒体号的数目非常庞大,这也对内容的分发或者是内容的筛选带来一些挑战,怎么样从海量的账号中筛选出有价值的东西,也需要算法花很多时间去做。整个算法在自媒体生态中,能够做的事情其实还蛮多的。比如说可以根据整个APP上面流量的分布,能够去精细地制定出供需关系,引导自媒体的作者针对性地生产。能够在注重分发效率的同时,也能够给特定的一些自媒体作者去进行流量的保护,比如说新的优质的自媒体账号,给他进行一定的保量。在提升自媒体作者创作效率的角度来讲,可以通过全网的聚合,各种素材的自动整理,也能够帮助自媒体作者更方便的创作。现在版权问题非常严重,怎么样通过全网抓取版权识别机制的实现,也能够帮助自媒体作者去保护他的权益。刚才讲到整个行业的发展,经过了非常爆炸式地发展之后,现在从国家的角度也越来越把行业纳入到正常监管范围内。从现在来看,整个行业来讲,我们都需要拥有资质,或者是持证上岗是个常态。这个地方也是给还是处于野蛮生长阶段的信息流服务商,也提出了一些挑战。这个地方算法在整个的监管背景下,其实也是在努力做一些事情,能够提高或者是促进整个行业的转变。一方面可以去打压低俗的文章,我们做得事情是收集更多的低俗文章内容,进行针对性地训练,整体性打压内容在平台分发的趋势。另外,组织一些好的正能量文章,也可以利用机器学习的方法,让这些内容更多地展现在客户的手机上面。最后,整个信息流行业从大家的百花齐放到可能会朝着一些重要的基础设施转变,现在可以从2012年开始像一点资讯、今日头条纷纷推出了客户端。紧接着各大门户开始跟进,基本上门户都已经信息流化了。2015年开始,厂商、浏览器也作为一支重要的力量,参与到信息流行业当中来。现在浏览器的用户也成为整个信息流用户大盘子中最关键的一部分。从2016年开始,很多工具类的应用,纷纷也推出了信息流。像淘宝、京东都做了各自领域垂直化的信息流。也看到了因为信息流在提升收入,在增加用户黏性方面的巨大价值。我们认为现在百花齐放,可能最好是说能够通过一些基础设施的建设,能够帮助大家更方便的完成这方面工作。我觉得一个统一的基础设施的价值是非常大的,首先从创作者角度来看,我们的内容从一个地方上传就可以全网分发。从用户角度来讲,你的画像,你的行为聚集在一块,更有力的推送比较好的结果。从广告主来说,你的广告投放能够触达更多的用户。从监管部门来讲,也便于更好的管理。合作伙伴来讲,能够节省很多的审核风险,只需要专注于它的产品能力,提升它的竞争力。这是各方共赢的趋势,我们认为有必要给行业内所需要的企业,提供强大的开放平台,进行赋能。
一点资讯技术副总裁王元元:信息流的未来与人工智能的机会