今日头条:人工智能时代的媒体技术革命


今日头条的人工智能技术实践

 


媒体形式的历史变迁

 

  • 传唱史诗,公元前2000年《吉尔伽美什》
  • 书籍,公元前1000年《尚书》
  • 报纸,公元200年《威尼斯公报》
  • 广播&电视,20世纪20年代匹兹堡KDKA电台贝尔德的电视机
  • 互联网,20世纪70年代互联网雏形ARPANET诞生

 


从人工到智能算法的媒体革命

 


2016年是一个历史拐点

 

“近日,第三方监测机构易观发布了一个具有“里程碑式意义”的数据:2016年,在资讯信息分发市场上,算法推送的内容将超过50%。这将成为一个分水岭。它意味着,我们以后接触到的信息,将主要由“智能机器人”为我们准备,而以往看似不可或缺的“人工编辑”角色,则不可避免地被边缘化。自2012年今日头条开启算法分发的尝试,4年之后,算法时代正式宣告来临。”

 


互联网时代内容分发形式的变革

 


智能算法给内容分发带来的红利

 

  • 门户,人工精选内容,质量有保障。分发效率低,日均分发数百条内容,用户长尾兴趣无法被满足。
  • 社交媒体,个性化,内容分发效率高,信噪比低,充斥大量不感兴趣的内容。
  • 社交网络,个性化,内容分发效率高,互动性好,信噪比低,充斥大量不感兴趣的内容。
  • 算法推荐,个性化,内容分发效率高,需要更多,更好的数据。

 


字节跳动是移动互联网成长最快的公司之一

 

一直被模仿,从未被超越:大量的“山寨”头条追赶,其中不乏互联网巨头,均落后于头条。已有美、日、印尼等国的互联网公司宣称自己是“xx(本国)”的今日头条。

  • 2012.3,字节跳动成立
  • 2012.8,今日头条APP上线
  • 2012.12,日活跃用户超过100万
  • 2013.5,B轮融资
  • 2013.7,日活用户超过1000万
  • 2014.6,C轮融资
  • 2014.12,超越所有国外同行
  • 2015.11,日活超过3000万推出短视频平台
  • 2016.8,用户规模超过5.5亿日活跃用户超过6000万

 


传统内容分发平台纷纷拥抱算法推荐

 

除了以今日头条为代表的新兴智能推荐平台,传统新闻APP,浏览器,搜索应用,社交平台(Facebook,微博)纷纷上线资讯智能推荐功能。

 


基于智能算法的内容推荐

 

推荐系统的核心算法可以根据用户标签,内容标签和情景信息,计算用户对内容感兴趣的概率。

 


典型推荐算法

 


典型推荐特征

 

相关性特征
  • 关键词匹配
  • 分类匹配
  • 主题匹配
  • 来源匹配

上下文特征

  • 上一刷内容
  • 最近N次推荐内容
  • 最近N天推荐内容

环境特征

  • 地理位置
  • 时间

热度特征

  • 全局热度
  • 分类热度
  • 主题热度
  • 关键词热度

协同特征

  • 点击相似用户
  • 兴趣分类相似用户
  • 兴趣主题相似用户
  • 兴趣词相似用户

Bias特征

  • 用户先验点击率
  • 用户性别
  • 用户年龄

 


基于智能算法的文本内容分析

 

文本内容自动分析是新闻推荐系统的基石,主要应用包括精细分类,主题分析和实体词提取。

 


典型的层次化文本分类算法

 


实体词识别算法

 

 

对全自动化的智能推荐引擎而言,准确快速的图像识别对于分析内容特征,广告色情识别至关重要。

 


一种识别易引起不适图片的算法

 

 

人工智能已经可以在财经报道,体育赛事报道等领域自动创作内容,可读性完全可以媲美人工编辑。

 

 

封面选择对视频的点击率有重要影响,智能算法可以自动给出封面建议,减少视频上传者的选择成本。

 

 

智能算法可以从体育比赛,MV等长视频中自动抽取精彩片段,甚至生成gif,可以节省用户时间和流量。

 

推荐文章

沪公网安备 31010702002009号