浙报集团“媒立方”媒体智能化转型


浙报集团“媒立方”如何改造内容生产流程——大数据与人工智能背景下的媒体智能化转型


核心阅读:在大数据与人工智能技术飞速发展的时代背景下,媒体行业通过对新技术的应用,服务于自身的历史使命与社会价值。展望未来技术发展对媒体内容生产与传播渠道建设的变革,本文将从内容生产、传播渠道、数据建设三个方面论述浙报集团在大数据与人工智能背景下,对新技术应用的探索研究与实践。

一、内容生产智能化

1.快速获取新闻线索

现在社交媒体已经成为了一个实时信息的海洋,越来越多的突发性事件都会在社交媒体上迅速生成爆点。

运用最新的人工智能技术可以通过网络爬虫,获取实时的消息和信息,然后进行内容特征词的抽取计算,快速地提取发现新闻线索,再通过多渠道验证和排重等方式来排除无效内容和判断消息的真伪性,从新闻时效性和真实性上提升内容质量。在这个领域,浙报集团已经有了实质性的工作成果。

2.高效的信息整理

人工智能在数据的处理能力和处理速度上的优势是传统算法技术所无法比拟的。通过人工智能可以快速地提取核心观点、事件发展趋势、舆论情感导向、分析事件传播路径,让新闻生产者迅速了解整个事件的来龙去脉,提供创作思路,从而缩减创作的时间,提高新闻价值。

另外,人工智能技术也可以根据分词后的数据结构,给文章及其相关信息自动地打上标签,为后续如分发渠道的选择或面向用户的个性化推荐,打下坚实的基础。

3.提升内容创作能力

随着人工智能技术的发展及愈益成熟,人工智能代替人类进行稿件创作似乎已经成为不可回避的趋势,如今机器人写作早已不是什么新鲜事。

但写作机器人的存在,并不是取代记者和编辑,而是解放了劳动力,让采编人员将精力集中于社会更深层级的思考、对情感诉求的挖掘,新闻创作过程中的人文价值思考是人类记者最核心的竞争力。

目前,“媒立方-资源中心”能够为采编人员提供规律性的机器人稿件,采编人员在创作中可以快速引用准确信息。

二、传播渠道自动化

1.智能化的内容分发

相比编辑人工分发,智能化分发的优势主要有以下两点:

①对大量内容进行快速的深度加工

人工干预的内容数目受限,往往集中于最热门的头部内容,而机器分发则可以覆盖与用户生活、个人兴趣相关长尾的新闻报道之外的资讯,通过记录、分析用户的浏览行为,从信息源中提取分类、主题、标签、风格等结构化信息,利用用户的行为探索并发现有潜力的内容。

②跳出编辑个人主观视野,实现个性内容展现

算法排序的核心是根据用户、内容、上下文信息决定实时计算每个内容的得分,按照得分进行排序。由于考虑到了用户的信息,排序结果是个性化的。另外,模型的更新也是实时的,能够充分利用已有数据,指导下次分发,最大化地优化分发效率。

基于大数据分析,经过不断的实验,浙报“媒立方”在新闻客户端上进行了推荐场景的试点,并且正在把实验成果推广到不同的内容分发渠道。



2.内容与渠道的融合

技术的发展必然带来媒介形态的变革与创新,智能硬件、植入式设备、人工智能、VR等新技术在未来或许将为我们开启全新的媒介图景。

现阶段,浙报传媒在互联网渠道发展的背景下,已经基本实现了“互联网内容载体”的融合,将“载体融于渠道”,从传统媒体以载体为单位生产内容,转型成为互联网媒体的以类型为单位生产内容。

我们不止步于此,在大数据与人工智能的背景下继续探索。

现在的内容生产,是把渠道作为背景,生产结果适应于渠道。比如一篇文字稿,适配网页、APP页面、通知消息等。其中又由于渠道的个性特征,不同渠道的稿件标题与通知内容各不相同。当编辑完成内容创作之后,还要考虑不同渠道的客户特征和点击通道设计表达方式。

未来,媒体将不同新闻推送到不同渠道时,通过大数据,人工智能帮助编辑使用各渠道最佳的信息表达形态,在不同产品中呈现同一条新闻的文本、图形、音频、视频等不同状态。

三、数据分析能力建设

媒立方-数据分析系统

1、数据处理分析能力提升

①智能数据报表

通过对大量数据分析行为的监测,机器通过这些行为材料学习分析者的分析过程与目标,进而自动生产分析者关心的数据报表。

②智能问题排查

在产品数据分析的过程中,问题的排查是最耗费时间的工作。通过人工智能的方式,我们可以利用机器解决大量的问题排查工作。在执行上,我们将大量的产品数据给予机器,使机器自行分辨数据的危险信号。获得危险信号时,查找问题,并把查找的过程数据给予机器进行进一步学习,最终使机器习得分辨危险数据与查找问题的过程。

③智能运营方案

数据分析的目的是优化产品,提升利益。为了使数据能够帮助我们获得更大的收益,我们希望机器能够帮助我们制定更加科学有效的优化方案。我们通过产品数据训练机器,使机器达到对产品运营状态的分辨能力,进而帮助我们完善运营工作。当机器通过数据的监控认为服装模块的用户收藏数据停滞超过3天,就会提出针对服装主题的活动方案,且计算投放人群等。

④全网数据搜索

大量的用户出于工作或者研究的需求,在网上寻找各种数据分析报告,我们将通过用户搜索词、数据分类、时间范围、用户群等数据的采集和整理,获得提供机器学习的基础材料。机器训练后可自动生成用户与搜索词对应的数据报表。

未来,大数据考核系统在优化媒体集团的绩效考核体系的同时,也将为内容生产人员生成能力画像,构建个人能力评估模型。通过模型辅以专业的人力资源管理,指导企业员工的职业规划与发展。同时可配合组建各类专项报道小组,提供适配稿件创作主题的最适合的团队组成成员方案,平衡团队能力以最大程度地满足报道需要。

2.基于大数据的绩效考核

在媒体融合发展的背景下,传统媒体历经多年形成的侧重于稿件、版面、图片等的纸媒采编业务绩效考核体系,已与新的统一采集、多种生成、多元分发智能内容生产模式不相适应,传统媒体需实现从关注量到关注质的转变。利用大数据、云计算等技术,实时掌握媒体原创内容在全网环境中的传播力、公信力、影响力,实现对媒体多种形态、多元载体、多样渠道的内容产品的转载、互动、传播情况的评估、分析与绩效考核,从而推进深度融合,推动从相加向相融转变。

正是在传媒变革背景下,浙报集团以大数据智能分析为基础,结合自然语言处理技术与数据挖掘技术,构建了全新一代传播力评估指数,以此为基础探索建设融媒体大数据智能绩效考核体系。绩效评估与考核算法模型改变了单一、离散、缺乏融合的传播评价模式,围绕传播力、公信力、影响力三大要素,从阅读指标、互动指标、转载指标三个维度建立基于全媒体形态的分层加权计算传播力指数模型。

3.数据仓库

相比于传统数据模式,大数据背景下的数据仓库主要有以下优势:

①涵盖面广泛,数据保留时间长

数据仓库涵盖了用户行为数据、内容生产数据、视频音频数据、各大门户网站数据、微信微博数据、合作数据等。几乎囊括了新闻端所有的数据,保留时间长久,一般可以保留数年的数据,可以自定义保存时间,极大可能地保留了历史轨迹,为数据复盘提供保障。

②提供统一的数据接口,数据服务

数据仓库是所有新闻数据的储藏室,是数据交换的中转站。为数据产品提供数据服务,提供实时、离线、全方位、多角度的数据,全面展示各类数据场景。为外部数据需求、临时数据需求提供数据接口,开放了数据接口,满足了多方位的数据需求。

③稳定、准确、及时

具有一套完善的数据质量检查系统,对数据采集、数据计算结果进行严密的监控,一旦发现数据异常,将会通知相关责任人,立即检查分析原因并解决,以保障数据的正确性。具有完善的监控预警系统,数据任务一旦出错,就会立即以短信和电话的形式通知相关人员,及时响应解决,保证数据的及时产出。

数据仓库在扮演着越来越重要的角色,推动业务的快速发展,对于未来的数仓,我们希望可以进一步实现:基于数仓搭建推荐引擎,提供高质量的个性化推荐服务;快速搭建或升级自有系统,提供高质量的竞价、投放、受众定向、营收预估、相关性评估等核心能力;提供企业多维度信息查询,深度挖掘企业与企业、企业与个人关系链路。