您的位置:   网站首页    行业动态    对话丨新浪微热点大数据研究院

对话丨新浪微热点大数据研究院

阅读量:3739098 2019-10-24


研究院简介

“新浪微热点大数据研究院”于2019年正式成立,以数字化、网络化、智能化发展机遇为契机,号召、集合计算科学界和社科界知名专家学者,协调各方资源,共同在媒体传播大数据领域进行有效的研究和尝试。其所属的上海蜜度信息技术有限公司专注于舆情和大数据分析,在互联网信息采集、大数据处理和移动互联网领域拥有核心技术和知识产权。结合舆情分析和研究,公司发展了众多业务,其中使用较为广泛的包括新浪舆情通、微热点、铀媒等。
人物简介

刘益东,新浪微热点大数据研究院执行院长,新浪舆情通CTO。毕业于哈尔滨工业大学,拥有计算机学士学位以及软件工程硕士学位。2004年进入互联网(移动)行业,多年来从事互联网(移动)大数据应用研究与实践工作。在基于互联网(移动)海量数据分发,数据采集、数据清洗、数据应用等方向,拥有丰富的实战经验。
访谈凝要

访谈实录
 近年来网络舆情环境的变化
近两年来,互联网舆情的内容和形态都随着互联网趋势的发展在不断发生着变化。从关注话题来讲,更多舆情聚焦在民生或者公共事件方面;从形态上来说,舆情更多的在下沉,由原来的一些大的事件,慢慢地的开始向日常生活中琐碎的、民生类的事件去渗透。
 互联网上舆情监管模式的变化
首先从舆情事件的特点来讲,我们现在关注的互联网舆情类型已经有所变化。以往爆发的舆情有许多所谓的 “黑天鹅事件”,即会引起连锁负面反应、非常难以预测且不寻常的事件。随着公众对这类舆情事件逐渐熟悉和理解,我们现在更要关注的是“灰犀牛事件”,也就是大概率会发生的事件,不过往往因为它们比较显性,常常被大家所忽视,但实际上这一类事件的发生最终会引起较大的社会反响。
第二,在舆情事件的分析、应对和处置方面,我们在监管时要尽量避免由于误判舆情形势的演化而导致后续的处置不当或引发次生舆情。
第三,随着舆论发声更加个体化,在自媒体内容传播和管理方面,我们面临着更多挑战。未来我们需要对自媒体做好积极的管理才能在舆情发生、发酵的过程中及时掌控并做好应对。
 网络舆情管理的价值和市场空间
目前看来,舆情的监督管理正受到越来越广泛的重视和投入,尤其对于政府和企业,舆情的价值愈发体现了出来。
从政府的角度来看,国家层面对政务舆情的管理不断提出了新要求,国办在2016年、2018年、2019年持续发文要求各地政府加强对舆情进行及时的反馈、响应以及应对。
对于企业来说,舆情同样具有重要的影响力。以往企业对于舆情的理解可能不是很深刻,但现今在商业型社会中,企业的声誉一旦受到舆情事件的影响,企业商业价值就会遭受到沉重的打击,尤其是对于知名企业。比如在2012年湖南发生的“酒鬼酒”事件,当时“酒鬼酒”在网络上爆发了“塑化剂”的舆情,但可能在当时大家对于舆情还不那么重视,后来舆情不断发酵。受此事件影响,白酒板块全线大跌,11月19日市值一天蒸发329.9亿,酒鬼酒临时停牌。
对于舆情管理的市场空间,经过这么多年来在舆情行业的探索,我们已逐渐摸索出了政府、企业以及其他群体的市场需求,也逐渐形成了我们自己在市场中的清晰定位。对于政府而言,应对舆情的环节是先去发现、跟踪、分析,接着进行应对和疏导。对于企业而言,更加重视的是商业方面的消费生态圈,即企业首先是进行“社会化聆听”,然后深化对“用户的洞察”,最后与消费者建立连接、促成消费用户的转化。从这两个角度上便可以看出舆情以及新媒体数据的发掘都是有很大成长空间的。
 “新浪舆情通”的功能
 “新浪舆情通”是我们面向B端用户的一个产品,它通过基础功能和高阶功能两种不同的实现方式,来服务对舆情有不同需求的客户。
新浪舆情通最基本的功能便是“信息监测”,政府以及企业都可以借助我们的系统及时发现互联网上有关舆情的信息和与其商誉相关的信息,我们将此定义为“发现环节”。第二个基础功能则是分析功能,在发现舆情之后,我们便要对其进行深入的分析来发现背后的因果关系。目前我们已经能够对全网的事件、微博上的事件演化以及传播进行分析,这些都可以作为辅助用户的分析工具,让用户在较短时间内掌握事件的发展脉络以及关键要素。
在高阶功能方面,我们培养了专业的报告分析师,他们会针对某一事件或某一活动来做深入的分析挖掘,从而找出背后真正有价值的信息和规律来帮助客户规划和决策。
 “新浪舆情通”的优势
首先,从数据全面性来讲,我们在整个行业里都是出于领先地位的。我认为在大数据背景下进行舆情分析和应用,数据的全面性是要优先保证的。我们每天入库的数据量基本过亿,其覆盖的范围包含了社交网络、论坛、新闻网站、政府类网站以及新闻客户端和电子报刊。
其次,经过将近七年的技术积累和应用尝试,我们在挖掘手段和分析技术方面也形成了自己的优势。面对海量的数据,在做大数据的分析挖掘以及底层的存储应用时,我们也积累了一些特有的技术。同时,在这么多年与政府客户和企业客户的交流反馈中,我们也在不断迭代改进我们的产品,使得产品更加贴合用户的需求。
我认为这些就是新浪舆情通亮点所在,底层拥有海量的数据,对这些数据应用独家的存储和分析技术,同时和客户还有着良好的互动,能够把他们核心的需求融合进我们产品的迭代中去,整体形成了一个良性的循环。
 “新浪舆情通”的先进技术
我们技术的先进性主要体现在对海量数据流的接收、存储以及分析上。
首先,我们优化了数据平台的底层设计来保证信息进入系统的快速性和及时性。现在对于大数据的挖掘存在在线和离线两种形式,离线分析对系统的大批量运算能力要求很高,而在线分析则对缓存的机制提出了挑战。海量的数据不断地进入,基于整个数据流,我们设计了一套实时计算的框架,实现快速而准确的热点识别。
其次,我们也将最前沿的自然语言处理技术应用到了对文本的分析中。在互联网时代,国内的网民更多的是以中文来表达自己的情绪和评论,所以文本分析中最核心的一点就是对中文内容进行挖掘,应用到的便是“自然语言处理”的技术。在我们的产品中,我们对每一则文本信息都实现了自动化的情绪、情感识别,判断其是敏感的、非敏感的还是中性的,或者判断它表达的情绪是喜、怒、哀、恐还是惊。对于每一条内容,我们都会实时地做一些情感情绪上的标记。除了对文本内容进行情感分析,我们还实现了对文本的属类划分,使其更具有商业价值。在数据进入系统时,我们就实时做好分类,比如判断某条信息是和汽车行业相关,还是与金融行业或是医疗健康行业相关,这样就能针对不同行业的用户更专业地进行服务,让他们看到的更加精准的信息。
除此之外,很多客户对回溯功能有所需求,比如要做跨度为半年或一年的盘点,那么就需要将历史数据留存下来,其相对应的数据可能是百亿级别的。如何利用好这百亿级别的数据做好挖掘尤为重要。基于这类情况,我们在离线框架上发展起了一定的技术支撑,从这样信息密度较低的海量信息中挖掘出核心内容,梳理出发展趋势。
 “新浪舆情通”主要的服务对象和合作模式
我们的客户分布很广,既有政府部门,也有企业单位。在政府层面,上到部委省一级别的单位,下至地市级、县、乡镇甚至街道都有我们的客户。他们使用我们产品的目标其实是大同小异的,都希望利用好政务舆情,做好社会的运营管理,服务好辖区内的民众。而对于事业单位及企业也是如此,举例来说,部分学校类的客户或者一些教育培训中心会比较关注家长或社会对自己学校的评价,会吸纳民众的建议和投诉进而有针对性地做一些服务的改善和提升。所以我们会根据客户们的需求来整合相应的功能,服务好他们。
 新浪微热点大数据研究院的成立背景和目标
其实在两三年前我们便萌生了成立研究机构的想法。尽管现在媒体大数据的研究已经有很多阶段性的成果被应用在交通、医疗、安全等方面,但是我们认为它所能应用的范围还可以更广阔,其应用深度也可以更深。然而这些单靠一个企业的力量来推动实现相对来说视野会比较局限,所以两年前我们便开始与一些科研机构以及高校的研究团队在传播学、新闻学、计算科学等方面尝试一些合作,在合作的过程中我们也收获积累了很多成果。到了今年上半年,我们认为时机成熟了,公司也具备了相应的条件,所以就决定将研究院正式成立起来,将其打造成一个基于媒体传播大数据的研究平台,能够让传播学、计算科学以及社科类学科在这个平台上交叉融合,去碰撞出更多的科研成果,好的学术研究也能留存下来进行成果转化,这就是我们成立研究院的初衷。
研究院成立之后,我们也确立了十分清晰的工作目标和战略定位。
第一点,大数据研究院要做的是“前沿科技的探索研究”。这也是研究院首先需要承担的职责。大数据、云计算、人工智能都是研究院接下来要去尝试的方向。
第二点是“应用科技的研发创新”。我们公司在大数据的产品化应用和研究上有五六年的经验,发现在这个领域中有很多现实的生产问题有待解决,我们也想通过研究院这个平台来解决目前遇到的一些技术上或产品上的瓶颈与问题。
第三点就是依托研究院的平台我们要去开展更广泛的学术交流合作。比如我们与中国计算传播协会一起举办了第一届传播大数据挖掘竞赛。全国有四十多所高校,上百支队伍参赛,我们也给其中的优秀团队提供了科研和产品使用方面的支持。我们也想通过这样的一个平台去开展更多基于数据的科研类、探索类的比赛,能够让更多点子在这个平台上开花结果,大家相互学习,共同成长。
第四点则是通过这个平台我们可以更广泛地和高校合作,推出我们的学术支持计划。一直以来有很多高校的老师和学者都有大数据研究相关的一些需要,他们苦于没有专业的、全面的数据而找到我们,我们也陆陆续续做着一些无偿的支持。有了研究院这个平台我认为可以让这样的支持活动变得更广泛、更全面,让更多的学术机构、学者专家们都从中受益。我相信在帮助他们完成科研项目的同时,我们也一定能收获到很多新领域中的新知识和新技能。
 研究院目前在开展的产学研项目
考虑到目前舆情特点的变化,要避免“灰犀牛事件”,我们要做的就是总结过去几年同类型事件的发展有何规律,结合规律去看待正在发展中的事件。这样一来,我们就能大概率预测它们发展的路径并做到及时有效的介入。要实现这一点,其实十分依赖于专业的案例库,通过案例库不断的研究分析整理,才能逐渐形成参考的范式。
另外我们与某行政学院也有合作,给他们的课堂提供基于大数据、基于政法类的舆情案例作为研究的教材,让广大学员在参与培训的过程中更深入的了解大数据与实际工是如何结合的,这其实也能让我们更深入地去理解在某一个垂直的政府行业或类别里应该如何做好数据挖掘。
高校方面,在很早之前,我们就与哈尔滨工业大学在自然语言处理的底层技术方面开展了合作。哈工大相关的研究中心在这方面已经有了十几年的积累,我们很多产品其实就是来自科研成果的转化,这便是“产学研结合”。他们来做研究,我们来做产品化,最后能够把一个纯学术的研究变成一个面向市场的、好玩的、有用的产品。我们与上海交通大学、清华大学都有着类似的合作,围绕着产品和科研发展方向来做结合。
采访实录丨李冠颖 杨凯淇
采访整理丨杨帆
采访剪辑丨陈蕾

在线QQ咨询,点这里

QQ咨询

微信服务号