本文共 2364 字,大约阅读时间需要 7 分钟。
大数据是相对于一般数据而言的,目前对大数据尚缺权威的严格定义,较为普遍的解释是指“难以用常规的软件工具在容许的时间内对其内容进行抓取、管理和处理的数据集合。”①全球数据每年新增40%,全球信息总量每两年就可以翻番。2011年全球新产生和复制的数据量达到1.8ZB(ZB即一千EB或百万PB),如果内存为32G的iPod来存的话,数量达到575亿个,足以砌起两座长城,由此可见大数据时代已经到来。大数据不仅是一种资源,也是一种方法,被视为创新和提升生产力的下一个前沿,正成为国家竞争力的要素之一,在世界范围内日益受到重视。多国政府加大了对大数据发展的扶持力度,甚至上升到国家战略的高度。美国就认为,谁掌握了数字数据传播和控制的主动权和主导权,谁就能赢得未来。
互联网在我国的迅猛发展,极大地丰富了信息传播的渠道。新闻与评论、搜索引擎、BBS以及网络社区、时事论坛、博客、维客、即时通信软件、Email和短信等成为民众对社会当前各种现象和现实问题发表观点、表明立场的多元化传播渠道。但网络舆情的传播是一把“双刃剑”,在传播社会正能量的同时,也具备放大负面效应的作用。近年来,网络涉军舆情层出不穷,既有如“联合军演”“海上争端”等正面信息,也有如“军车打人事件”“风景区的军车”等负面信息。无论是正面信息,还是负面信息,如果处理不及时,不加以引导,都会造成难以控制的影响。因此,面对以量大(Volume)、增长快(Velocity)、多样性(Variety)和高价值(Value)为特征的网络舆情数据,如何把握网络传播规律,积极做好网络舆情引导,加强网络涉军舆情管控,大数据无疑是当前值得高度关注的重要方法手段。
一、大数据为网络涉军舆情管控创造了新机遇
(一)大数据成为社会热度“仪表盘”,为监测预测网络涉军舆情提供了可能
随着互联网的发展,大众往往选择在网络上发表各自的看法。大数据可完整记录网络上的这种社会舆情和民意,网民在网上产生的海量数据,记录着他们的思想、行为乃至情感,这是信息时代现实社会与网络空间深度融合的产物,蕴涵着丰富的内涵和很多规律性信息。一定程度上,网络舆情大数据成了人类生存痕迹和心理变化的记录仪,成为不折不扣的社会热度“仪表盘”。通过这一指示器,可清楚地记录当下社会民众的所思所想。利用短信、微博、微信和搜索引擎可以收集热点事件与挖掘舆情,通过分析相关数据可了解大众需求、诉求和意见。对于单位时间段内舆情事件的烈度不断升高的事件,可以通过大数据挖掘找出来,提前提供预警提示,为监测预测涉军舆情提供了可能。例如,2009年开始运行的“人大—方正舆情监测分析系统”,依据网络事件烈度指标定量分析方法,能够将单位时间段内舆情事件的烈度超过60分以上的热点事件全部找出来。
(二)大数据成为社会深度“显微镜”,为洞察挖掘网络涉军舆情提供了可能
美国麻省理工学院斯隆管理学院的经济学家埃里克·布吕诺尔夫松(Erik Brynjolfsson)说,要想领会大数据的潜在影响,你得看看显微镜。②发明于4个世纪之前的显微镜,使得人们以前所未有的细胞级水平观看和测量事物。这是测量的一次革命。布吕诺尔夫松教授解释说,数据的测量正是显微镜的现代等价物。大数据可使对社会舆情的监测和测量达到个体级水平,而不再是传统web1.0时代舆情监测的整体性描述,大数据使得细节化、即时化地测量个体的行为和情绪变成了可能,通过关联时间、空间和社会关系等诸要素的数据打包分析,并通过一定的隐私保护,借助其“电子痕迹”对个体进行社会行为刻画,通过巨量搜索数据见微知著,在此基础上展现出个体的社会心理变化。
(三)大数据成为社会关系“沉淀池”,为关联分析网络涉军舆情提供了可能
目前,从整体发展来看,社会科学的研究已发生转向,由原来对“个体属性”的关注转向为对“社会关系”的关注。大数据不仅仅记录网民的话语和内容,还记录网民之间的社会互动和社会交往方式,乃至网络族群之间的界限和相互勾连,可以说大数据是社会关系的“沉淀池”,改变了传统舆情只见“内容”不见“关系”的境况。通过一定的数据分析手段,不仅可描绘出网民的“社会话语表达”,且能够清晰地描绘出网民的“社会关系网络”和“心理文化地图”,从而改变web1.0时代单向度的舆情监测。依托大数据的社会关系分析,可以将其与情报源进行关联分析,以生产更高价值的信息。
二、大数据视域下网络涉军舆情管控面临的挑战
(一)舆情管控内容由“单维”向“多维、异构、非结构化”转变
大数据具有多样性,即数据类型包括结构化数据,也包括非结构化数据。随着大数据时代的到来,传统舆情研究只重视网民话语表达的单向度研究的视角必将改变,话语作为一种外在的社会表达,属于浅表层面,不能够有效窥探出网民群体的社会行为、社会心理和社会诉求。借助大数据,舆情研究的视角将更加多元化,未来舆情研究的视角将转向对社会话语表达、社会关系呈现、社会心理描绘、社会诉求预测等多方面、多向度的研究,通过这样的研究转型,社会舆情研究将真正成为一门与多学科交叉的社会科学。但非结构化数据语音、视频、图片等,仍是网络涉军舆情管控的难点。根据Cisco公司VNI报告(2012-2017),在2012年末视频占全球消费者互联网流量57%,预计2017年此值为69%,如果计入P2P,2017年此值为80%-90%。对非结构化数据的分析需要有先进的语义技术和基于元数据的标签算法等,尽管语音的机器翻译有了可喜进展,但视频图像的智能识别仍然比较遥远。2012年斯坦福大学与谷歌合作建立深度学习网络,对来自YouTube的上千万视频帧自主学习,用10天学会了识别猫的脸孔,然后从2万张未见过的照片中找猫,准确率只达到15.8%。
本文转自d1net(转载)