范文写作网 > 计算机网络毕业论文 > > 基于Hadoop云计算模式网络舆情监控的探索(2)
计算机网络毕业论文

基于Hadoop云计算模式网络舆情监控的探索(2)

摘要:HDFS分布式文件系统,Hadoop 的分布式文件系统(Hadoop Distribution File System,简称 HDFS)起初是为了满足Apache旗下的网络爬虫项目Nutch的大量网络数据存储而设计开发,属于Hadoop项目的一部分。HDFS具备的高容
关键词:基于,Hadoop,云计算,模式,网络,舆情,监控,探索,摘

美的电磁炉故障维修,美第一夫人惹争议,kat-tun

  HDFS分布式文件系统,Hadoop 的分布式文件系统(Hadoop Distribution File System,简称 HDFS)起初是为了满足Apache旗下的网络爬虫项目Nutch的大量网络数据存储而设计开发,属于Hadoop项目的一部分。HDFS具备的高容错性是以往任何存储系统所不具备的,它为上层应用程序提供的接口能够进行高吞吐量数据访问,且能够满足超大数据集存储的需求。它可以和MapReduce编程模型很好的结合,能够为应用程序提供高吞吐量的数据访问,适用大数据集应用程序。

  MapReduce 是 Google 的核心计算模型是一种编程模式,MapReduce致力于解决大规模数据处理的问题,因此在设计之初就考虑了数据的局部性原理,利用局部性原理将整个问题。数据再处理之前就已经分布到各个节点上,处理的时候就近读取本地存储数据来进行简Map处理,将Map处理后的数据进行合并排序再分发到Reduce节点。主要运用的技术是把数据处理拆解成MAP(映射)和REDUCE(化简)的方式,这是该操作的核心,MAP把数据映射成不同的版块,分配给计算机运算,再通过REDUCE程序将结果整合,输出开发者需要的结果。

  四、基于Hadoop 云计算模式网络舆情监控模式构建

  大数据时代下云计算的提出给政府的网络舆情监控也带来了机遇,云计算中主要的Hadoop处理大数据著称,他的运行模式主要是在监控各种局域网Hadoop的技术也日渐成熟,随着web2.0时代,数据的迅猛增加,计算机硬件的革新也是给这个模式构建提供了有力的条件,综上所述,我根据Hadoop云计算模式构建了一套我国的网络舆情监控模式,见这一套是从收集到分析网络舆情信息提出一整套舆论监控模式,整合了如今已经有的Hadoop云计算计算模式,针对是对某一区域或多个地区的海量数据处理,但是这对大数据也提出了一下问题,例如信息源的法律问题、数据的传输和处理硬件支持、网络舆情中心的建设。

  技术的不断创新给网络舆情的治理带来了机遇也带来了挑战,面对当今数亿网民的网络环境,我们需要不断提高网络舆情监控和分析的技术,自动化的数据分析要对大数据进行处理,为了保障网络舆情安全科持续发展,面对可能涉及的信息隐私问题和数据的公开和共享,还有模式的应用都是,大数据对舆情分析的潮流和趋势。

  参考文献

  [1] 宋翎丹.大数据背景下的新媒体发展. 消费电子,2014.08

  [2] 互联网主题信息定向采集研究.http://www.doc88.com/p-2758103157528.html

  [3] 天玑舆情监测系统[EB/OL]. http://www.golaxy.cn/pro/. 2011

  [4] TRS 互联网舆情监控系统白皮书[EB/OL].http://www.trs.com.cn/products/wse/om. 2011.

  [5] 军犬舆情监控系统[EB/OL]. http://www.54yuqing.com/yuqing_16.html. 2011.

  [6] 王铁套. 突发事件网络舆情分析与威胁估计方法研究.解放军信息工程大学,2012

  [7] Flume日志收集-互联网和电子商务数据.http://www.dataguru.cn/thread-477981-1-1.html