您现在的位置 >> Hadoop教程 >> Hadoop实战 >> hadoop,hdfs专题  
 

Hadoop的 “ 生态圈 ”

【作者:Hadoop实战专家】【关键词:数据 系统 HDFS 处理 管理 】 【点击:49073次】【2013-08-1】
Hadoop生态系统的图谱,详细的列举了在Hadoop这个生态系统中出现的各种数据工具。* Huge data had to saved- HDFS was born!* Hiho and sqoop for loading data into HDFS – RDBMS can join the Hadoop band wagon!  

相关热门搜索:hive 查看数据库命令

大数据标签:hadoop hdfs mapreduce hbase hive mahout zookeeper sqoop flume bigdata

Hadoop生态系统的图谱,详细的列举了在Hadoop这个生态系统中出现的各种数据工具。

* 这一切,都起源自Web数据爆炸时代的来临
* 数据抓取系统 - Nutch
* 海量数据怎么存,当然是用分布式文件系统 - HDFS
* 数据怎么用呢,分析,处理
* MapReduce框架,让你编写代码来实现对大数据的分析工作
* 非结构化数据(日志)收集处理 - fuse,webdav, chukwa, flume, Scribe
* 数据导入到HDFS中,至此RDBSM也可以加入HDFS的狂欢了     - Hiho, sqoop
* MapReduce太麻烦,好吧,让你用熟悉的方式来操作Hadoop里的数据     – Pig, Hive, Jaql
* 让你的数据可见 - drilldown, Intellicus用高级语言管理你的任务流 – oozie, Cascading
* Hadoop当然也有自己的监控管理工具 – Hue, karmasphere, eclipse plugin, cacti, ganglia
* 数据序列化处理与任务调度 – Avro, Zookeeper
* 更多构建在Hadoop上层的服务 – Mahout, Elastic map Reduce
* OLTP存储系统 – Hbase

* How did it all start- huge data on the     web!
* Nutch     built to crawl this web data
* Huge     data had to saved- HDFS was born!
* How to use this data?
* Map reduce framework built for coding     and running analytics – java, any language-streaming/pipes
* How to get in unstructured     data – Web logs, Click streams, Apache logs, Server logs  – fuse,webdav, chukwa, flume,     Scribe
* Hiho and sqoop for loading data into     HDFS – RDBMS can join the Hadoop band wagon!
* High level interfaces required over low     level map reduce programming– Pig, Hive, Jaql
* BI tools with advanced UI     reporting- drilldown etc- Intellicus
* Workflow tools over Map-Reduce     processes and High level languages
* Monitor and manage hadoop, run     jobs/hive, view HDFS – high level view- Hue, karmasphere, eclipse plugin,     cacti, ganglia
* Support frameworks- Avro     (Serialization), Zookeeper (Coordination)
* More High level interfaces/uses-     Mahout, Elastic map Reduce
* OLTP- also possible – Hbase

*

大数据系列hadoop,hdfs相关文章:

最新评论
边走边爱2014-09-09 08:47:37
如果hdfs上存了一个很大的图片,会不会出现分割多个file?
与世界对讲2014-09-09 01:01:19
没有
胖丫2014-09-08 04:54:01
【2014年大数据市场的几大趋势】1.SQL拥有大数据最大潜力。2.尽管如此SQL还面临挑战。3.身份识别是主要的数据安全问题。4.数据错误变成学习机会。5.出现可运行的Hadoop。6.更多数据仓库将部署企业数据中心。7.新的以数据为中心的应用将成为强制性的。8. 数据成为数据中心的核心。http://t.cn/8stMSiW
风中密码2014-09-08 04:27:29
zookeeper技术浅析-Hadoop-@大数据资讯 (分享自 @大数据资讯) http://t.cn/RPp0h4I
zhuxinhua2014-09-06 10:24:35
喔喔。
悠闲衣裳2014-09-06 05:23:50
Hadoop2.3(HDFS-4949)引入的Centralized cache management让HDFS增加了Cache层,对于高级用户而言,通过在存储层次上设置Cache,提升读写数据的效率。 那么在Hadoop Summit2014上,由Julian Hyde带来的DIMMQ则以一个计算的角度提出如何高效利用内存,为应用提速。http://t.cn/RvJ108h HDFS-5682
快乐2014-09-05 12:18:17
如果2014-09-04 11:59:15
@南宁-电商-Z 已T谢谢
笔尖流年2014-09-03 01:52:27
在改写rsyslog的omhdfs以及使用rsyslog->flume-ng->hdfs的方案之间徘徊 @春暖期待花开 @geda @ARGV ,前者看着也相对容易,后者基本上就是拼接了,相对来讲结构多了一层,遇上JAVA的系统,真是入不了眼啊
乐府2014-09-02 10:27:10
“AMP出品,必属精品”,网易王健宗对于AMPLab的推崇可见一斑。他认为,对比经过5年以上发展的Hadoop,Spark这个Apache顶级项目还有很长的路要走,然而当你看到一些教授放弃了公职,一些博士中断了学业,你就会相信百亿市场价值并非虚言。毋庸置疑,Hadoop的代替者已然出现! http://t.cn/8sbTEwB
 
  • Hadoop生态系统资料推荐