博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
1.1大数据平台架构及Hadoop生态圈
阅读量:5840 次
发布时间:2019-06-18

本文共 308 字,大约阅读时间需要 1 分钟。

1.硬件架构实例

                 

 

2.软件架构实例

               

3.数据流通用概念模型

   a.数据源(互联网、物联网、企业数据):App、Device、Site

   b.数据收集(ETL、提取、转换、加载):Flume、Kafka、Sqoop

   c.数据存储:HDFS、Hive/HBase

   d.资源管理:Yarn、Mesos

   e.批处理:MapReduce、Spark core

      流处理:Storm、Spark streaming

    f.数据挖掘(OLAP、BI):Mahout、MLlib

    g.数据可视化(report)

4.Hadoop生态圈

转载于:https://www.cnblogs.com/if-happy/p/10644988.html

你可能感兴趣的文章
pg_ctl
查看>>
NEAR and FAR pointer
查看>>
Mysql初始化root密码和允许远程访问
查看>>
ScrollView下的ListView高度问题
查看>>
js.calendar
查看>>
如果想当一个好的程序猿
查看>>
windows下安装php5.5的redis扩展
查看>>
UML建模工具Rose与PowerDesigner,两款建模工具的对比
查看>>
分析选项卡底部内凹圆角制作
查看>>
毕业设计(二十二)---主页大致布局 简画
查看>>
无限级的树(对$$的应用)
查看>>
Java学习资料-访问控制符
查看>>
分布式系统接口幂等性设计的一些手段
查看>>
淘宝Tprofiler工具实现分析
查看>>
MySQL获得最新插入的一组数据
查看>>
SugarNMS交换机、路由器监控软件
查看>>
window.location.hash解析
查看>>
PHP7新建扩展
查看>>
mysql事务隔离级别和锁
查看>>
进程和线程的区别
查看>>