itbuild-hadoop生态圈【it❤ld】

itbuild-hadoop生态圈

发表于 2020-08-06 | 更新于 2020-12-21

衣带渐宽终不悔，为伊消得人憔悴。

1. Hadoop基础

1.VMware安装CentOS.md

2.VMware安装VMTools.md

3.配置CentOS-为克隆虚拟机做准备.md

4.VMware克隆虚拟机.md

5.大数据概论.md

6.Hadoop框架引出大数据生态.md

7.安装JDk和Hadoop及测试本地运行模式.md

8.Hadoop伪分布式运行模式.md

9.Hadoop配置文件说明.md

10.集群分发脚本xsync.md

11.Hadoop完全分布式运行模式.md

2. HDFS

1.HDFS概述.md

2.HDFS的Shell操作.md

3.HDFS客户端操作.md

4.HDFS的数据流-读写数据.md

5.NameNode和SecondaryNameNode.md

6.集群安全模式.md

7.DataNode.md

8.服役和退役数据节点.md

9.HDFS 2.X新特性.md

3. MapReduce

1.MapReduce概述.md

2.WordCount案例实操.md

3.Hadoop序列化.md

4.Job提交流程源码和切片源码详解.md

5.切片与MapTask并行度决定机制.md

6.FileInputFormat实现类.md

7.自定义FileInputFormat.md

8.Mapper和Reducer源码.md

9.MapReduce工作流程.md

10.Shuffle机制☆☆.md

11.OutputFormat数据输出.md

12.MapTask和ReduceTask工作机制.md

13.ReduceTask并行度.md

14.MapReduce之Join多种应用.md

15.MapReduce之数据清洗和计数器的应用

16.MapReduce扩展案例.md

4. Yarn

1.Yarn资源调度器

5. hadoop企业调优

1.Hadoop数据压缩.md

2.Hadoop企业优化.md

6. ZooKeeper

1.ZooKeeper入门.md

2.ZooKeeper的安装和配置参数详解.md

3.ZooKeeper分布式安装部署和客户端命令行操作.md

4.Zookeeper内部原理.md

5.ZooKeeper之API应用.md

6.HDFS高可用HA配置.md

7.Yarn高可用HA配置.md

7. Hive

1.Hive基本概念.md

2.Hive的安装和配置.md

3.Hive常见属性配置.md

4.Hive的数据类型.md

5.Hive技术之DDL数据定义.md

6.Hive技术之DML数据操作.md

7.Hive技术之DML数据查询.md

8.Hive技术之常用查询函数.md

9.Hive技术之HQL练习☆.md

10.Hive技术之自定义函数.md

11.Hive技术之压缩和存储.md

12.Hive技术之企业级调优.md

13.Hive实战之谷粒影音.md

8. Flume

1.Flume技术入门.md

2.Flume事务、Agent原理、拓扑结构.md

3.Flume企业开发案例-复制.md

4.Flume企业开发案例-多路复用以及自定义flume拦截器.md

5.Flume企业开发案例-负载均衡和故障转移.md

6.Flume企业开发案例-聚合.md

7.Flume技术之自定义Source.md

8.Flume技术之自定义Sink.md

9.Flume数据流监控-Ganglia.md

9. Kafka

1.Kafka概述.md

2.kafka快速入门.md

3.Kafka工作流程及文件存储机制.md

4.kafka生产者.md

5.kafka消费者.md

6.Kafka高效读写数据及事务.md

7.Kafka Producer和Consumer API.md

8.自定义拦截器Interceptor.md

9.kafka监控-Eagle.md

10.Flume对接Kafka.md

☆

本文作者: DuanChaojie

本文链接: http://www.itbuild.cn/2020/08/06/itbuild-hadoop%E7%94%9F%E6%80%81%E5%9C%88/