itbuild-hadoop生态圈 发表于 2020-08-06 | 更新于 2020-12-21Home衣带渐宽终不悔,为伊消得人憔悴。 1. Hadoop基础 1.VMware安装CentOS.md 2.VMware安装VMTools.md 3.配置CentOS-为克隆虚拟机做准备.md 4.VMware克隆虚拟机.md 5.大数据概论.md 6.Hadoop框架引出大数据生态.md 7.安装JDk和Hadoop及测试本地运行模式.md 8.Hadoop伪分布式运行模式.md 9.Hadoop配置文件说明.md 10.集群分发脚本xsync.md 11.Hadoop完全分布式运行模式.md 2. HDFS 1.HDFS概述.md 2.HDFS的Shell操作.md 3.HDFS客户端操作.md 4.HDFS的数据流-读写数据.md 5.NameNode和SecondaryNameNode.md 6.集群安全模式.md 7.DataNode.md 8.服役和退役数据节点.md 9.HDFS 2.X新特性.md 3. MapReduce 1.MapReduce概述.md 2.WordCount案例实操.md 3.Hadoop序列化.md 4.Job提交流程源码和切片源码详解.md 5.切片与MapTask并行度决定机制.md 6.FileInputFormat实现类.md 7.自定义FileInputFormat.md 8.Mapper和Reducer源码.md 9.MapReduce工作流程.md 10.Shuffle机制☆☆.md 11.OutputFormat数据输出.md 12.MapTask和ReduceTask工作机制.md 13.ReduceTask并行度.md 14.MapReduce之Join多种应用.md 15.MapReduce之数据清洗和计数器的应用 16.MapReduce扩展案例.md 4. Yarn 1.Yarn资源调度器 5. hadoop企业调优 1.Hadoop数据压缩.md 2.Hadoop企业优化.md 6. ZooKeeper 1.ZooKeeper入门.md 2.ZooKeeper的安装和配置参数详解.md 3.ZooKeeper分布式安装部署和客户端命令行操作.md 4.Zookeeper内部原理.md 5.ZooKeeper之API应用.md 6.HDFS高可用HA配置.md 7.Yarn高可用HA配置.md 7. Hive 1.Hive基本概念.md 2.Hive的安装和配置.md 3.Hive常见属性配置.md 4.Hive的数据类型.md 5.Hive技术之DDL数据定义.md 6.Hive技术之DML数据操作.md 7.Hive技术之DML数据查询.md 8.Hive技术之常用查询函数.md 9.Hive技术之HQL练习☆.md 10.Hive技术之自定义函数.md 11.Hive技术之压缩和存储.md 12.Hive技术之企业级调优.md 13.Hive实战之谷粒影音.md 8. Flume 1.Flume技术入门.md 2.Flume事务、Agent原理、拓扑结构.md 3.Flume企业开发案例-复制.md 4.Flume企业开发案例-多路复用以及自定义flume拦截器.md 5.Flume企业开发案例-负载均衡和故障转移.md 6.Flume企业开发案例-聚合.md 7.Flume技术之自定义Source.md 8.Flume技术之自定义Sink.md 9.Flume数据流监控-Ganglia.md 9. Kafka 1.Kafka概述.md 2.kafka快速入门.md 3.Kafka工作流程及文件存储机制.md 4.kafka生产者.md 5.kafka消费者.md 6.Kafka高效读写数据及事务.md 7.Kafka Producer和Consumer API.md 8.自定义拦截器Interceptor.md 9.kafka监控-Eagle.md 10.Flume对接Kafka.md ☆本文作者: DuanChaojie本文链接: http://www.itbuild.cn/2020/08/06/itbuild-hadoop%E7%94%9F%E6%80%81%E5%9C%88/版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 it❤ld!