主页 > 家电修理 >

大数据开发hadoop(hadoop搭建大数据平台)

家电修理 2023-07-16 19:16www.caominkang.com电器维修

一为什么学习hdfs？

二hdfs是什么？ 1.0 版本 DataNode

NameNode

Secondary NameNode

优点恢复快。缺点每次拍照有间隔，这样恢复的时候会丢失一些数据。

优点不会造成数据的丢失。缺点随着时间的推移，后期恢复工作量非常大，非常浪费时间。

2.0 版本 1. 为社么出现2.0？

在1.0中，我们对于DataNode进行了高可用，对于NameNode和SecondaryNameNode并没有进行高可用管理。

2. 新版本有什么改变？ JournalNode

NameNode

ActiveNN 主节点。StandyNN 备用节点。 ZKFC

zookeeper

如果其中一个NameNode宕机了，我们需要进行选举，选出一个来进行充当leader。注意问题

只要保证在同一时刻，Cilent只能接受到一个NN的命令。对于刚好的那个机器，先和他谈，如果他愿意当备用，那直接变成备用，如果不愿意，直接杀死他的进程。

3.0 版本 1. 为什么出现3.0版本？

每个文件都进行三个备份，很多时候一些使用少的文件，没有必要备份那么多，所以，我们可以进行优化。对于有些DataNode存储数据量不一样，有些使用率非常高，有些使用率比较低，这个对于资源的消耗也是非常大的。 2. 怎么实现？

三hdfs怎么使用？宏观读写流程

微观读写流程

4. 当packet满了的时候，存入dataqueue消息队列。
5. 之后数据经过dataQueue中，打他Queue的作用1从Dataqueue中取出数据。2存在ackQueue中。3将数据放在管道中
6. 之后数据在管道中进行传递。
7.如果数据在传输过程中发生失误。返回消息给ResponseProcessor中，将之前的数据重新放回到DataQueue中。
8. 如果数据没问题，那么返回成功值给ResponseProcessor将存在ackQueue中的数据进行杀死。

上一篇：手机电子邮箱怎么注册申请? 下一篇：winservices.exe是什么进程

大数据开发hadoop(hadoop搭建大数据平台)

电脑维修网搜索

电脑维修导航

电脑维修知识

笔记本电脑维修

电脑维修培训

大数据开发hadoop(hadoop搭建大数据平台)

空调维修

电脑维修网搜索

电脑维修导航

电脑维修知识

笔记本电脑维修

电脑维修培训