Hadoop的文件系统介绍

最新推荐文章于 2024-11-26 14:52:15 发布

原创

最新推荐文章于 2024-11-26 14:52:15 发布 · 4.5k 阅读

收录于

当前文章被以下社区和专栏收录：

本文详细介绍了Hadoop的HDFS，包括其文件系统组成、分块存储、副本机制、名字空间和NameNode功能。HDFS采用Master-Slave结构，其中NameNode管理元数据，DataNode存储数据块，并通过副本机制保证数据容错和可用性。文章还讨论了块缓存、机架感知等关键特性。

Hadoop组成

Hadoop HDFS：一个高可靠、高吞吐量的分布式文件系统，对海量数据的存储。
Hadoop MapReduce：一个分布式的资源调度和离线并行计算框架。
Hadoop Yarn：基于HDFS,用于作业调度和集群资源管理的框架。
Hadoop Common：Hadoop工具包，支持其他模块的工具模块（Configuration、RPC、序列化机制、日志操作）

在这里插入图片描述

Hadoop的文件系统介绍

HDFS 基本介绍
目标：掌握什么是HDFS，HDFS的使用场景，组成部分。
HDFS 是 Hadoop Distribute File System 的简称，意为：Hadoop 分布式文件系统。是 Hadoop 核心组件之一，作为最底层的分布式存储服务而存在。
分布式文件系统解决的问题就是大数据存储。它们是横跨在多台计算机上的存储系统。分布式文件系统在大数据时代有着广泛的应用前景，它们为存储和处理超大规模数据提供所需的扩展能力。

在这里插入图片描述