HDFS基本原理和设计理念

  • 内容
  • 评论
  • 相关

本节将对 HDFS 的基本原理进行讲解。

文件系统的问题

文件系统是操作系统提供的磁盘空间管理服务,该服务只需要用户指定文件的存储位置及文件读取路径,而不需要用户了解文件在磁盘上是如何存放的。

但是当文件所需空间大于本机磁盘空间时,应该如何处理呢?

  • 加磁盘,但是加到一定程度就有限制了。
  • 加机器,即用远程共享目录的方式提供网络化的存储,这种方式可以理解为分布式文件系统的雏形,它可以把不同文件放入不同的机器中,而且空间不足时可继续加机器,突破了存储空间的限制。

但是这种传动的分布式文件系统存在多个问题。

1)各个存储结点的负载不均衡,单机负载可能极高。例如,如果某个文件是热门文件,则会有很多用户经常读取这个文件,这就会造成该文件所在机器的访问压力极高。

2)数据可靠性低。如果某个文件所在的机器出现故障,那么这个文件就不能访问了,甚至会造成数据的丢失。

3)文件管理困难。如果想把一些文件的存储位置进行调整,就需要查看目标机器的空间是否够用,并且需要管理员维护文件位置,在机器非常多的情况下,这种操作就极为复杂。

HDFS 的基本思想

HDFS 是个抽象层,底层依赖很多独立的服务器,对外提供统一的文件管理功能。HDFS 的基本架构如图 1 所示。

HDFS的基本架构
图 1  HDFS的基本架构

本文标题:HDFS基本原理和设计理念

本文地址:https://www.hosteonscn.com/5370.html

评论

0条评论

发表评论

邮箱地址不会被公开。 必填项已用*标注