CGFT:HDFS体系结构包含什么?
2020-10-13
1332
在CGFT大数据中,HDFS体系结构主要包含什么,是需要考生重点掌握的!
1、HDFS命名空间管理
HDFS的命名空间包含目录、文件和块,命名空间管理是指命名空间支持对HDFS中的目录、文件和块做类似文件系统的创建、修改、删除等基本操作。
在当前的HDFS体系结构中,在整个HDFS集群中只有一个命名空间,并且只有一个名称节点,该节点负责对这个命名空间进行管理。
2、通信协议
HDFS是一个部署在集群上的分布式文件系统,因此,很多数据需要通过网络进行传输。所有的HDFS通信协议都是建构在TCP/IP协议基础之上的。
3、客户端
客户端是用户操作HDFS常见的方式,HDFS在部署时都提供了客户端,不过需要说明的是,严格来说,客户端并不算是HDFS的一部分,客户端可以支持打开,读取、写入等常见的操作,并且提供了类似shell的命令行方式来访问HDFS中的数据。
此外,HDFS也提供了Java API,作为应用程序访问文件系统的客户端编程接口。