Hadoop DFS Architecture
このホワイトペーパーは、Apache のサイトからダウンロードしたものであり、HDFS(Hadoop Distributed File System)のアーキテクチャについて説明するものです。 4月の末から、7回に分けてポストしてきましたが、ようやく最後までたどり着きましたので、順番に読めるように整理しました。
以下の目次から個別のチャプタを参照することも可能ですし、右のカテゴリ ”HDFS” から連続ものとして参照することも可能です。— A.C.
<目次>ーーーーーーーーーーーーーーーーーーーー
Introduction _1
Assumptions and Goals
Hardware Failure
Streaming Data Access
Large Data Sets
Simple Coherency Model
“Moving Computation is Cheaper than Moving Data”
Portability Across Heterogeneous Hardware and Software Platforms
Data Replication
Replica Placement: The First Baby Steps
Replica Selection
Safemode
The Persistence of File System Metadata _4
The Communication Protocols _5
Robustness
Data Disk Failure, Heartbeats and Re-Replication
Cluster Rebalancing
Data Integrity
Metadata Disk Failure
Snapshots
Data Blocks
Staging
Replication Pipelining
FS Shell
DFSAdmin
Browser Interface
Space Reclamation
File Deletes and Undeletes
Decrease Replication Factor
References



























