Hadoop
Hadoop 是大数据时代最流行的开源分布式文件系统,它的核心是 hdfs 和 map reduce. 它已发展成为一个庞大的生态系统,有众多的周边软件。
HDFS
Java 程序1:复制本地文件到 HDFS(需复制到 hadoop cluster 的 node 上执行)
Java 程序2:复制本地文件(包括目录)到 HDFS(需复制到 hadoop cluster 的 node 上执行)
Java 程序3:复制本地文件(包括目录)或 HDFS 文件(包括目录)(不需复制到 hadoop cluster 的 node 上即可执行)
MapReduce
故障处理记录1:datanode 找不到或不能启动