hadoop Shell命令详解
原创
Hadoop Shell命令详解
Hadoop是一个开源的分布式计算框架,用于处理大规模数据集。Hadoop的Shell命令行工具提供了充裕的命令,用于管理Hadoop集群、提交作业、监控资源等。本文将详细介绍Hadoop Shell命令的相关知识。
1. Hadoop环境配置
在使用Hadoop Shell命令之前,需要确保Hadoop环境已正确配置。以下是一些基本的配置步骤:
export HADOOP_HOME=/path/to/hadoop
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin
2. Hadoop基本命令
以下是一些常用的Hadoop基本命令:
hadoop fs
fs是FileSystem的缩写,用于操作Hadoop的文件系统。
- hadoop fs -ls:列出HDFS中的文件和目录。
- hadoop fs -cat:查看HDFS中的文件内容。
- hadoop fs -put:将本地文件上传到HDFS。
- hadoop fs -get:从HDFS下载文件到本地。
- hadoop fs -rm:删除HDFS中的文件或目录。
hadoop dfs
dfs是Distribution File System的缩写,与fs命令类似,用于操作HDFS。
- hadoop dfs -ls:列出HDFS中的文件和目录。
- hadoop dfs -cat:查看HDFS中的文件内容。
- hadoop dfs -put:将本地文件上传到HDFS。
- hadoop dfs -get:从HDFS下载文件到本地。
- hadoop dfs -rm:删除HDFS中的文件或目录。
3. Hadoop作业提交与监控
以下是一些与Hadoop作业提交和监控相关的命令:
hadoop jar
用于提交一个MapReduce作业。
hadoop jar /path/to/your.jar class.MainClass [args...]
hadoop job
用于监控和管理MapReduce作业。
- hadoop job -list:列出所有作业。
- hadoop job -status job_id:查看作业状态。
- hadoop job -kill job_id:杀死一个作业。
4. Hadoop集群管理
以下是一些与Hadoop集群管理相关的命令:
start-dfs.sh
启动HDFS服务。
stop-dfs.sh
停止HDFS服务。
start-yarn.sh
启动YARN服务。
stop-yarn.sh
停止YARN服务。
start-all.sh
启动所有Hadoop服务。
stop-all.sh
停止所有Hadoop服务。
5. Hadoop常用选项
以下是一些常用的Hadoop选项:
- -D:设置Hadoop配置属性。
- -files:指定文件列表,用于传递给MapReduce作业。
- -libjars:指定JAR文件列表,用于传递给MapReduce作业。