《大数据理论与实践Ⅰ》实验报告①
《大数据理论与实践Ⅰ》实验报告①
实验编号 1
实验名称: HDFS基本操作
实验内容:
第1步:启动 TDH Client,执行 TDH Client 的 init.sh 脚本,启动 TDH Client。


第2-6步:创建 hdfs_data 目录,将目录权限设为 777,然后创建一个 file1 文件,并上传到 hdfs_data 目录。最终查看目录和文件内容,结果如下:

第7步:访问网址 http://172.18.48.6:50070/,找到 /tmp/jinqiqing/hdfs_data 目录,查看 block ID 为 1112628409。
实验编号 2
实验名称: YARN作业管理
实验内容:
第1步:启动 TDH Client,执行 TDH Client 的 init.sh 脚本,启动 TDH Client。
第2步:在本地创建一个 wordcount.txt 文件,上传至 HDFS 作业输入目录中。


第3步:将 Hadoop MapReduce 程序 hadoop-mapreduce-examples-2.7.2-transwarp-5.1.2.jar 的 WordCount 作业提交给 YARN,并执行得出结果。

第4步:查看输出目录和输出结果,得到词频统计结果。