今天不是什么新的内容,主要介绍下0.20版本下hadoop的调试、计数器、调试信息输出等内容。
相信很多人学习hadoop都是从hadoop权威指南开始的,但权威指南使用的hadoop版本是0.19版本的,而有部分人(其中包括我)使用的0.20版本的。相信大家都知道0.20版本相对于0.19版本有了重大的改变。提供了一系列新的API。具体哪些我这里就不具体说了。其中一个跟测试、调试密切相关的就是在0.20版本出现了Context object(上下文对象).所以本篇日志就记录一下我在0.20版本下的测试、调试程序。这里有要特别提示下,这些方法都是我自己摸索的,不敢保证一定效果最好或者最简洁,比如计数器那个我也见过其他实现方法。所以如果有错请大家指出。先谢谢了。
先来说说测试,老规矩直接上代码,注释在代码里:
接着来讨论下hadoopp的调试信息,我介绍两种:计数器、直接打印调试信息
这里我只给出主要代码,main函数里面的代码十分简单,我就不给出了。
使用上面代码的效果,我现在来给大家指出:
1:我们上面使用了计数器,当我们提交作业运行完成后,可以通过namenode返回的信息查看计数器的值
当然我也可以通过hadoop提供的web页面查看计数器的值
当然我们也可以查看每个map里计数器的取值。
我前两天看了一篇文章,也是在0.20中使用计数器的,那篇文章中说的是可以直接使用
Counter c = context.getCounter("Counter","Counter1");来设置计数器,应该有可以。这里就算多提供了一种使用计数器的方法。
2: 我们程序中使用了System.out.println("map"); System.out.println("reduce"); //直接打印调试信息。
这里我也有两种查看方式,一种是在web页面中查看
还有一种是直接在datanode的log目录下查看
具体路径是 hadoop-0.20/logs/userlogs/attempt-*****-*****/stdout文件中查看
3:程序中我们还使用了context.setStatus("this kk!!"); //设置状态
这个也是在web中可以查看
今天这篇文章没什么技术含量。就当对新版本的学习了。
分享到:
相关推荐
《Hadoop集群程序设计与开发(数据科学与大数据技术专业系列规划教材)》系统地介绍了基于Hadoop的大数据处理和系统开发相关技术,包括初识Hadoop、Hadoop基础知识、Hadoop开发环境配置与搭建、Hadoop分布式文件系统、...
1/Hadoop平台搭建及实例运行.doc; 2/hadoop常见测试问题_自测试.docx; 3/hadoop源代码分析.docx; 4/Hibench BenchMark suite.docx。
Hadoop集群程序设计与开发教材最终代码.zip
hadoop mapreduce helloworld 能调试 详细内容请看:http://blog.csdn.net/wild46cat/article/details/53641765
hadoop-wordcount测试程序,jar包,单词统计的不二之选
hadoop性能测试报告
Hadoop 10周年生日之际,CSDN主办的“Hadoop英雄会——暨Hadoop 10周年生日大趴”,Hulu高级研发工程师董西成介绍了Hadoop YARN程序设计与应用案例。
这是关于hadoop里面程序代码,有wordcount ,partition,onejoin, score,health,dedup,程序. 有.java,也有jar. 提示必须先装上hadoop才能运行
Hadoop集群测试报告
基于hadoop上的基本测试,很好的资源哦
Eclipse中远程调试Hadoop必备资料:hadoop-eclipse-plugin-1.1.1和hadoop-core-1.0.2-modified;已经在eclipse-jee-juno-SR1-win32-x86_64和hadoop1.1.1 下测试过。
hadoop测试数据,人脸分析测试数据,适应学习大数据,记进行数据分析
hadoop安装与配置及mapreduce测试网站
windows远程执行Linux服务器上的hadoop集群,本地调试所需要的hadoop.dll、winutils.exe包,让你的开发起飞。
本文档是对自己学习hadoop的一个小测试,适合初学hadoop的人士观看。
hadoop流量统计程序hadoop流量统计程序hadoop流量统计程序hadoop流量统计程序
Hadoop集群测试报告
适合Hadoop初学者安装Hadoop
Hadoop集群程序设计与开发PPT.rar