如何使用apachepig处理chukwa收集的数据

如何使用apache pig 处理chukwa收集的数据,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。

创新互联主要从事成都网站建设、成都做网站、网页设计、企业做网站、公司建网站等业务。立足成都服务多伦,10余年网站建设经验,价格优惠、服务专业,欢迎来电咨询建站服务:028-86922220

        公司使用chukwa收集每个服务器数据的,数据收集到的hdfs以后被写成sequencefile,想用pig处理这些数据,pig本身不支持这种数据结构的,查看chukwa源码发现,本身有带有pig脚本,是hicc用来做数据统计的脚本,hicc一直不好使,也懒得搭理这玩意。

        1、chukwa/script/pig/DF.pig

                define chukwaLoader org.apache.hadoop.chukwa.pig.ChukwaLoader();

               源码在:chukwa/contrib/chukwa-pig下边

        本身chkwa支持的pig版本比较老,使用pig脚本加载这个jar包,执行压根不好使,把代码放到pig下进行编译,就可以直接使用了。

看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注创新互联行业资讯频道,感谢您对创新互联的支持。


网站栏目:如何使用apachepig处理chukwa收集的数据
当前网址:http://pwwzsj.com/article/psphdg.html