zeppelin中怎么配置spark

本篇文章给大家分享的是有关zeppelin中怎么配置 spark,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。

成都网站建设哪家好,找创新互联公司!专注于网页设计、成都网站建设公司、微信开发、小程序开发、集团企业网站设计等服务项目。核心团队均拥有互联网行业多年经验,服务众多知名企业客户;涵盖的客户类型包括:纱窗等众多领域,积累了大量丰富的经验,同时也获得了客户的一致赞扬!

修改zeppelin 配置文件

在zeppelin-env.sh中添加spark路径和hadoop配置文件路径

export SPARK_HOME=/usr/lib/spark
export HADOOP_CONF_DIR=/usr/lib/hadoop

修改spark interpreter参数

zeppelin中怎么配置 spark

master 可以为:

local[*] in local mode
spark://master:7077 in standalone cluster
yarn-client in Yarn client mode
yarn-cluster in Yarn cluster mode
mesos://host:5050 in Mesos cluster

我这里是 spark on yarn 所以我配置的 master 为yarn,提交模式为 cluster,我设置为 client 的时候运行任务一直卡着不动

排错

我这里是在docker里搭建的,中间还报了其它的错

java.lang.RuntimeException: org.apache.zeppelin.interpreter.InterpreterException: org.apache.thrift.transport.TTransportException: java.net.ConnectException: Connection refused

后来发现是AM无法实例化的原因

host -i

发现docker 里是一个虚拟ip

解决方法:

启动docker时指定网络连接方式

host模式 :

docker run 使用 --net=host指定

docker使用的网络实际上和宿主机一样

以上就是zeppelin中怎么配置 spark,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注创新互联行业资讯频道。


标题名称:zeppelin中怎么配置spark
文章URL:http://pwwzsj.com/article/jggjcc.html