herj 8754a06929 修改新的yarn配置 | há 2 anos atrás | |
---|---|---|
api | há 4 anos atrás | |
assembly | há 4 anos atrás | |
bin | há 4 anos atrás | |
client-common | há 4 anos atrás | |
client-http | há 4 anos atrás | |
conf | há 4 anos atrás | |
core | há 4 anos atrás | |
coverage | há 4 anos atrás | |
dev | há 4 anos atrás | |
docker_build | há 2 anos atrás | |
docker_livy_base | há 2 anos atrás | |
docs | há 4 anos atrás | |
examples | há 4 anos atrás | |
integration-test | há 2 anos atrás | |
python-api | há 4 anos atrás | |
repl | há 2 anos atrás | |
rsc | há 2 anos atrás | |
scala | há 5 anos atrás | |
scala-api | há 4 anos atrás | |
server | há 4 anos atrás | |
test-lib | há 4 anos atrás | |
thriftserver | há 2 anos atrás | |
yili-conf | há 2 anos atrás | |
.dockerignore | há 2 anos atrás | |
.gitignore | há 2 anos atrás | |
.rat-excludes | há 4 anos atrás | |
Dockerfile | há 2 anos atrás | |
LICENSE | há 2 anos atrás | |
README.md | há 2 anos atrás | |
build.sh | há 2 anos atrás | |
checkstyle-suppressions.xml | há 6 anos atrás | |
checkstyle.xml | há 7 anos atrás | |
pom.xml | há 2 anos atrás | |
scalastyle.xml | há 7 anos atrás |
Apache Livy 是开源的 Spark REST 接口服务, 通过 Livy 的 REST 接口可以远程地在 Spark Context 中执行代码. 本项目 fork 自 https://github.com/apache/incubator-livy, 在官方代码的基础上进行二次开发, 并修复部分 BUG.
构建前请将 spark-3.0.3-bin-hadoop3.2.tgz
放置于项目根目录中,
使用如下命令进行构建:
mvn clean package \
-B -V -e \
-Pspark-3.0 \
-Pthriftserver \
-DskipTests \
-DskipITs \
-Dmaven.javadoc.skip=true
构建完成后生成 assembly/target/apache-livy-<版本>-bin.zip
项目中提供了 Dockerfile, 可以将源码打包为镜像.
# 构建基础镜像
cd docker_build
docker build -t ylproj-livy-build:1.0.0 .
cd ../docker_livy_base
docker build -t ylproj-livy-base:1.0.0 .
cd ..
# 开始构建 Livy 镜像
docker build -t ylproj-livy .
通过构建好的 Livy 镜像运行服务
docker run -d \
--name ylproj-livy \
--network ylproj \
-p 8998:8998 \
-p 31100-31103:31100-31103 \
-v <kerberos配置>:/etc/krb5.conf:ro \
-v <hadoop配置>:/opt/cluster/conf:ro \
-e LIVY_SERVER_JAVA_OPTS=-Dlivy.rsc.launcher.address=livy \
ylproj-livy
运行参数说明:
LIVY_SERVER_JAVA_OPTS
中填入 Livy 服务的域名或 IP 地址 (Hadoop 集群中的 driver 程序要通过该地址访问 Livy)在镜像中挂载的配置目录结构如下:
/
├─ etc/
│ └─ krb5.conf
└─ opt/
└─ cluster/
└─ conf/
├─ core-site.xml
├─ hdfs-site.xml
├─ yarn-site.xml
├─ mapred-site.xml
├─ hive-site.xml
├─ livy-client.conf
├─ livy.conf
├─ log4j.properties
├─ spark-defaults.conf
└─ user.keytab
如果需要 Kerberos 认证的话, 就要把 KDC 配置放到 /etc/krb5.conf 这里
在 livy.conf 中配置
livy.server.launch.kerberos.principal = <Livy 服务使用的 principal>
livy.server.launch.kerberos.keytab = /opt/cluster/conf/user.keytab
对应于 principal 的 keytab 文件请放在 /opt/cluster/conf/user.keytab
如果本地测试不用 Kerberos 的话, 就删除上述配置
TODO