JAVA高级面试进阶训练营视频教程

admin · 发表于 2021-5-21 03:06:40

spark集群的启动过程：

1.启动Hadoop：

①初始化：hadoop namenode -format

②启动服务：start-dfs.sh + start-yarn.sh (或者直接start-all.sh)

③查看进程：jps

启动成功的话会显示6条进程，如下图所示：

2.启动spark：

Hadoop启动成功后，cd到spark目录下，执行sbin/start-all.sh,

查看进程会发现多了worker和master

可以通过WEB端进行查看：

namenode端口：50070
yarn端口：8088
spark集群端口：8080
spark-job监控端口：4040

此时spark集群就启动成功了。

不过很多朋友们会经常遇到DataNode启动失败的情况，即进程中缺少DataNode。以下是我个人的解决方案：

到Hadoop目录下的/tmp/dfs可以看到两个目录：name和data，分别找到该目录下的VERSION文件，查看其clusterID，修改data中的clusterID使其与与name中的clusterID保持相同。如果相同，则datanode可正常启动。

当我们执行初始化：hadoop namenode -format时，会出现个询问，如下图，此处如果选择Y，则/tmp/dfs下name夹子会更新，进而version文件中的clusterID会发生变化，导致data文件的clusterID与name的clusterID不同，此时则无法正常启动datanode,所以提醒大家记得选N，避免不必要的麻烦。

		自动登录	找回密码
密码			立即注册

JAVA高级面试进阶训练营视频教程	Java架构师系统进阶VIP课程	分布式高可用全栈开发微服务教程	Go语言视频零基础入门到精通	Java架构师3期(课件+源码)
Java开发全终端实战租房项目视频教程	SpringBoot2.X入门到高级使用教程	大数据培训第六期全套视频教程	深度学习（CNN RNN GAN）算法原理	Java亿级流量电商系统视频教程
互联网架构师视频教程	年薪50万Spark2.0从入门到精通	年薪50万！人工智能学习路线教程	年薪50万大数据入门到精通学习路线	年薪50万机器学习入门到精通教程
仿小米商城类app和小程序视频教程	深度学习数据分析基础到实战	最新黑马javaEE2.1就业课程	从 0到JVM实战高手教程	MySQL入门到精通教程

JAVA高级面试进阶训练营视频教程

Java架构师系统进阶VIP课程

hadoop，spark的启动及DataNode无法启动的解决方法