大数据累加器的使用和RDD的创建


累计器executor中会把driver定义的变量,变成一个新的副本进行累计。不会影响driver中的变量的值var sum=0; //driver中定义 rdd.foreach{ //executor中执行 case (word,count)=>{sum+=count} } println(sum) //0 普通定义的变量,executor中会把driver中- 阅读剩余部分 -

hadoop配置


hadoop配置规划NameNode,SecondaryNameNode,ResourceManager分别放在不同的机器上。 master sliver1 sliver2 - 阅读剩余部分 -

集群中ssh如何免密登陆其它机器


1.用ssh-keygen -t rsa -P '' 生成rsa密钥对,生成后的文件在/root/.ssh/目录下保存,分别人id_rsa, id_rsa.pub[root@HOSTNAME=master ~]# ssh-keygen -t rsa -P '' Generating public/private rsa key pair. Enter file in which- 阅读剩余部分 -