Windows7下配置spark环境记录

协程流星
• 阅读 3115

一、前言

最近在学习大数据相关的知识,在自己的笔记本上搭建了spark环境,本文是记录了这次搭建环境中的步骤,如有问题,欢迎指正。

二、下载准备

1. spark下载

spark下载网站http://spark.apache.org/downl...
在上述网站上找到 Download Spark: spark-x.x.x-bin-hadoopx.x.tgz 点击即可下载最新版本的spark,也可以选择老的版本。

2. scala下载

scala下载网站http://www.scala-lang.org/dow...

3.hadoop下载

hadoop镜像网站http://www.apache.org/dyn/clo...
在这个网站上选择一个镜像网站,例如 http://mirrors.hust.edu.cn/ap...
然后在对应的hadoop版本号下,选择hadoop-x.x.x.tar.gz下载解压,一般这个要与spark下载时文件名上的hadoop的版本一致。

4.winutil下载

这个软件是为了是hadoop可以兼容在windows下运行,在github上可以找到很多。这是我下载用过的网址

版本好要和自己下载的hadoop版本的hadoop版本对应,下载解压后到 bin/ 目录下执行winutils.exe chmod -R 777 C:/tmp/hive 即可,盘符可换。

三、配置环境变量

解压上述下载的文件到对应目录后,然后配置环境变量,下面的是我的配置
SCALA_HOME  : C:\Program Files (x86)\scala2.11.7;
JAVA_HOME   : C:\Program Files\Java\jdk1.8.0_51
HADOOP_HOME : C:\Hadoop\winutils-master\hadoop-2.7.1
SPARK_HOME  : C:\Hadoop\spark-2.2.0-bin-hadoop2.7
PATH    : %JAVA_HOME%\bin;%SCALA_HOME%\bin;%HADOOP_HOME%\bin;%SPARK_HOME%\bin

在命令行下运行spark-shell,这样就进入了scala语法的spark-shell。

四、python环境配置

需要将下载后的spark目录下的./python/pyspark复制到python安装目录下的./Lib/site-packages目录下,然后就可以在python代码中import pyspark了,当然也可以在命令行下执行pyspark直接进入python版本的spark-shell

点赞
收藏
评论区
推荐文章
Hadoop 及Spark 分布式HA运行环境搭建
本文旨在站在研发的角度上通过手动实践搭建运行环境,文中不拖泥带水过多讲述基础知识,结合Hadoop和Spark最新版本,帮助大家跟着步骤一步步实践环境搭建。
Stella981 Stella981
3年前
PHP代码静态分析工具PHPStan
<blockquote最近发现自己写的PHP代码运行结果总跟自己预想的不一样,排查时发现大多是语法错误,在运行之前错误已经种下。可能是自己粗心大意,或者说<codephpl</code检测太简单,不过的确是有一些语法错误埋藏得太深(毕竟PHP是动态语言),那么有没有办法,在代码代码正式运行之前,把语法错误全找出来呢?</blockquote<p
Wesley13 Wesley13
3年前
05.kafka提前准备工作:搭建zookeeper集群环境
总体参考:http://www.cnblogs.com/zhangs1986/p/6564839.html搭建之间同步下spark01、02、03的环境复制/opt/flume这个文件夹到spark02的/opt目录下,同理03scpr/opt/flume/spark02:/opt/scpr/opt/kafka/spar
Wesley13 Wesley13
3年前
Go! 环境配置和入门
学习一门语言,获得一种思维开始GO语言的学习之路环境配置1\.下载:https://code.google.com/p/go/downloads/list根据自己情况下载2.安装3.将go.exe的路径加到环境变量中:在Path前面加上go.exe的路径4\.打开cmd(本人win7环境)输入go提示go的
Stella981 Stella981
3年前
Eclipse连接Hadoop集群并运行wordCount全过程记录
为了自己以后方便会看记录一下整个过程,Hadoop集群之前已经搭建好,这部分工作以后再补写。环境:win10    Eclipse4.4.2    JDK1.7    Hadoop2.7.1     相关安装文件可在文末的链接下载1.加载eclipse插件(1)下载hadoopeclipseplugin插件,此处下载了had
Stella981 Stella981
3年前
Exceptionless
<divid"cnblogs\_post\_body"class"blogpostbodycnblogsmarkdown"<h1id"exceptionless.netcore开源日志框架"Exceptionless.NetCore开源日志框架</h1<blockquote<p作者:markjiang7m2<b
Stella981 Stella981
3年前
SpringBoot + Mybatis 多模块( module )项目搭建教程
作者:枫本非凡www.cnblogs.com/orzlin/p/9717399.html一、前言最近公司项目准备开始重构,框架选定为SpringBootMybatis,本篇主要记录了在IDEA中搭建SpringBoot多模块项目的过程。1、开发工具及系统环境
Stella981 Stella981
3年前
DBeaver笔记
<divclass"markdown\_views"<p公司使用的是PostgreSQL数据库,可以使用pgAdmin或者DBeaver进行连接该数据库。个人更喜欢用DBeaver,因为其界面更加美观,操作也相对简单。对于习惯了eclipse的开发者来说,DBeaver绝对是个不错的选择。</p<blockquote<pDBeaver
Stella981 Stella981
3年前
Spark安装教程
注:该教程转自厦门大学大数据课程学习总结Spark的安装过程较为简单,在已安装好Hadoop的前提下,经过简单配置即可使用。安装Spark1.sudotar\zxf~/下载/spark1.6.2binwithouthadoop.tgzC/usr/local/
Stella981 Stella981
3年前
Spark源码剖析
4. Hadoop相关配置及Executor环境变量的设置4.1 Hadoop相关配置信息默认情况下,Spark使用HDFS作为分布式文件系统,所以需要获取Hadoop相关配置信息的代码如下:!(https://oscimg.oschina.net/
Wesley13 Wesley13
3年前
PHP算法之判断是否是质数
<h3质数的定义</h3<blockquote质数又称素数。一个大于1的自然数,除了1和它自身外,不能整除其他自然数的数叫做质数;否则称为合数。</blockquote<h3实现思路</h3<p循环所有可能的备选数字,然后和中间数以下且大于等于2的整数进行整除比较,如果能够被整数,则肯定不是质数,相反,就是质数。</p<h3第一种算