博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Anaconda中配置Pyspark的Spark开发环境
阅读量:4696 次
发布时间:2019-06-09

本文共 706 字,大约阅读时间需要 2 分钟。

1.windows下载并安装Anaconda集成环境

  URL:https://www.continuum.io/downloads

2.在控制台中测试ipython是否启动正常

  

3.安装JDK

   3.1环境变量配置:

   

  

  

  3.2测试:

4.安装Spark并配置环境变量

  4.1 URL: http://spark.apache.org/downloads.html

    

 

  4.2解压到本地磁盘的对应目录

       

 4.3配置环境变量

      

      

5.Pyspark配置

     5.1配置如下系统变量

    

    

   5.2修改spark\conf下的spark-env文件

    在文件末尾加入如下三行

    export PYSPARK_PYTHON=/E:/ProgramCJ/Anaconda2

    export PYSPARK_DRIVER_PYTHON=/E:/ProgramCJ/Anaconda2
    export PYSPARK_SUBMIT_ARGS='--master local[*]'

6.测试Pyspark是否安装成功

    6.1命令行中输入pyspark测试

    

    6.2 显示如下,并新建python root

      

      6.3测试sc的spark变量是否可用

         

 注意:1.下载Spark请选择已经编译好的版本,如果选择源码版本,请使用maven或sbt进行编译即可,方法为进入Spark安装目录,使用> sbt package   进行编译

         2.拷贝 E:\spark\python\pyspark  到 D:\anaconda\Lib\site-packages 目录下

 

转载于:https://www.cnblogs.com/jackchen-Net/p/6667205.html

你可能感兴趣的文章
thsi指针的一些用法及作用
查看>>
c++友元
查看>>
c++运算符重载
查看>>
一元运算符重载
查看>>
Windows 远程栈溢出挖掘
查看>>
(网页)the server responded with a status of 403 (Forbidden)
查看>>
葡萄城报表介绍:Java 报表
查看>>
android 通知消息一
查看>>
UNET学习笔记2 - 高级API(HLAPI)
查看>>
腾讯编程马拉松2012第一题
查看>>
Day18
查看>>
Web Service数据源
查看>>
php.ini详解(转)
查看>>
[转]基于Python的接口测试框架
查看>>
"ORA-00942: 表或视图不存在 "的原因和解决方法[转]
查看>>
PeekMessage、GetMessage的区别
查看>>
磁盘使用率达到100%
查看>>
linux跳过root密码登陆
查看>>
mini2440 U-boot 编译
查看>>
在UTF-8中,一个汉字为什么需要三个字节?
查看>>