Spark学习记录3：PySpark Notebook连接

博主： admin
发布时间：2021 年 07 月 14 日
591次浏览
暂无评论
924字数
分类： Spark 机器学习实战

在根据Spark学习记录1：安装单机Spark环境安装了Spark环境后，现在来配置以下PySpark环境

一共分4步：

把SPARK_HOME添加进永久环境变量
安装findspark库
重新进入user或者使用source /etc/profile更新配置文件
跑一下测试代码，如果没报错就成功了

在/etc/profile添加环境变量，之后执行

sudo vi /etc/profile
# 添加一行
# export SPARK_HOME=/home/ubuntu/spark-learn/spark-3.1.2-bin-hadoop3.2

# 更新环境变量
source /etc/profile

安装findspark库

pip install findspark

重进入user，启动jupyter notebook
输入下列代码测试

import findspark
findspark.init()

import pyspark
import random

sc = pyspark.SparkContext(appName="Pi")
num_samples = 100000000

def inside(p):     
    x, y = random.random(), random.random()
    return x*x + y*y < 1

count = sc.parallelize(range(0, num_samples)).filter(inside).count()

pi = 4 * count / num_samples
print(pi)

# sc.stop()

最后修改：2021 年 07 月 14 日 11 : 32 AM

如果觉得我的文章对你有用，请随意赞赏

发表评论取消回复

评论 *

私密评论

名称 *

🎲

邮箱 *

地址

Spark学习记录3：PySpark Notebook连接

admin • 2021 年 07 月 14 日

在根据Spark学习记录1：安装单机Spark环境安装了Spark环境后，现在来配置以下PySpark环境

一共分4步：

把SPARK_HOME添加进永久环境变量
安装findspark库
重新进入user或者使用source /etc/profile更新配置文件
跑一下测试代码，如果没报错就成功了

在/etc/profile添加环境变量，之后执行

sudo vi /etc/profile
# 添加一行
# export SPARK_HOME=/home/ubuntu/spark-learn/spark-3.1.2-bin-hadoop3.2

# 更新环境变量
source /etc/profile

安装findspark库

pip install findspark

重进入user，启动jupyter notebook
输入下列代码测试

import findspark
findspark.init()

import pyspark
import random

sc = pyspark.SparkContext(appName="Pi")
num_samples = 100000000

def inside(p):     
    x, y = random.random(), random.random()
    return x*x + y*y < 1

count = sc.parallelize(range(0, num_samples)).filter(inside).count()

pi = 4 * count / num_samples
print(pi)

# sc.stop()

Spark学习记录3：PySpark Notebook连接

发表评论取消回复

广义拉格朗日函数及其对偶算法

支持向量机SVM 系列(1)——线性可分支持向量机

支持向量机SVM 系列(2)——对偶方法(Dual Method)

支持向量机SVM 系列(3)——核函数(Kernel Function)

支持向量机SVM 系列(4)——软间隔(soft-margin SVM)

异常检测系列(2)：统计学方法异常检测

SageMaker 自定义Docker+代码训练

奇异值分解:SVD

H&M 比赛记录3：思路——经常一起被购买的商品，是否更值得推荐？

boto3配置AKSK，以及下载S3某个文件夹

Spark学习记录3：PySpark Notebook连接

发表评论 取消回复

Spark学习记录3：PySpark Notebook连接

发表评论取消回复