Spark学习-3 运行一个example - Fisher小屋 - ITeye博客

`

Djava.sohu.com

浏览: 63698 次
性别:
来自: 上海

最近访客更多访客>>

tyzqqq

erocx

scaler

zcpwillam

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

一说书先生：快学Spark 2.0(新特性、含真实项目、纯Scala语言开 ...
Spark学习-关于Spark的开发语言Scala
llhdf：现在我们发布了 windows 64 位系统下sparkid ...
Spark的学习2-IDE
nuan268：你好，不知能否给一份代码参考下呢，邮箱nuan268@foxm ...
我的Js日志组件 logger for js (log4js)- (2009-10-30)
hbbbs： Djava.sohu.com 写道回9 楼 hbbbs:比co ...
我的Js日志组件 logger for js (log4js)- (2009-10-30)
Djava.sohu.com：回9 楼 hbbbs:比console.log方便的地方包括： ...
我的Js日志组件 logger for js (log4js)- (2009-10-30)

Spark学习-3 运行一个example

博客分类：

BigData
Spark
学习

Spark BigData winutils.exe

阅读更多

开始学习Spark了，先看看Spark能做点什么吧。

最好的方式就是先运行个例子程序。先从Spark网站下载一个运行环境(我的运行环境是Win7, 64bits) 。

我们在官方网站: http://spark.apache.org/downloads.html下载一个版本：
我选 Spark 1.0 + Prebuild for Hadoop 2.3, Link为
http://d3kbcqa49mib13.cloudfront.net/spark-1.1.0-bin-hadoop2.3.tgz

下载解压后，进入到bin目录,运行 run-example.cmd SparkPi 10, 你就可以看到运行的结果了。

你可能会遇到以下这个问题:
===> 说null/bin/winutils.exe找不到，这是因为Spark引用Hadoop的包，而Hadoop需要检查这个文件。所以解决这个最简单方式是设置 HADOOP_HOME指向你Spark的根目录,然后把winutils.exe拷到bin目录。如果没有winutils.exe,你可以到网上搜下。
a. 你可以 SET HADOOP_HOME=D:\Java\spark\spark-1.1.0-bin-hadoop2.3 (需要将这个路径改成你的实际路径.
然后再运行命令就可以了。
b. 或者修改bin/*.cmd文件，把下面这句加进去就可以了
SET HADOOP_HOME=%~dp0..
这句就是说设置HADOOP_HOME的路径为 bin的父目录。

分享到：

Spark学习-关于云平台的一个问题 | Spark的学习2-IDE

2014-10-15 11:10
浏览 10703
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

spark-3.4.1-bin-hadoop3.tgz - Spark 3.4.1 安装包(内置了Hadoop 3): 文件名: spark-3.4.1-bin-hadoop3.tgz 这是 Apache Spark 3.4.1 版本的二进制文件，专为与 Hadoop 3 配合使用而设计。Spark 是一种快速、通用的集群计算系统，用于大规模数据处理。这个文件包含了所有必要的组件，...

spark-3.2.0-bin-hadoop3-without-hive: spark-3.2.0-bin-hadoop3-without-hive

spark-3.1.3-bin-hadoop3.2.tgz: Apache Spark版本3.1.3。Linux安装包。spark-3.1.3-bin-hadoop3.2.tgz

hudi-spark3-bundle_2.12-0.10.0-SNAPSHOT.jar: spark读取hudi，hudi版本0.10

spark-3.1.3-bin-without-hadoop.tgz: Spark安装包：spark-3.1.3-bin-without-hadoop.tgz

spark-3.2.0-bin-hadoop3.2.tgz: spark-3.2.0-bin-hadoop3.2.tgz

spark-3.0.0-bin-hadoop3.2: spark-3.0.0-bin-hadoop3.2下载安装包

spark-3.1.2.tgz & spark-3.1.2-bin-hadoop2.7.tgz.rar: spark-3.1.2.tgz版本 & spark-3.1.2-bin-hadoop2.7.tgz版本

spark-2.0.0-bin-hadoop2.6.tgz: 本资源是spark-2.0.0-bin-hadoop2.6.tgz百度网盘资源下载,本资源是spark-2.0.0-bin-hadoop2.6.tgz百度网盘资源下载

spark-3.2.2-bin-3.0.0-cdh6.3.2: 内容概要：由于cdh6.3.2的spark版本为2.4.0，并且spark-sql被阉割，现基于cdh6.3.2，scala2.12.0，java1.8，maven3.6.3，,对spark-3.2.2源码进行编译应用：该资源可用于cdh6.3.2集群配置spark客户端，用于spark-sql

graphframes-0.8.1-spark3.0-s_2.12.jar: graphframes-0.8.1-spark3.0-s_2.12.jar

apache-doris-spark-connector-2.3_2.11-1.0.1: Spark Doris Connector（apache-doris-spark-connector-2.3_2.11-1.0.1-incubating-src.tar.gz） Spark Doris Connector Version：1.0.1 Spark Version：2.x Scala Version：2.11 Apache Doris是一个现代MPP分析...

spark-assembly-1.5.2-hadoop2.6.0.jar: spark-assembly-1.5.2-hadoop2.6.0 在spark编程中使用的一个jar

spark2.1.0-bin-hadoop2.7: spark-2.1.0-bin-hadoop2.7.tgz linux 安装文件。

spark-3.2.1-bin-hadoop2.7.tgz: linux的spark新版本，匹配hadoop2.7版本，spark-3.2.1-bin-hadoop2.7.tgz

spark-3.2.4-bin-hadoop3.2-scala2.13 安装包: spark-3.2.4-bin-hadoop3.2-scala2.13 安装包

spark-2.3.4-bin-hadoop2.7.tgz: pyspark本地的环境配置包，spark-2.3.4-bin-hadoop2.7.tgz：spark-2.3.4-bin-hadoop2.7.tgz

spark-streaming-kafka-0-8_2.11-2.4.0.jar: spark-streaming-kafka-0-8_2.11-2.4.0.jar

apache-doris-spark-connector-3.1_2.12-1.0.1: Spark Doris Connector（apache-doris-spark-connector-3.1_2.12-1.0.1-incubating-src.tar.gz） Spark Doris Connector Version：1.0.1 Spark Version：3.x Scala Version：2.12 Apache Doris是一个现代MPP分析...

spark-2.1.0-bin-without-hadoop版本的压缩包，直接下载到本地解压后即可使用: 在Ubuntu里安装spark，spark-2.1.0-bin-without-hadoop该版本直接下载到本地后解压即可使用。 Apache Spark 是一种用于大数据工作负载的分布式开源处理系统。它使用内存中缓存和优化的查询执行方式，可针对任何规模...

Global site tag (gtag.js) - Google Analytics