阅读Spark源代码,最简单的方式是下载源码包,解压后用纯文本方式来阅读源码。这样效率不高,可以用sbteclipse这个插件,将sbt项目文件转化为eclipse项目文件,然后导入到Scala IDE,用eclipse来阅读源码,效率大大提高。
环境:Windows 7, JDK 1.6
- 安装 scala。去官网 http://www.scala-lang.org/ ,下载MSI,安装,按默认设置即可。
安装 sbt。去官网 http://www.scala-sbt.org/ , 下载MSI,安装,按默认设置即可。
Linux下可以省略以上两步,spark源码自带了一个sbt,且启动sbt时它会自动下载对应的scala编译器。安装 Scala IDE。 去官网 http://scala-ide.org/,点击”Get the SDK”绿色按钮,下载。这个IDE的好处是,自带了scala编译器,解压即可使用。
下载spark源码。 去官网 http://spark-project.org/ 下载源码,当前版本是 0.7.2, source package 大约4M左右。解压源码,例如 解压到 d:spark-0.7.0\
添加 sbteclipse 插件依赖。spark已经添加了依赖,这一步什么也不需要做。
这个插件的作用,就是能够读取sbt的配置文件,生成一个eclipse的工程文件。有了eclipse工程文件,就可以导入到eclipse了。
spark已经添加了依赖,见 d:\spark-0.7.2\project\plugins.sbt,有一行
addSbtPlugin(“com.typesafe.sbteclipse” % “sbteclipse-plugin” % “2.1.1”)
启动cmd,启动sbt。
cd d:\spark-0.7.0
sbtLinux下则是
cd d:\spark-0.7.0
sbt/sbt开始下载各种依赖包,需要等待很长时间。
翻@_@墙。见本文最后一段。