当前位置: 首页 > news >正文

【20250607接单】Spark + Scala + IntelliJ 项目的开发环境配置从零教学

本教程适用于零基础一台刚装好 Windows 的全新电脑开始,搭建能运行 Spark + Scala + IntelliJ 项目的开发环境。以下是超详细、小白级别逐步教程,从“下载什么”到“点击哪里”都帮你列清楚。


🎯 目标

  • 操作系统:Windows10/11
  • 工具:openJDK、Scala、Spark、sbt、IntelliJ IDEA、winutils
  • 最终效果:在 IntelliJ 中运行你上传的 Spark 程序(Explore.scala)

🧰 一、安装开发工具(5 步)

✅ 1. 安装 openJDK(Java)

📥 下载地址(华为镜像):

👉 https://mirrors.tuna.tsinghua.edu.cn/Adoptium/8/jdk/x64/windows/
在这里插入图片描述

🚀 安装步骤:
  • 双击安装,点“下一步”即可。
  • 修改设置或重写JAVA_HOME变量,点击下一步,完成安装。
    在这里插入图片描述
✅ 测试:

打开命令提示符(Win + R 输入 cmd):
在这里插入图片描述
输入命令行:

java -version

在这里插入图片描述


✅ 2. 安装 Scala

📥 下载地址(官网):

👉 https://www.scala-lang.org/download/2.12.20.html
在这里插入图片描述

🚀 安装步骤:
  • 双击 .msi 安装
  • 一路next
    在这里插入图片描述
✅ 测试:

打开命令提示符(Win + R 输入 cmd):

scala -version

在这里插入图片描述


✅ 3. 安装 Spark

📥 下载地址(Spark 3.5.6,清华源):

👉 https://mirrors.tuna.tsinghua.edu.cn/apache/spark/spark-3.5.6/
在这里插入图片描述

🚀 安装步骤:
  1. 解压缩 .tgz 文件到任意目录(不要解压在包含中文或空格的路径下)
  2. 得到目录:spark-3.5.6-bin-hadoop3
⚙️ 配置环境变量:

打开「控制面板」→「系统」→「高级系统设置」→「环境变量」

  • 找到 系统变量下的Path
  • 添加 spark安装目录\binPath
    在这里插入图片描述
✅ 测试:
spark-shell --version

在这里插入图片描述


✅ 4. 安装 Hadoop Winutils(适配 Windows)

📥 下载地址(Gitee):

👉 https://github.com/cdarlint/winutils/tree/master/hadoop-3.3.5/bin

下载:

  • winutils.exe

winutils.exe复制到:(自己创建)

C:\hadoop\bin\
⚙️ 配置环境变量:
  • 添加 C:\hadoop\binPath
✅ 测试:
winutils.exe

在这里插入图片描述


✅ 5. 安装 sbt(Scala 构建工具)

📥 下载地址(官网):

👉 https://www.scala-sbt.org/download/
在这里插入图片描述

🚀 安装步骤:
  • 双击安装,默认设置即可
    在这里插入图片描述
✅ 测试:
sbt sbtVersion

在这里插入图片描述


💻 二、安装 IntelliJ IDEA + 配置项目

✅ 1. 下载 IntelliJ IDEA 社区版(免费)

👉 官网:https://www.jetbrains.com/idea/download
在这里插入图片描述
在这里插入图片描述

下载安装后,打开IDEA

✔ 安装插件:

  • ✅ Scala(必须)
    在这里插入图片描述

✅ 2. 创建新 Scala + sbt 项目

📁 项目结构(自动生成):
🚀 创建步骤:
  1. 打开 IntelliJ IDEA → File > New > Project

  2. 左侧选择 Scala → 右侧选 sbt

  3. 配置:

    • 项目名:test
    • Scala SDK:选择 2.12.20
    • sbt 版本:1.11.1
  4. 创建完成
    在这里插入图片描述


✅ 3. 编辑 build.sbt

ThisBuild / version := "0.1.0-SNAPSHOT"ThisBuild / scalaVersion := "2.12.20"lazy val root = (project in file(".")).settings(name := "test")libraryDependencies ++= Seq("org.apache.spark" %% "spark-core" % "3.5.6","org.apache.spark" %% "spark-sql" %  "3.5.6","org.apache.spark" %% "spark-hive" % "3.5.6"
)

在这里插入图片描述


📄 三、运行你的代码文件

在scala文件夹下新建Explore.scala文件
在这里插入图片描述在这里插入图片描述

将你的代码文件复制 Explore.scala 中:
在这里插入图片描述
sbt下载配置依赖:
在这里插入图片描述
代码文件修改以下地方:
其中第三处文件位置填你自己csv文件存放的地址。
在这里插入图片描述
点击绿色三角运行即可:
在这里插入图片描述
出现如下结果即代码运行正常。
在这里插入图片描述


http://www.lqws.cn/news/211519.html

相关文章:

  • 红队实战全流程:从外部侦察到域控征服的内网渗透 >>> 检测一下小伙伴自己的道行哟
  • 【Java学习笔记】String类(重点)
  • 数论总结,(模版与题解)
  • [特殊字符] 深入理解 Linux 内核进程管理:架构、核心函数与调度机制
  • JAVA理论第四战-线程池
  • 动态可写的四层路由利器ngx_stream_keyval_module
  • WSF07N10 MOSFET 在铲皮机中的应用
  • 【西门子杯工业嵌入式-3-如何使用KEY】
  • 垃圾回收相关八股
  • Redis内存淘汰策略
  • 【Linux】LInux下第一个程序:进度条
  • 东芝Toshiba e-STUDIO2110AC打印机信息
  • 数据结构算法(C语言)
  • Ctrl-Crash 助力交通安全:可控生成逼真车祸视频,防患于未然
  • 基于 Transformer robert的情感分类任务实践总结之二——R-Drop
  • altium designer2024绘制stm32过程笔记x`
  • WebRTC通话原理与入门难度实战指南
  • 从零开始制作小程序简单概述
  • Oracle 审计参数:AUDIT_TRAIL 和 AUDIT_SYS_OPERATIONS
  • SDC命令详解:使用set_port_fanout_number命令进行约束
  • AIGC的产品设计演进:从工具到协作者
  • 生成模型从自回归到变分自动编码器
  • 提供MD5解密的网站
  • WaytoAGI东京大会开启AI全球化新对话:技术无国界,合作促创新
  • 虚拟主机都有哪些应用场景?
  • C++11新增重要标准(下)
  • OTF字体包瘦身,保留想要的字
  • 【win | docker开启远程配置】使用 SSH 隧道访问 Docker的前操作
  • excel中数字不满六位在左侧前面补0的方法
  • python打卡第45天