Spark 调优

发表于2019-11-19|更新于2020-03-08|Spark

|字数总计:159|阅读时长:1分钟|阅读量:

在执行 Spark 的应用程序时，Spark集群会启动 Driver 和 Executor 两种 JVM 进程，前者为主控进程，负责创建 Spark 上下文，提交 Spark 作业[Job]，并将作业转化为计算任务[Task]，在各个 Executor 进程间协调任务的调度；后者负责在工作节点上执行具体的计算任务，并将结果返回给 Driver，同时为需要持久化的 RDD 提供存储功能。由于 Driver 的内存管理相对来说较为简单，本节主要对 Executor 的内存管理进行分析，下文中的 Spark 内存均特指 Executor 的内存。

文章作者: 周晓晨

文章链接: http://joccer.gitee.io/2019/11/19/Spark%20%E4%BC%98%E5%8C%96/