记一次奇葩的Spark内存溢出OOM

最新推荐文章于 2025-03-25 19:19:29 发布

原创

最新推荐文章于 2025-03-25 19:19:29 发布 · 2.1k 阅读

标签

#spark #scala #OOM #分区和并行

收录于

本文详细分析了Spark作业中出现的Out of Memory错误，并通过调整配置参数和优化数据读取策略来解决此问题。文中提到如何正确设置driver和executor资源，以及如何避免因shuffle和join操作引发的内存溢出。

错误信息如下：

org.apache.spark.memory.SparkOutOfMemoryError: Unable to acquire 1048576 bytes of memory, got 65536

内存溢出的位置：做JOIN操作的时候，内存溢出了。

首先，定位下任务使用的资源，

其次，调参数

--driver-cores 4 \
--driver-memory 8G \
--executor-cores 4 \
--executor-memory 16G \

--num-executors 200 \

一般我们会设置的参数是 driver的核数、内存，exector的核数、内存，exector个数。

driver的内存用于管理任务调度和记录task工作节点，以及任务返回的结果等。如果任务数、或返回结果超过了内存，任务会失败，报的也是OOM。

exector的内存用于执行任务，比如shuffle、join之类的，4个core共用这里的16G内存，一个核有4G内存可用。

资源使用图显示的是continer的资源使用，并没有真实的反应excutor使用的内存。

我试着调小exector的核数、增大exector内存，使得每个exector可以使用的内存尽量大些。但仍然报OOM。

我从底层数据排查发现，其中一个上游表的partition

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Just Jump

关注关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

spark There is no enough memory to build hash map

九师兄

07-04

2568

启动spark动态分配后

参与评论您还未登录，请先登录后发表或查看评论

spark executor内存足够使用，却报错SparkOutOfMemory： Unable to acquire xxx bytes of memory，如何解决？是否与coalesce有关？

慢慢来

12-23

2137

文章目录问题描述解决办法问题描述从spark查出来数据后可以再次保存到hive中。当数据量不是很大的时候，为了避免产生过多小文件，可以使用重分区来解决。重分区有两个方法：coalesce 和 repartition 。本文重点不是介绍这两个方法，所以大概说一下区别：coalesce 不需要shuffle，而 repartition 需要 shuffle。而为

Spark 运行产生Unable to acquire xxx bytes of memory 错误解决方法

王天一的博客

05-28

5149

背景：对单月日志进行分析时（120G左右），生成结果csv文件时 .coalesce(1) .write .mode(SaveMode.Overwrite) .format("com.databricks.spark.csv") .option("header", "true") .save("periodowntop10.csv") **coalesce函数为控制结果文件个数为1 因为有多少个partition 就会在指定目录下生

SparkOutOfMemoryError: Unable to acquire 65536 bytes of memory, got 0

WGS.

09-15

8351

Caused by: org.apache.spark.memory.SparkOutOfMemoryError: Unable to acquire 65536 bytes of memory, got 0 原因：代码逻辑或任务参数配置不合理、数据倾斜等导致OOM。分为driver OOM和executor OOM。解决方法：（1）查看代码中是否有coalesce()等函数，该函数相比repartition()不会进行shuffle，处理大分区易造成OOM，如果有则可换成repartition()，

spark学习2之OutOfMemoryError错误的解决办法

Keep Learning

09-18

1万+

spark之OutOfMemoryError错误的解决办法：xubo@xubo:~/cloud/spark-1.4.1$ spark-submit --master local examples/src/main/python/pi.py 1000 Traceback (most recent call last): File "/home/xubo/cloud/spark-1.4.1/exam

java.lang.OutOfMemoryError: Unable to acquire 65536 bytes of memory, got 0

qq_42913729的博客

07-11

4167

java.lang.OutOfMemoryError: Unable to acquire 65536 bytes of memory, got 0 at org.apache.spark.memory.MemoryConsumer.allocateArray(MemoryConsumer.java:98) at org.apache.spark.util.collection.unsafe....

spark-sql cli模式下driver内存溢出

天龙八部

10-10

1676

采用spark-sql启动编程，编写sql执行，但是数据量很少，不到一百条，执行时显示内存溢出,并且是已经显示stage进度条；如果是在编译过程中提示内存溢出，极有可能是driver内存分配的太小，而sql编译后stage太多导致，但是下面的这个是程序用改已经执行了，跟executor-memory有关，和driver没有多少关系了，但是最后的解决方法是加大了driver内存。这一点目前理解不同，...

Spark常见报错与问题解决方法

热门推荐

书忆江南的IT博客

04-21

4万+

1.org.apache.spark.SparkException: Kryo serialization failed: Buffer overflow 原因：kryo序列化缓存空间不足。解决方法：增加参数，--confspark.kryoserializer.buffer.max=2047m。 2.org.elasticsearch.hadoop.rest.EsHadoopNoN...

Spark DataFrame中使用window 函数报oom错误

crazybean_lwb的博客

05-31

2542

故障发生背景和错误日志现有如下任务：多个小表与大表join后新产生的表有很多空值，使用window函数对空值进行分组填充。任务中途中中断，抛出oom错误。截取抛出来的主要的错误日志，日志的内容如下： 19/05/16 10:11:39 WARN TaskMemoryManager: leak 32.0 KB memory from org.apache.spark.shuffle.sort....

pyspark

qq_42337191的博客

06-30

274

一、读写hdfs上文件读取hdfs某目录下的json文件： json_dir=‘hdfs:////.json’ spark.read.format(‘json’).option(‘header’,‘true’).option(‘inferSchema’,‘true’).load(json_dir) 写入hdfs: df.rdd.saveAsTextFile(“hdfs://”) 最后一级需要是目录二、 ...

简单搞定Spark性能优化:常见异常解决（二）

github_36444580的博客

05-24

2871

第一部分内容链接：https://blog.csdn.net/github_36444580/article/details/117037685 11.ERROR shuffle.RetryingBlockFetcher: Failed to fetch block shuffle_7_18444_7412, and will not retry 原因：Executor被kill，无法拉取该block。可能是开启AE特性时数据倾斜造成的，其他executor都已完成工作被回收，只有倾斜的exec..

pyspark写入mysql内存溢出_Spark开发-Spark内存溢出原因以及解决方式

weixin_30128407的博客

02-02

1524

Dpark内存溢出Spark内存溢出堆内内存溢出堆外内存溢出堆内内存溢出java.lang.OutOfMemoryError: GC overhead limit execeededjava.lang.OutOfMemoryError: Java heap space具体说明Heap size JVM堆的设置是指java程序运行过程中JVM可以调配使用的内存空间的设置.JVM在启动的时候会自动设...

hive on spark 内存溢出

cakecc2008的专栏

07-31

1851

前端时间用hive改写了一个java mapreduce查询，由于用到了grouping sets，组合比较多，同时数据也比较大（每天1700万左右），需要对当月进行统计。每到下半月时，reduce阶段就经常报内存溢出错误。错误信息如下 Reducer preempted to make room for pending map attempts Container killed by the...

Spark 运行内存溢出问题

光尘的博客

11-23

2896

当用Spark和Hadoop做大数据应用的时候，你可能会反复的问自己怎么解决这一的一个问题：“Container killed by YARN for exceeding memory limits. 16.9 GB of 16 GB physical memory used. Consider boosting spark.yarn.executor.memoryOverhead”这个错误总会使你的job夭折。它的意思是：因为超出内存限制，集群停掉了container(还没有找到很好的翻译的词)。...

Spark sql 连续join次数太多导致内存溢出

ilyomind的博客

04-08

2850

通过一次内存溢出问题，教你使用jvisualvm来分析堆存储文件。spark多次join导致内存溢出，java.lang.OutOfMemoryError: Java heap space at java.util.Arrays.copyOf(Arrays.java:3332) at java.lang.AbstractStringBuilder.expandCapacity(AbstractStringBuilder.java:137)。

Spark性能优化——数据倾斜-groupByKey导致内存溢出

Accelerating的博客

09-28

1647

数据倾斜：shuffle操作时,由于相同key会被分配到同一个reduce端执行,而大部分数据的key值相同,导致部分task处理的数据量过大,分配不均。触发shuffle的常见算子：distinct、groupByKey、reduceByKey、aggregateByKey、join、cogroup、repartition等。查看导致数据倾斜的key的数据分布情况根据执行操作的不同，可以有很多种查看key分布的方式： 1、如果是Spark SQL中的group by、join语句导致的数据倾斜，

java.lang.OutOfMemoryError: Unable to acquire 65536 bytes of memory,

胖胖的博客

04-26

915

出错代码： rdd.coalesce(1).saveAsTextFile(outpath) 解决：将coalesce改成repartition即可原因： repartition会开一个shuffle将文件进行合并，所以他的上游还是多个partition并行运行的。而coalesce是直接用一个分区处理所有数据。 ...

Spark实战中的坑，你踩过几个？技术专家深度解析！