博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
spark解决 org.apache.spark.SparkException: Kryo serialization failed: Buffer overflow
阅读量:5740 次
发布时间:2019-06-18

本文共 1543 字,大约阅读时间需要 5 分钟。

hot3.png

错误

使用spark sql 处理数据时报这个错误

Exception in thread "main" java.sql.SQLException: org.apache.spark.SparkException: Job aborted due to stage failure: Task 3107 in stage 308.0 failed 4 times, most recent failure: Lost task 3107.3 in stage 308.0 (TID 620318, XXX): org.apache.spark.SparkException: Kryo serialization failed: Buffer overflow. Available: 1572864, required: 3236381Serialization trace:values (org.apache.spark.sql.catalyst.expressions.GenericInternalRow). To avoid this, increase spark.kryoserializer.buffer.max value.        at org.apache.spark.serializer.KryoSerializerInstance.serialize(KryoSerializer.scala:299)        at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:240)        at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)        at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)        at java.lang.Thread.run(Thread.java:745)Driver stacktrace:        at org.apache.hive.jdbc.HiveStatement.execute(HiveStatement.java:275)        at org.apache.hive.jdbc.HiveStatement.executeQuery(HiveStatement.java:355)        at com.peopleyuqing.tool.SparkJDBC.excuteQuery(SparkJDBC.java:64)        at com.peopleyuqing.main.ContentSubThree.main(ContentSubThree.java:24)

方法

val sparkConf = newSparkConf().setAppName(Constants.SPARK_NAME_APP)     .set("spark.kryoserializer.buffer.max","128m");

原因

原因分析: RDD extends scala.AnyRef withscala.Serializable  ,所以在使用textFile ,读取表的数据等大量创建新的rdd,df,ds等 数据集的时候,注意把 这个值调大

转载于:https://my.oschina.net/u/2000675/blog/1606337

你可能感兴趣的文章
在Lync 2013环境部署Office Web Apps
查看>>
微软大会Ignite,你准备好了么?
查看>>
读书笔记-高标管事 低调管人
查看>>
Master带给世界的思考:是“失控”还是进化
查看>>
用户和开发者不满苹果iCloud问题多多
查看>>
attrs.xml中declare-styleable 详解(用于自定义控件的属性)
查看>>
java.lang.UnsatisfiedLinkError:no dll in java.library.path终极解决之道
查看>>
错误“Unexpected namespace prefix "xmlns" found for tag LinearLayout”的解决方法(转)
查看>>
我的工具:文本转音频文件
查看>>
【许晓笛】从零开始运行EOS系统
查看>>
【跃迁之路】【460天】程序员高效学习方法论探索系列(实验阶段217-2018.05.11)...
查看>>
C++入门读物推荐
查看>>
TiDB 源码阅读系列文章(七)基于规则的优化
查看>>
面试中会遇到的正则题
查看>>
Spring之旅第八站:Spring MVC Spittr舞台的搭建、基本的控制器、请求的输入、表单验证、测试(重点)...
查看>>
数据结构与算法——常用排序算法及其Java实现
查看>>
你所不知的Webpack-多种配置方法
查看>>
React.js 集成 Kotlin Spring Boot 开发 Web 应用实例详解
查看>>
webpack+typescript+threejs+vscode开发
查看>>
python读excel写入mysql小工具
查看>>