尚码园

首页
java
python
php
html
css
javascript
mysql
linux

spark

【原创】大叔问题定位分享，27spark中rdd.cache
spark2.1.1spark应用中有一些task非常慢，持续10个小时，有一个task日志如下：2019-01-2421:38:56,024[dispatcher-event-loop-22]INFOorg.apache.spark.ex…
时间：2023-07-12 08:16
千呼万唤始出来：Apache Spark2.0正式发布
我们很荣幸地宣布，自7月26日起Databricks开始提供ApacheSpark2.0的下载，这个版本是基于社区在过去两年的经验总结而成，不但加入了用户喜爱的功能，也修复了之前的痛点。本文总结了Spark2.0的三大主题：更简单、更快速、…
时间：2023-06-22 22:22
嵌入式下的深度学习 Sparkfun Edge with TensorFlow，一Hello World
嵌入式下的深度学习SparkfunEdgewithTensorFlow（一）HelloWorld硬件、软件环境微控制器：SparkfunEdge32位ARMCortex-M4F处理器48MHzCPU时钟，带有TurboSPOT™的96MHz…
时间：2023-06-22 10:31
本地spark报：java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$Windows.createFileWithMode0，Ljava/lang/String;JJJILjava/io/FileDescriptor;
我是在运行rdd.saveAsTextFile(fileName)的时候报的错，找了很多说法……最终是跑到hadoop/bin文件夹下删除了hadoop.dll后成功。之前某些说法甚至和这个解决方法自相矛盾，可能是我没有注意到具体报错信息是…
时间：2023-06-22 06:45
CentOS下SparkR安装部署：hadoop2.7.3+spark2.0.0+scale2.11.8+hive2.1.0
注：之前本人写了一篇SparkR的安装部署文章：SparkR安装部署及数据分析实例，当时SparkR项目还没正式入主Spark，需要自己下载SparkR安装包，但现在spark已经支持R接口，so更新了这篇文章。1、Hadoop安装参考：h…
时间：2023-06-21 03:54
【tensorflow2.0】使用spark-scala调用tensorflow2.0训练好的模型
本篇文章介绍在spark中调用训练好的tensorflow模型进行预测的方法。本文内容的学习需要一定的spark和scala基础。如果使用pyspark的话会比较简单，只需要在每个excutor上用Python加载模型分别预测就可以了。但工…
时间：2023-06-16 12:52
基于Spark和Tensorflow构建DCN模型进行CTR预测
实验介绍数据采用CriteoDisplayAds。这个数据一共11G，有13个integerfeatures，26个categoricalfeatures。Spark由于数据比较大，且只在一个txt文件，处理前用split-l400000t…
时间：2023-06-16 08:20
Apache Spark-1.0.0浅析，七：资源调度——结果返回
对于ResultTask，直接执行func操作，最后告知任务是否执行完成；而对于ShuffleMapTask，则需要将中间结果存储到实例化DirectTaskResult，以备下一个task使用，同时还要返回实例化的MapStatus。Ex…
时间：2023-06-15 11:37
spark sql通过jdbc读取mysql时划分分区问题
当通过spark读取mysql时，如果数据量比较大，为了加快速度，通常会起多个task并行拉取mysql数据。其中一个api是defjdbc(url:String,table:String,columnName:String,lowerBo…
时间：2023-06-11 04:10
CentOS6.5下编译R源码并安装Spark R
不多说，直接上干货！为了使用SparkR，决定要在Spark所在的Linux上装上R，结果血泪篇了。主要原因是公司内部的虚机，无法连外网，所以网上很多的直接rpm或者yum的方法都没用，需要自己编译R的源码，中间因为RedhatEnterp…
时间：2023-05-18 13:45
用Apache Spark和TensorFlow进行的深度学习
原文：https://databricks.com/blog/2016/01/25/deep-learning-with-apache-spark-and-tensorflow.htmlbyTimHunterhttp://blog.csdn…
时间：2023-05-18 10:22
jquery sparkline的使用
sparkline是一个开源的图表控件，可以生成很小也很好看的图，地址：http://omnipotent.net/jquery.sparkline/可以下载最新的js文件。使用的时候也很简单，只要把该js文件包含到jsp文件里就可以使用它…
时间：2023-05-16 06:10
spark-sql jdbc操作mysql
SparkConfsparkConf=newSparkConf().setMaster("local").setAppName("MySqlTest");JavaSparkContextjavaSparkContext=newJavaSpa…
时间：2023-05-15 10:10
用idea+maven编译打包spark project core错误：java.lang.RuntimeException: Unable to load a Suite class
Discoverystarting.***RUNABORTED***java.lang.RuntimeException:UnabletoloadaSuiteclassthatwasdiscoveredintherunpath:org.ap…
时间：2023-05-10 19:49
配置SPARK 2.3.0 默认使用 PYTHON3
在bin/pyspark文件中添加exportPYSPARK_PYTHON=python3
时间：2023-04-27 00:52

热门标签

Copyright © 2008-2024渝ICP备2022006305号-5 尚码园.

本站所有数据收集于网络如有侵犯到您的权益请联系，进行下架处理。