andyshar_极客社区_安科网

andyshar

https://i.ancii.com/andyshar/

动态

Ta还没有发布动态 ...

文章

hadoop2.7.0 ha Spark

集群中 Spark 集群模式的安装过程配置过程并测试 Spark 的一些基本使用方法。Spark history server就是为了应对这种情况而产生的，通过配置，Spark应用程序在运行完应用程序之后，将应用程序的运行信息写入指定目录，而Spark h

andyshar 0喜欢 / 0评论 2015-05-22

es通过spark实现join查询

elastic search是一个分布式的搜索引擎，支持对数亿的数据进行秒级的查询操作。其底层使用了lucene来进行存储，对lucene进行了分布式的封装，同时在数据进入时进行了translog以实现fail over。在将elastic search时

andyshar 0喜欢 / 0评论 2017-09-14

Spark的那些外部框架

其规模及数量都还在不断增加。本文我们将介绍不包含在Spark核心源代码库的各种外部框架。Spark试图解决的问题涵盖的面很广，跨越了很多不同领域，使用这些框架能帮助降低初始开发成本，充分利用开发人员已有的知识。要使用Spark库，你首先必须了解的东西是Sp

andyshar 0喜欢 / 0评论 2017-06-16

spark action记录

12.fold:通过op函数聚合各分区中的元素及合并各分区的元素，op函数需要两个参数，在开始时第一个传入的参数为zeroValue,T为RDD数据集的数据类型，，其作用相当于SeqOp和comOp函数都相同的aggregate函数

andyshar 0喜欢 / 0评论 2017-02-09

Spark/Hadoop/Zeppelin Upgrade(1)

>java-version. javaversion"1.8.0_77". 2MAVENInstallation. >mvn--version. >sudoapt-getinstallunzip. >sudoap

andyshar 0喜欢 / 0评论 2016-03-29

查看更多文章

0 关注 0 粉丝 0 动态

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号-5 京公网安备11010802014868号