starksummer_极客社区_安科网

starksummer

https://i.ancii.com/starksummer/

动态

Ta还没有发布动态 ...

文章

spark - RDD梳理

如果对1个rdd作用于一个function，其实是对里面的每个split做function，1个split就是一个partition. （可选）对于有一个Hashpartition对应于key-value类型的rdd，sortbykey对应一个range-

starksummer 0喜欢 / 0评论 2018-03-19

Find Data in DynamoDB in Spark

Hereismysteps.FirstofallIdoascan. None. None. None. None. None. None. 243074. %spark.dep. z.load("mysql:mysql-connector-jav

starksummer 0喜欢 / 0评论 2019-03-31

Spark 体系架构

看过Alexey博文的同学应该都知道，他对Spark理解地非常深入，读完他的“spark-architecture”这篇博文，有种醍醐灌顶的感觉，从JVM内存分配到Spark集群的资源管理，步步深入，感触颇多。因此，在周末的业余时间里，将此文的核心内容译成

starksummer 0喜欢 / 0评论 2017-07-13

spark弹性分布式数据集基本操作

② spark使用分布式内存计算及流处理方式，在速度上有明显优势；而hadoop的MapReduce系统会在每次操作之后将所有数据写回到物理存储介质上；④ spark本身没有一个分布式存储系统，这样，spark程序就能直接使用HDFS上的数据；

starksummer 0喜欢 / 0评论 2016-11-07

Mesos资源调度与管理的深入分享与交流

分布式系统的原则：可伸缩性，没有单点失效，高可靠性，数据本地性。这是很常见的分布式系统的基本原则。这个大家可以参考王总以前的一篇 CSDN文章。另外，数据是存储在HDFS中的，Mesos上的Spark与HDFS进行了绑定，Spark会无缝使用HDFS

starksummer 0喜欢 / 0评论 2016-10-26

查看更多文章

0 关注 0 粉丝 0 动态

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号-5 京公网安备11010802014868号