文章_RiverCode_极客社区_安科网

RiverCode

https://i.ancii.com/rivercode/

文章

描述大数据的技术生态！Hadoop、Hive、Spark 之间又是什么关系？

大数据本身是个很宽泛的概念，Hadoop生态圈基本上都是为了处理超过单机尺度的数据处理而诞生的。你可以把它比作一个厨房所以需要的各种工具。锅碗瓢盆，各有各的用处，互相之间又有重合。你可以用汤锅直接当碗吃饭喝汤，你可以用小刀或者刨子去皮。但是每个工具有自己的

RiverCode 0喜欢 / 0评论 2019-11-22

spark 安装

环境:CentOS 6.4, Hadoop 1.1.2, JDK 1.7, Spark 0.7.2, Scala 2.9.3. 折腾了几天，终于把Spark 集群安装成功了，其实比hadoop要简单很多，由于网上搜索到的博客大部分都还停留在需要依赖meso

RiverCode 0喜欢 / 0评论 2015-02-04

剖析Spark集群技术在美团网站的实战运用

前言美团是数据驱动的互联网服务，用户每天在美团上的点击、浏览、下单支付行为都会产生海量的日志，这些日志数据将被汇总处理、分析、挖掘与学习，为美团的各种推荐、搜索系统甚至公司战略目标制定提供数据支持。基于以上原因，美团在2014年的时候引入了Spark。为了

RiverCode 0喜欢 / 0评论 2016-04-18

spark streaming的使用心得

今天，主要想聊聊spark streaming的使用心得。其实，想用好spark streaming 掌握spark core，spark rpc，spark 任务调度，spark 并行度等原理还非常有必要。里面很多注意事项，比如顺序性，key的超时机制维

RiverCode 0喜欢 / 0评论 2018-10-02

Spark 重分区函数：coalesce和repartition区别与实现，优化Spark

Return a new RDDthat is reduced into numPartitions partitions. This results in a narrowdependency, e.g. if you go from 1000 part

RiverCode 0喜欢 / 0评论 2018-08-20

基于Alluxio系统的Spark DataFrame高效存储管理技术

介绍越来越多的公司和组织开始将Alluxio和Spark一起部署从而简化数据管理，提升数据访问性能。Qunar最近将Alluxio部署在他们的生产环境中，从而将Spark streaming作业的平均性能提升了15倍，峰值甚至达到300倍左右。而在采用Al

RiverCode 0喜欢 / 0评论 2019-01-31

Spark Structured Streaming特性介绍

为帮助开发者更深入的了解这三个大数据开源技术及其实际应用场景，9月8日，InfoQ联合华为云举办了一场实时大数据Meetup，集结了来自Databricks、华为及美团点评的大咖级嘉宾前来分享。作为Spark Structured Streaming最核心

RiverCode 0喜欢 / 0评论 2019-04-30

Spark 1.2 发布，开源集群计算系统

Spark 1.2 发布，此版本包括 172 位贡献者和超过 1000 个 commits。Spark 是在 Scala 语言中实现的，它将 Scala 用作其应用程序框架。尽管创建 Spark 是为了支持分布式数据集上的迭代作业，但是实际上它是对 Had

RiverCode 0喜欢 / 0评论 2014-12-22

加载中...

0 关注 0 粉丝 0 动态

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号-5 京公网安备11010802014868号