文章_hanyingjun_极客社区_安科网

hanyingjun

https://i.ancii.com/han3ying1jun8/

文章

Jupyter配置Spark开发环境

为Jupyter配置Spark开发环境，可以安装全家桶–SparkKernel或Toree，也可按需安装相关组件。考虑到一般人更喜欢一步到位，并且Toree将会代替SparkKernel，故直接且仅需安装Toree即可，不过下面还是给出了所有的安装方法。参

hanyingjun 0喜欢 / 0评论 2016-10-09

大数据学习路线，一共分为这几个阶段（文末附赠学习教程一套）

目前，全球数据呈现爆发增长、海量集聚的特点。国家大力推动实施大数据发展战略，推进数据资源整合和开放共享，加快建设数字中国。大数据行业政策环境良好，发展机遇空前。但随着国家的重视，企业的转型，对大数据技术人才的要求也是越来越高，不是掌握一点皮毛就能就业了。

hanyingjun 0喜欢 / 0评论 2019-03-01

Spark的广播变量和累加器使用方法代码示例

通常情况下，当向Spark操作传递一个函数时，它会在一个远程集群节点上执行，它会使用函数中所有变量的副本。这些变量被复制到所有的机器上，远程机器上并没有被更新的变量会向驱动程序回传。在任务之间使用通用的，支持读写的共享变量是低效的。尽管如此，Spark提供

hanyingjun 0喜欢 / 0评论 2017-09-29

加载中...

0 关注 0 粉丝 0 动态

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号-5 京公网安备11010802014868号