文章_蔡瀛_极客社区_安科网

蔡瀛

https://i.ancii.com/xia0cai/

文章

spark学习一

因为在Spark里面，有RDD的抽象概念。各个处理节点之间的通信模型不再像Hadoop那样就是唯一的DataShuffle一种模式。不过由于RDD的特性，Spark不适用那种异步细粒度更新状态的应用，例如web服务的存储或者是增量的web爬虫和索引。Spa

蔡瀛 0喜欢 / 0评论 2015-07-21

Hive 导出本地文件

insert overwrite local directory '/home/yule/test' select distinct userid from t_origin_ugc_stat_online where datecol = '2015-03

蔡瀛 0喜欢 / 0评论 2015-04-03

Ubuntu安装Hive及mysql

exportPATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HIVE_INSTALL/bin. /hive-log4j.properties. hi

蔡瀛 0喜欢 / 0评论 2012-08-03

hive 安装 max key length is 767 bytes

下载并解压hive文件后，进入hive/bin/下，配置hive-config.sh文件：

蔡瀛 0喜欢 / 0评论 2012-06-01

测评Hive、SparkSQL、Presto 等七个大数据查询引擎，最快的是?

现在大数据组件非常多，众说不一，那么每个企业在不同的使用场景里究竟应该使用哪个引擎呢？易观Spark实战营团队选取了Hive、SparkSQL、Presto、Impala、HAWQ、ClickHouse、Greenplum七个大数据查询引擎，在原生推荐配置

蔡瀛 0喜欢 / 0评论 2019-04-29

扣丁学堂大数据分析之2018大数据Spark性能调优之数据倾斜

绝大多数task执行得都非常快，但个别task执行极慢。比如总共有1000个task，997个task都在1分钟之内执行完了，但是剩余两三个task却要一两个小时，这种情况很常见。2018大数据Spark性能调优之数据倾斜，扣丁学堂大数据培训老师分享给大家

蔡瀛 0喜欢 / 0评论 2019-01-07

nodejs下打包模块archiver详解

archiver是一个在nodejs中能跨平台实现打包功能的模块，可以打zip和tar包，是一个比较好用的三方模块。使用前先安装archiver模块。

蔡瀛 0喜欢 / 0评论 2019-04-02

加载中...

0 关注 0 粉丝 0 动态

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号-5 京公网安备11010802014868号