文章_wangqiankun00_极客社区_安科网

wangqiankun00

https://i.ancii.com/wangqiankun2010/

文章

HIVE的十项企业级调优

话不多说直接上货。Fetch 抓取是指，Hive 中对某些情况的查询可以不必使用 MapReduce 计算。该属性设置为 more 以后，在全局查找、字段查找、limit 查找等都不走 MapReduce。设置为none后所有类型的查找语句都要走MapRe

wangqiankun00 0喜欢 / 0评论 2018-11-17

聊聊hive随机采样

为了实现总排序，Hive必须将所有数据强制传输到单个reducer。该reducer将对整个数据集进行排序。问题是Hive的将数据拆分为多个reducer的方法是未定义的。在最坏的情况下，假设reduce 的key是基于数据列，而limit子句是reduc

wangqiankun00 0喜欢 / 0评论 2018-09-24

SparkSQL读取Hive中的数据

由于我Spark采用的是Cloudera公司的CDH，并且安装的时候是在线自动安装和部署的集群。最近在学习SparkSQL，看到SparkSQL on HIVE。下面主要是介绍一下如何通过SparkSQL在读取HIVE的数据。在代码最后一行添加sc.sto

wangqiankun00 0喜欢 / 0评论 2016-05-20

Linux下解压工具对比（图表）

Elementary OS团队的成员Shnatsel发布了关于自由Linux压缩工具的测试对比。下面是压缩和解压缩的数据。for testnum in $; do testnum=$ for archiver in bzip2 lzma xz gzip l

wangqiankun00 0喜欢 / 0评论 2011-07-11

Hive中使用自定义函数(UDF)实现分析函数row_number的功能

之前部门实现row_number是使用的transform，我觉得用UDF实现后，平时的使用会更方便，免去了transform相对繁琐的语法。hive> desc row_number_test;OKid1 intid2 stringage

wangqiankun00 0喜欢 / 0评论 2013-11-10

Hive数据导入

可以通过多种方式将数据导入hive表1.通过外部表导入用户在hive上建external表，建表的同时指定hdfs路径，在数据拷贝到指定hdfs路径的同时，也同时完成数据插入external表。

wangqiankun00 0喜欢 / 0评论 2012-07-24

加载中...

0 关注 0 粉丝 0 动态

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号-5 京公网安备11010802014868号