文章_longshenlmj_极客社区_安科网

longshenlmj

https://i.ancii.com/longshenlmj/

文章

hive开窗函数

https://blog.csdn.net/Abysscarry/article/details/81408265

longshenlmj 0喜欢 / 0评论 2018-11-08

hive中order by,sort by, distribute by, cluster by作用以及用法

Hive中的order by跟传统的sql语言中的order by作用是一样的，会对查询的结果做一次全局排序，所以说，只有hive的sql中制定了order by所有的数据都会到同一个reducer进行处理。但是对于大量数据这将会消耗很长的时间去执行。di

longshenlmj 0喜欢 / 0评论 2015-08-10

hive 建表异常处理字节太长

hive create table: Specified key was too long; max key length is 767 bytes. 把hive 的metadata配置成mysql,在mysql数据库里创建了hive db后,修改hive

longshenlmj 0喜欢 / 0评论 2014-03-14

HIVE数据类型

HIVE中数据类型分为数值类型、字符串类型、日期类型、复合类型以及其他类型。下面分别进行介绍。整型数值默认按照INT处理，浮点数值默认按照DOUBLE处理。DECIMAL类型比DOUBLE类型为浮点数提供了精确的数值和更广的范围，DECIMAL类型存储了数

longshenlmj 0喜欢 / 0评论 2019-06-28

2018年第32周-获取hive进度功能

原理大概原理时，自己写个hook，配置在hive里，然后hive每次运行sql时会执行hook，而我们写的这个hook会以http请求，发送这个hql相关信息，所以在这里我们还得写一个接口来获得hook发过来的信息，然后hive信息里有个文件记录MR的进度

longshenlmj 0喜欢 / 0评论 2019-06-28

干货总结： Hive 数据导入 HBase

业务场景Hive离线计算好的数据，需要同步到HBase供在线业务查询.思路是用 Hbase 自带的 ImportTsv 工具。Hive 跑批建表语句，要用文本格式，即 Tsv 格式，分割符可以自己定义。STORED AS TEXTFILE;跑批语句

longshenlmj 0喜欢 / 0评论 2019-06-25

学习钻MapR Sandbox Lesson1:了解数据集《译》

钻可以不用先验知识和定义它的模式来分析数据。这意味着您可以立即开始查询数据，不用管它的格式。quit本教程示例使用钻壳。DECIMAL数据类型在这个版本中默认是禁用的,所以在继续之前启用DECIMAL数据类型:. 先用mapr账户远程登录到沙箱，然后sql

longshenlmj 0喜欢 / 0评论 2019-06-20

解析Facebook的数据库查询引擎Presto在美团的应用

Facebook的数据仓库存储在少量大型Hadoop/HDFS集群。Hive是Facebook在几年前专为Hadoop打造的一款数据仓库工具。在以前，Facebook的科学家和分析师一直依靠Hive来做数据分析。但Hive使用MapReduce作为底层计算

longshenlmj 0喜欢 / 0评论 2016-04-17

在 Apache Hive 中轻松生存的12个技巧

Hive 可以让你在 Hadoop 上使用 SQL，但是在分布式系统上优化 SQL 则有所不同。这里是让你可以轻松驾驭 Hive 的12个技巧。所以，为了让你免受这种痛苦，我决定将它们写出来，以便让你在你的下一个 Hive 项目中逃离这种折磨。最好的办法是

longshenlmj 0喜欢 / 0评论 2016-04-07

面试必备技能-HiveSQL优化

Hive SQL基本上适用大数据领域离线数据处理的大部分场景。Hive SQL的优化也是我们必须掌握的技能，而且，面试一定会问。那么，我希望面试者能答出其中的80%优化点，在这个问题上才算过关。当然这个值不能设置过大，因为有些作业会有reduce任务，如果

longshenlmj 0喜欢 / 0评论 2019-04-27

[Hive]编写non-deterministic的UDF时遇到的谓词下推（Predicate

遇到这样一个问题：。但是结果却意想不到：。竟然把value最大的给取出来了！不筛选rn再看一下：。明明是li4对应的1，为什么筛选rn = 1却得到的是wang5 ？看一下执行计划，豁然开朗了：

longshenlmj 0喜欢 / 0评论 2013-11-10

Hive索引

索引是标准的数据库技术，hive 0.7版本之后支持索引。hive索引采用的不是'one size fites all'的索引实现方式，而是提供插入式接口，并且提供一个具体的索引实现作为参考。hive索引具有以下特点：1.索引key冗余存储，提供基于key

longshenlmj 0喜欢 / 0评论 2013-05-23

加载中...

0 关注 0 粉丝 0 动态

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号-5 京公网安备11010802014868号