文章_Aleks_极客社区

Aleks

https://i.ancii.com/wu5151/

Aleks

专注于开发分布式任务调度框架、分布式同步RPC、异步MQ消息队列、分布式日志检索框架、hadoop、spark、scala等技术如果我的写的文章能对您有帮助，请您能给点捐助,请看首页置顶...

文章

_服役新节点，退役旧节点，多目录配置。+_HDFS2.x的新特性

datanode会主动Namenode请求。这样服役新的节点就做完了。添加到白名单的主机节点，都允许访问NameNode，不在白名单的主机节点，都会被退出。在NameNode的/opt/module/hadoop-2.7.2/etc/hadoop目录下创建

Aleks 0喜欢 / 0评论 2020-08-19

Hadoop权威指南第四版高清PDF下载

大数据越来越热。Hadoop技术是大数据技术的基础。掌握了大数据技术，就意味着可以轻松找到高薪工作。人工智能、机器学习都是基于大数据。There are new chapters covering YARN , Parquet , Flume, Crunc

Aleks 0喜欢 / 0评论 2020-06-13

hive 数据hadoop数据etl交换

先将本地数据上传到hadoop,在将hadoop 数据导入hive数据仓库：hive> use toys ;

Aleks 0喜欢 / 0评论 2020-05-28

hadoop 简单安装部署

hadoop第一课：虚拟机搭建和安装hadoop及启动。hadoop第二课：hdfs集群集中管理和hadoop文件操作。hadoop第四课：Yarn和Map/Reduce配置启动和原理讲解。hadoop第五课：java开发Map/Reduce

Aleks 0喜欢 / 0评论 2020-04-26

hadoop_rpc简介

指的是java进程，即一个java进程调用另一个java进程中对象的方法。将服务端实例myBiz 服务端地址端口交给RPC管理监听，客户端调用服务端对应方法时，会通过RPC

Aleks 0喜欢 / 0评论 2014-11-26

hadoop1 常用端口和配置文件说明

关于hadoop 常用端口和配置文件详细信息，请参考如下链接：

Aleks 0喜欢 / 0评论 2014-11-17

大数据平台演进之路 | 淘宝 & 滴滴 & 美团

By 大数据技术与架构场景描述：希望本文对那些正在建设大数据平台的同学们有所启发。大数据平台是为了计算，现今社会所产生的越来越大的数据量，以存储、运算、展现作为目的的平台。大数据技术是指从各种各样类型的数据中，快速获得有价值信息的能力。Kafka的数据会被

Aleks 0喜欢 / 0评论 2019-09-13

hive的介绍

首先我们要知道hive到底是做什么的。下面这几段文字很好的描述了hive的特性：。　　1.hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供完整的sql查询功能，可以将sql语句转换为MapReduce任务进行运

Aleks 0喜欢 / 0评论 2017-01-20

Hadoop--两个简单的MapReduce程序

学习Hadoop编程，以前看过《Hadoop权威指南》这本书，但是看完了HDFS这一章之后，后面的内容就难以再看懂了，说实话，之前一直对MapReduce程序敬而远之，毫不理解这种类型的程序的执行过程。这一周花了些时间看了Hadoop的实战，现在能够看懂简

Aleks 0喜欢 / 0评论 2016-11-24

hadoop和hbase默认的情况下，会把pid文件存储

有时候，我们对运行几天或者几个月的hadoop或者hbase集群做停止操作，会发现，停止命令不管用了，为什么呢？

Aleks 0喜欢 / 0评论 2016-01-21

pig是什么

Pig为复杂的海量数据并行计算提供了一个简易的操作和编程接口，这一点和FaceBook开源的Hive一样简洁，清晰，易上手！2，Pig用来干什么？2）构建和更新search index。3）处理半结构化数据订阅服务。提取出自己想要的部分，在eclipse

Aleks 0喜欢 / 0评论 2016-01-12

pig小技术点

以散仙来看，解决办法其实也不太难在Flume写入HDFS的过程中，可以把flume汇总收集的缓冲时间给延长一点，或者把写入大小的阈值给调大，理想情况下，一个小时的数据，最好只压缩成一个大的文件包。

Aleks 0喜欢 / 0评论 2016-01-12

MapReduce案例之数据排序

对输入文件中数据进行排序。要求在输出中每行有两个间隔的数字，其中，第一个代表原始数据在原始数据集中的位次，第二个代表原始数据。"数据排序"是许多实际任务执行时要完成的第一项工作，比如学生成绩评比、数据建立索引等。这个实例和数据去重类似，

Aleks 0喜欢 / 0评论 2015-05-01

MapReduce优化

相信每个程序员在编程时都会问自己两个问题“我如何完成这个任务”，以及“怎么能让程序运行得更快”。同样，MapReduce计算模型的多次优化也是为了更好地解答这两个问题。MapReduce计算模型的优化涉及了方方面面的内容，但是主要集中在两个方面：一是计算性

Aleks 0喜欢 / 0评论 2014-11-18

centos6.5 安装 hadoop 0.23.11 伪分布搭建

虚拟机是VMware10.0+centos6.5，配置难度不算高，我是修改的libexec/hadoop-config.sh,在最上面加上JAVA_HOME=/usr/java/jdk8. 有成功的朋友可以分享下，可能就是指hadoop-config.sh

Aleks 0喜欢 / 0评论 2014-10-10

【转】Hadoop集群配置详解

通常，集群里的一台机器被指定为NameNode，另一台不同的机器被指定为JobTracker。余下的机器即作为DataNode也作为TaskTracker。ssh必须安装并且保证sshd一直运行，以便用Hadoop 脚本管理远端Hadoop守护进程。这个安

Aleks 0喜欢 / 0评论 2013-04-17

Hadoop相关部署二：Hive安装部署

将Hive的安装路径添加到path环境变量中。在/etc/profile文件中添加上述代码，source使之生效。hive.aux.jars.path设置运行hive时需要额外加载的一些相关的包，如果不设置的话，在执行insert或者跟mapreduce、

Aleks 0喜欢 / 0评论 2013-01-29

个人Hadoop 错误列表

错误等原因而失败。当失败次数达到一定阈值时，会通知。的输出多次失败后，错误2：Task attempt failed to report status for 622 seconds. Killing. According to the Hadoop be

Aleks 0喜欢 / 0评论 2012-05-23

Hadoop MapReduce Job性能调优——修改Map和Reduce个数

map task的数量即mapred.map.tasks的参数值，用户不能直接设置这个参数。Input Split的大小，决定了一个Job拥有多少个map。默认input split的大小是64M。然而，如果输入的数据量巨大，那么默认的64M的block会

Aleks 0喜欢 / 0评论 2012-05-20

Hadoop之HBase快速入门

本文解决单机运行HBase的故障问题。读者可以快速领略HBase的基本Shell命令。

Aleks 0喜欢 / 0评论 2012-04-21

加载中...

Aleks

0 关注 0 粉丝 0 动态