文章_ittaojingzhan_极客社区_安科网

ittaojingzhan

https://i.ancii.com/ittaojingzhan/

文章

hadoop Mapreduce运行原理与常用数据压缩格式(一)

运行进度与状态更新1、MapReduce是一个较长运行时间的批处理过程，可以是一小时、几小时甚至几天，那么Job的运行状态监控就非常重要。

ittaojingzhan 0喜欢 / 0评论 2016-06-14

hadoop作业调优参数整理及原理

当map task开始运算，并产生中间数据时，其产生的中间结果并非直接就简单的写入磁盘。这中间的过程比较复杂，并且利用到了内存buffer来进行已经产生的部分结果的缓存，并在内存buffer中进行一些预排序来优化整个map的性能。当map的产生数据非常大时

ittaojingzhan 0喜欢 / 0评论 2011-04-15

Hadoop之block学习笔记

当写入一个文件到 HDFS 时，它被切分成数据块，块大小是由配置文件 hdfs-default.xml 中的参数 dfs.blocksize 控制的。每个块存储在一个或者多个节点，这是由同一文件中的配置 dfs.replication 控制。块的每一个 c

ittaojingzhan 0喜欢 / 0评论 2016-07-24

单机基于Docker搭建Hadoop2.7.1 Spark1.7 高可用集群

分别下载 spark1.7 hadoop2.7.1 scala1.1 zookeeper3.4.6 jdk1.8 解压后放置本地文件夹用于挂载到容器中

ittaojingzhan 0喜欢 / 0评论 2016-01-21

获取Hadoop的源码和通过Eclipse关联Hadoop的源码

首先通过官网下载hadoop-2.5.2-src.tar.gz的软件包，下载好之后解压发现出现了一些错误，无法解压缩，因此有部分源码我们无法解压，因此在这里我讲述一下如何通过maven来获取完整的源码：。通过命令行进入hadoop-2.4.0-src\

ittaojingzhan 0喜欢 / 0评论 2015-05-19

CentOS 6.5下使用Ambari安装Hadoop集群

安装过程中一定要保持网络畅通！输入网址ambari：8080，这里ambari是lz的主机名，各位改成自己的即可。进入登录界面，默认用户名和密码均为admin，可以在系统里进行修改，安装ambari的过程中也有提示。若选择1.3.3版本，则必须用jdk6，

ittaojingzhan 0喜欢 / 0评论 2014-12-24

Maven编译hadoop-2.2.0-src

<dependency> <groupId>org.mortbay.jetty</groupId> <artifactId>jetty-util</artifactId> <

ittaojingzhan 0喜欢 / 0评论 2014-11-03

Hbase的入门配置教程(0.20.6)

所以要先了解清楚是否搭配再进行部署，不然就白费工夫了。这里使用的是0.20.2的hadoop跟0.20.6的Hbase，hadoop的配置在我以前的博文里有，有需要配置hadoop的朋友先看了那篇文章再进行Hbase的配置吧。具体命令：tar -zxvf

ittaojingzhan 0喜欢 / 0评论 2012-07-18

加载中...

0 关注 0 粉丝 0 动态

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号-5 京公网安备11010802014868号