文章_shenghaomail_极客社区

shenghaomail

https://i.ancii.com/shenghaomail/

shenghaomail

shenghaomail shenghaomail

文章

Mac下Apache Spark 1.6+Hadoop 2.6 单机安装配置

输出- 0 com.openssh.sshd 表示启动成功。添加hadoop目录环境变量。<description>namenode上存储hdfs名字空间元数据 </description>. <description>

shenghaomail 0喜欢 / 0评论 2016-10-20

Spark 1.5、Hadoop 2.7 集群环境搭建

最近需要用到大数据的一些相关技术，于是实验了一下spark和Hadoop的集群环境搭建。实验包括三台虚拟机，linux-1、linux-2、linux-3，spark是一个master两个worker， hadoop是一个主NameNode、两个DataN

shenghaomail 0喜欢 / 0评论 2016-09-09

Hadoop中MR程序的几种提交运行模式

先把文件上传到linux目录，然后在该目录下使用指令将该jar分发到hadoop集群中并指定运行哪一个程序。hadoop jar wc.jar cn.intsmaze.hadoop.mr.WCRunner这个时候程序就执行了。* 假设你的这个业务方法在多个

shenghaomail 0喜欢 / 0评论 2016-06-26

集群安装完毕，该如何测试和使用集群-Hadoop单机（伪分布）

运行测试实例wordcount注意：1.注意wordcount大小写，这里都是小写 2.复制命令可能会出现命令不识别，尽量手写copyFromLocal: Unknown commandUsage: java FsShell [-ls &

shenghaomail 0喜欢 / 0评论 2016-06-12

Hadoop企业级集群架构 - Hadoop安装

Hadoop企业级集群架构 - Hadoop安装。其它3个datanoe节点：。下面关于Hadoop的文章您也可能喜欢，不妨看看：

shenghaomail 0喜欢 / 0评论 2015-11-16

Hadoop学习概述

Hadoop是由apache Software Foundation公司于2005年秋天作为Lucene的子项目Nutch的一部分正式引入的。它受到最先由google lab开发的mapreduce计算模型合google file system分布式文件系

shenghaomail 0喜欢 / 0评论 2015-03-20

Hadoop中HDFS读取和写入的工作原理

HDFS和HBase是Hadoop中两种主要的存储文件系统，两者适用的场景不同，HDFS适用于大文件存储，HBASE适用于大量小文件存储。本文主要讲解HDFS文件系统中客户端是如何从Hadoop集群中读取和写入数据的，也可以说是block策略。默认情况下，

shenghaomail 0喜欢 / 0评论 2015-02-02

基于计算机资源分析Hadoop的默认counter

由于项目中，需要统计每个业务组使用的计算机资源，如cpu，内存，io读写，网络流量。所以需要阅读源码查看Hadoop的默认counter。MapReduce Counter可以观察MapReduce job运行期的一些细节数据，Counter有"

shenghaomail 0喜欢 / 0评论 2014-08-17

Win7中使用Eclipse连接虚拟机中的Ubuntu中的Hadoop2.4

一早进入虚拟机启动Hadoop，发生异常，重新格式化一下恢复正常，原因待查。试试昨天制作的成果——eclipse插件，按照网上的例子进行配置，失败，现象就是无法连接到虚拟机中的Hadoop，于是试验了如下情况。查看虚拟机中的ip，输入ifconfig，得到

shenghaomail 0喜欢 / 0评论 2014-05-10

Hadoop、HBase配置Ganglia指南（metrics1）

/* You can specify as many udp_recv_channels as you like as well. */udp_recv_channel { port = 8649 bind = master.hadoop.test}

shenghaomail 0喜欢 / 0评论 2014-05-01

HDFS——如何列出目录下的所有文件

可以用bin/Hadoop fs -ls 来读取HDFS某一目录下的文件列表及属性信息。也可以采用HDFS的API来读取。

shenghaomail 0喜欢 / 0评论 2014-04-21

从主机名谈Hadoop集群管理

最近处理的数据越来越复杂，互联网上很火的Hadoop久闻盛名，想去学习一下。按照网上的例子配置了一番，老是出错误。但是正因为这个错误，才引发出对Hadoop集群管理的话题。先说一下我的实验环境。我准备了4台虚拟机：。当我对NameNode进行格式化后，执行

shenghaomail 0喜欢 / 0评论 2014-04-08

Hadoop2.2+Mahout0.9实战

首先说明下，如果使用官网提供的下载hadoop2.2.0以及mahout0.9进行调用mahout的相关算法会报错。这个是因为目前mahout只支持hadoop1 的缘故。主要就是修改pom文件，修改mahout的依赖。环境配置好了之后，需要添加mahou

shenghaomail 0喜欢 / 0评论 2014-04-09

Hadoop环境搭建之环境变量配置

刚刚接触Hadoop和Linux，以此来记录学习的过程和点滴。vim /etc/sudoers :编辑文件在 root ...下一行加入: xxx ALL= ALL

shenghaomail 0喜欢 / 0评论 2014-01-25

JSP访问Hadoop 图片存储服务

使用hadoop作为分布式文件系统，hadoop是一个实现了HDFS文件系统和MapReduce的开源项目，我们这里只是使用了它的hdfs.首先从web页面上上传的文件直接调用hadoop接口将图片文件存入hadoop系统中，hadoop可以设定备份数，这

shenghaomail 0喜欢 / 0评论 2014-01-03

Hadoop 2.2.0 Symlink的使用

Hadoop 2.2.0允许创建软连接并且允许MapReduce程序直接处理这些Symlink。为了允许在集群中创建symlink，需要在配置文件hdfs-site.xml中增加如下的配置项：。考虑到hadoop 1.0等的编码习惯，FileSystem的

shenghaomail 0喜欢 / 0评论 2013-12-05

CentOS6.4安装Hadoop2.2.0集群Pass总结

我的意思并不是说前面的Blog写的不好，我还是非常感谢作者的分享。我只是在其基础上，将其重要的需要注意的地方总结一下，方便大家，也方便自己以后查阅。（这纯属个人猜测，如有错误还请大侠指正。其实这个只是为了方面在后面的配置文件中使用计算机名代替IP地址而已

shenghaomail 0喜欢 / 0评论 2013-11-23

Hadoop配置自动化之一ssh自动化

测试环境：Ubuntu 12.04.2 server 64bit 、expect version 5.45、GNU bash, version 4.2.24-release . 这个应该涉及到很多方面的内容。那么应该可以按照下面的思路来做：ssh的自动化部

shenghaomail 0喜欢 / 0评论 2013-09-23

Hadoop Capacity Scheduler配置使用记录

以下标记为红色的部分大都是自己曾踩过坑的地方，希望能给大家带来帮助。举个例子，当minimum-user-limit-percent设置为25%时候，如果queue中有多余4个用户同时提交job，那么调度器保证每个用户占有的slots不超过queue中sl

shenghaomail 0喜欢 / 0评论 2013-09-15

Ubuntu 12.04安装Hadoop

在Ubuntu 12.04安装Hadoop过程详解。c．编辑/etc/sudoers文件，为hadoop用户添加权限sudo vim /etc/sudoers. hadoop ALL= ALL注意：/etc/sudoers文件可能为readonly文件，

shenghaomail 0喜欢 / 0评论 2013-08-01

加载中...

shenghaomail

0 关注 0 粉丝 0 动态