文章_NA_极客社区

NA

https://i.ancii.com/rj08zhou/

NA

NA rj08zhou

文章

64位CentOS下Hadoop2.2.0集群安装

三台64位CentOS，安装在VMware虚拟机下。使用chkconfig --list来查看是否装有vsftpd服务；本人安装一个虚拟机，然后通过虚拟机-》管理-》克隆完成其他两台机器的安装，现在存在的一个问题就是主机名是一样的，这个明显不是自己想要的

NA 0喜欢 / 0评论 2014-06-04

使用Ambari快速部署Hadoop大数据环境

NA 0喜欢 / 0评论 2014-05-10

Hadoop环境的搭建过程中的问题（伪分布）

Hadoop搭建流程网上有很多，以下是我在搭建Hadoop伪分布式环境是遇到的一些比较菜鸟的问题。为了保险，还是决定重新配置java环境，使用SUN jdk。再次检查hadoop-env.sh中的配置。根据网友提示，可能是由于运行hadoop的用户对/da

NA 0喜欢 / 0评论 2014-04-18

Hadoop平台上Oozie调度系统的安装配置

OOZIE是Hadoop平台上的开源调度工具，在项目中使用OOZIE将近一年时间了，OOZIE的安装配置还是挺复杂的。为了使用起来方便顺手，需要进行很多配置。下面整理了一下OOZIE安装配置的步骤，供使用Hadoop和OOZIE的童鞋们参考，也方便自己查看

NA 0喜欢 / 0评论 2014-04-18

Hadoop基本操作命令大全

查看hdfs中/user/admin/aaron目录下的文件。distcp <srcurl> <desturl> copy file or directories recursively. archive -archiveName

NA 0喜欢 / 0评论 2014-03-28

Hadoop面试45个题目及答案

在单机模式中不会存在守护进程，所有东西都运行在一个JVM上。这里同样没有DFS，使用的是本地文件系统。单机模式适用于开发过程中运行MapReduce程序，这也是最少使用的一个模式。不是，两个事物，同时Pseudo只针对Hadoop。是的，在UNIX用例下，

NA 0喜欢 / 0评论 2014-02-28

使用expect命令实现远程管理集群和一键安装Hadoop集群

expect命令通过预测远程终端将要显示的提示字符串，自动输入密码或其他用户指定的字符串，实现自动化安装。有关expect命令的使用方法请见：。有关实现Hadoop集群一键安装的步骤，首先写好需要分发到集群每台机器上运行的脚本，然后保证你的管理结点已安装t

NA 0喜欢 / 0评论 2014-02-06

Hadoop local模式部署（单节点）

装个Hadoop单节点的，为得是方便学习和调试。在终端窗口里面输入: sudo -s.然后输入普通用户登陆的密码，回车即可进入 root用户权限模式。增加 greeter-show-manual-login=true allow-guest=false .

NA 0喜欢 / 0评论 2014-02-03

一个Hadoop难以查找的错误

NA 0喜欢 / 0评论 2014-01-28

Linux中单机配置Hadoop

因为Ubuntu里面默认安装了OpenJDK,可以先将其卸载。并使用命令：chmod a+x jdk-6u37-linux-i586.bin将此文件权限设置为可执行类型。表示完成了java环境的安装。如果只使用export命令则支队当前shell起作用。可

NA 0喜欢 / 0评论 2014-01-25

Hadoop配置中找到集群jobtracker的ip,访问50030

公司集群，配置的Hadoop。执行job，想去看看运行状态，却不知道jobtracker的机器ip：。其中，mapred.job.tracker是JobTracker的主机和端口。这个别名，真恶心，我查了/etc/hosts，查了/etc/hadoop/c

NA 0喜欢 / 0评论 2013-12-16

Hadoop JobTracker提交job源码浅析

下面来看一下JobTracker.main()方法。剩下的内容就不说了。后面就什么了，现在可以回到main方法了

NA 0喜欢 / 0评论 2013-12-08

Hadoop Pig 安装

Hadoop Pig 安装。相关阅读：

NA 0喜欢 / 0评论 2013-12-03

Hadoop虚拟化扩展(HVE)之资源扩展技术

在虚拟化的云环境中，Hadoop可以有更好的“弹性”，这是云计算的一个重要优势，例如亚马逊的EMR服务, 用户可以迅速的在云中根据需求部署一个Hadoop集群，运行计算任务，并且用户可以向集群动态的添加或删除计算节点。有了这个技术，多个应用之间就可以共享资

NA 0喜欢 / 0评论 2013-11-06

深入Hadoop磁盘部署的算法

在一个Hadoop集群中有不同类型的节点，它们对磁盘的要求是不同的。主节点侧重于存储的可靠性，数据节点就需要更好的读写性能，以及较大的容量。在虚拟集群中，存储可以分为本地和共享两种类型。本地存储只能被其所在的主机上的虚拟机访问，而共享存储则可以被其他主机上

NA 0喜欢 / 0评论 2013-10-28

Hadoop skip mode 代码要点

但是这里没有给出代码例子，我尝试过几次都不能正常工作。经过一番排查，终于确定了可以正常工作的代码模式。public class PwdSorter extends Configured implements Tool {. 如果这两个语句的顺序颠倒的话，s

NA 0喜欢 / 0评论 2013-08-11

Spark，一种快速数据分析替代方案

Spark 是在 Scala 语言中实现的，并且利用了该语言，为数据处理提供了独一无二的环境。了解 Spark 的集群计算方法以及它与 Hadoop 的不同之处。

NA 0喜欢 / 0评论 2013-08-11

Hadoop环境配置过程中可能遇到问题的解决方案

Failed to set setXIncludeAware for parser遇到此问题一般是jar包冲突的问题。一种情况是我们向java的lib目录添加我们自己的jar包导致Hadoop引用jar包的冲突。解决方案就是删除我们自己向系统添加的jar包

NA 0喜欢 / 0评论 2013-07-25

Ubuntu 12.04 LTS 下Hadoop 伪分布式搭建

怎么在Ubuntu 12.04 LTS 下搭建伪分布式的Hadoop不是一个问题，问题是配好了让这玩意启动真是头疼了。这种情况多数是由于配置文件没有找到导致的。HADOOP_CONF_DIR是hadoop的配置文件存放的地方，如果你没有额外制定，则脚本中的

NA 0喜欢 / 0评论 2013-07-19

Hadoop框架排序和分组的理解

MapReduce框架会确保每一个Reducer的输入都是按Key进行排序的。Spill过程中，Map仍可以向缓存写入结果，如果缓存已经写满，那么Map进行等待。因此，一个Map task有可能会产生多个spill文件，当Map写出最后一个输出时，会将所有

NA 0喜欢 / 0评论 2013-05-29

加载中...

NA

0 关注 0 粉丝 0 动态