文章_MrTitan_极客社区

MrTitan

https://i.ancii.com/mrtitan/

MrTitan

福州大数据 hadoop学习 hbase hive spark

文章

Hadoop异常 java.io.IOException: Job status not available

Job client请求job状态时，Application已经完成转而去Job history server请求job状态，就在这里抛出异常。

MrTitan 0喜欢 / 0评论 2016-11-23

CentOS 6.5上搭建Hadoop环境详解

本文详细记录在开发服务器CentOS 6.5上搭建Hadoop的详细过程。ssh连接免密码配置由于配置过程中需要频繁的进行ssh连接到开发服务器执行命令以及通过scp命令向服务器拷贝文件等依赖ssh连接的操作。由于我本机已经生成过公钥，所以我只需将已有的公

MrTitan 0喜欢 / 0评论 2016-08-23

Hadoop 入门教程

Hadoop 是一个大数据应用平台，提供了大数据存储和大数据操作的支持，本文先介绍了 Hadoop 相关知识，再介绍了 mac 下的 Hadoop 安装和配置使用，最后通过 streaming 使用 python 编写 mapreduce 任务。动

MrTitan 0喜欢 / 0评论 2016-05-06

Ubuntu 14.04下安装Hadoop2.4.0 （伪分布模式）

编辑器中打开此文件。在该文件的之间增加如下内容：。保存、关闭编辑窗口。你也可以在别的路径下创建上图的文件夹，名称也可以与上图不同，但是需要和hdfs-site.xml中的配置一致。只需要执行一次即可，如果在hadoop已经使用后再次执行，会清除掉hdfs上

MrTitan 0喜欢 / 0评论 2015-01-24

Hadoop启动，停止，与其中的守护进程的启动停止

start-all.sh 启动所有的Hadoop守护进程。包括NameNode、 Secondary NameNode、DataNode、JobTracker、 TaskTrack. stop-dfs.sh 停止Hadoop HDFS守护进程NameNod

MrTitan 0喜欢 / 0评论 2015-01-10

Ubuntu 14.04下Hadoop Eclipse 环境配置教程

学习Hadoop有两天了，配置Hadoop到环境也用了两天，将自己在Ubuntu 14.04下Hadoop Eclipse 环境配置过程写在这里，希望对大家有所帮助！

MrTitan 0喜欢 / 0评论 2014-06-23

Hadoop集群监控工具Ambari安装

Apache Ambari是对Hadoop进行监控、管理和生命周期管理的基于网页的开源项目。它也是一个为Hortonworks数据平台选择管理组建的项目。ambari可以使安装hadoop集群，管理hadoop集群服务，监控集群都很容易。目前ambari支

MrTitan 0喜欢 / 0评论 2014-06-15

Hadoop基础教程：Hadoop,HBase兼容版本汇总

Hbase的安装需要考虑Hadoop的版本，即兼容性。有不足的希望能指出。当然这是个取巧的办法了。

MrTitan 0喜欢 / 0评论 2014-05-31

Ubuntu上使用Hadoop 2.x + HDFS Federation

由于Namenode在内存中存储所有的元数据，因此单个Namenode所能存储的对象数目受到Namenode所在JVM的heap size的限制。heap能够存储20亿个对象，这20亿个对象支持4000个datanode，12PB的存储。随着数据的飞速增长

MrTitan 0喜欢 / 0评论 2014-04-12

Hadoop安装遇到的各种异常及解决办法

异常一:

MrTitan 0喜欢 / 0评论 2014-03-21

Hadoop连载系列之一：Hadoop集群搭建

Hadoop是Apache软件基金会旗下的一个开源分布式计算平台,支持密集型分布式应用并以Apache2.0许可协议发布。一个HDFS集群是由一个NameNode和若干个DataNode组成的。

MrTitan 0喜欢 / 0评论 2014-03-16

Hadoop部署小脚本分享

最近抛弃非ssh连接的Hadoop集群部署方式了，还是回到了用ssh key 验证的方式上了。这里面就有些麻烦，每台机器都要上传公钥。恰恰我又是个很懒的人，所以写几个小脚本完成，只要在一台机器上面就可以做公钥的分发了。ssh-keygen一般来说需要输入p

MrTitan 0喜欢 / 0评论 2014-03-08

Hadoop 2.2.0 Cluster Setup-Linux

Apache Hadoop2.2.0作为新一代hadoop版本，突破原来hadoop1.x的集群机器最多4000台的限制，并有效解决以前常遇到的OOM问题，其创新的计算框架YARN被称为hadoop的操作系统，不仅兼容原有的mapreduce计算模型而且还

MrTitan 0喜欢 / 0评论 2014-03-06

Ubuntu12.04 Hadoop单机搭建

一直都听别人说Hadoop,还是蛮神秘的，不过看介绍才知道这个是整分布式的。现在分布式，大数据都是挺火的，不得不让人去凑个热闹呀。准备工作,Hadoop是Apache的产品,你懂的,这个当然和Java相关了,所以你得有一个Java编译器才行,不管你是Ope

MrTitan 0喜欢 / 0评论 2014-03-01

oozie中运行mapreduce node-action时的常见异常解决方法

以前写的mapreduce是从main方法里进行驱动和运行的，在main方法里面设置了如下参数：。以上参数是设置输出格式。但在oozie中，直接配置的是map类，无法从main方法运行，所以必须指定输出格式，有如下两种方法：

MrTitan 0喜欢 / 0评论 2014-02-15

生产环境Hadoop大集群完全分布式模式安装

集群架构：3+ node，master node,slave node(hotel02,hotel03…[root@gc ~]# useradd -g hadoop grid --注意此处一定要指定分组，不然可能会不能建立互信

MrTitan 0喜欢 / 0评论 2014-02-12

Hadoop管理命令

dfsadmin是一个多任务的工具，我们可以使用它来获取HDFS的状态信息，以及在HDFS上执行的一系列管理操作。安全模式是NameNode的一种状态，在这种状态下，NameNode不接受对名字空间的更改（只读）；不复制或删除块。NameNode在启动时自

MrTitan 0喜欢 / 0评论 2014-01-18

Hadoop2.2.0完全分布式集群平台安装与设置

有了上面的前提条件之后，我们接下来就可以进行安装Hadoop分布式平台了。设置好后，需要让IP地址生效，运行下面命令：。、Fedora 19静态IP地址设置步骤如下：

MrTitan 0喜欢 / 0评论 2014-01-04

数据控使用Hadoop的三种常用方式

随着Hadoop技术的发展，从最初为Google、Facebook等公司解决大量数据的存储问题，到现在被越来越多企业用来处理大数据，Hadoop在企业数据领域影响深远。了解其常见的使用模式，可以极大地降低使用复杂性。就在几周前，Apache Hadoop

MrTitan 0喜欢 / 0评论 2013-12-30

在Mac OS X 64bit系统上编译Hadoop 2.2源码

因为Hadoop2在官网上预编译的包都是在32位下编译的，在64位系统上可能运行出问题，所以需要在64位系统上编译运行。$ mvn -version$ mvn clean$ mvn install -DskipTests$ mvn compile -Dsk

MrTitan 0喜欢 / 0评论 2013-12-08

加载中...

MrTitan

0 关注 0 粉丝 0 动态