文章_kbh_极客社区

kbh

https://i.ancii.com/kbh123/

kbh

kbh kbh123

文章

Hadoop-2.7.4编译安装

1.protobuf编译安装。3.编译安装hadoop

kbh 0喜欢 / 0评论 2017-10-15

Spark应用(app jar)发布到Hadoop集群的过程

记录了Spark，Hadoop集群的开启，关闭，以及Spark应用提交到Hadoop集群的过程，通过web端监控运行状态。10注意spark-examples-1.6.2-hadoop2.6.0.jar，需要根据你的版本来看自带的版本号。数值可能稍有不同。

kbh 0喜欢 / 0评论 2016-08-10

Spark在Hadoop集群上的配置(spark-1.1.0-bin-hadoop2.4)

运行Spark服务，需要在每个节点上部署Spark。可以先从主节点上将配置修改好，然后把Spark直接scp到其他目录。export SPARK_MASTER_IP=master以上是必要的几个配置，详细的配置说明，请参见官网的Document。修改con

kbh 0喜欢 / 0评论 2016-07-20

Hadoop简单API的Web应用开发

最近写了个Web程序来调用Hadoop的api，对Hadoop自带的管理方式进行了二次开发，加强了可操作性。现在简单的介绍下功能和方法。这个功能实现主要是利用了Hadoop的FileSystem类得到HDFS文件的对象，并利用此提供的方法对HDFS进行操作

kbh 0喜欢 / 0评论 2014-12-24

Hadoop2.2.0基于QJM的HA实践

日志分析集群已经搭建起来了，但是我总觉得NN没有采用HA是一个大大的隐忧，让我一直不敢把测试集群正式投入使用，总是担心把大批量的日志文件弄过来后，NN挂掉或者硬盘故障的话那就什么都白费工夫，遂决定要把NN的HA也搞起来。Hadoop2.2.0的NN的HA目

kbh 0喜欢 / 0评论 2014-05-03

Hadoop2.0 lzo压缩的安装和配置

lzo压缩格式有很快的压缩/解压速度和合理的压缩率，并且支持分块，所以lzo是目前在Hadoop中最流行的压缩格式。hadoop中的lzo不是自带的，如果要支持lzo，需要另外安装。本文介绍了在hadoop2.0上安装和配置lzo，同样也适用于hadoop

kbh 0喜欢 / 0评论 2014-05-01

Hadoop连载系列之五：Hadoop命令行详解

--------------------------------------------------------------------------------该hadoop子命令集执行的根目录是/home目录，本机上为/user/root. ------

kbh 0喜欢 / 0评论 2014-03-16

Cloudera Hadoop Maven编译安装步骤详细教程

6.编译hadoopmvn -f cloudera/maven-packaging/pom.xml package -DskipTests=true

kbh 0喜欢 / 0评论 2014-03-12

Eclipse配置Hadoop MapReduce开发环境

点中项目根右键->Properties->JavaPath->Libraries->Add External JARs. 我的MyEclipse6.5.1版本开始默认使用jre5.0版本，因hadoop-1.2.1需要jre 6.0

kbh 0喜欢 / 0评论 2014-02-12

Hadoop2.2 伪分布式配置

部署上，很简单，就是分成两部分：修改配置文件盒启动脚本。hadoop2.2的配置文件在/opt/hadoop-2.2.0/etc/hadoop文件夹下，具体配置文件修改如下：

kbh 0喜欢 / 0评论 2014-01-20

Ubuntu下 Hadoop 1.2.1 配置安装

本文一步一步详细记录了 Ubuntu 环境安装Hadoop 1.2.1 搭建单机模式以及伪分布式模式，希望对各位和我一样的菜鸟有所帮助，共同学习进步，欢迎交流。尝试2.1安装未遂，由于文件结构不太一样缺乏相关资料，也非做运维的，遂放弃改用成熟的hadoop

kbh 0喜欢 / 0评论 2013-11-16

深入Hadoop节点部署的策略

每个Hadoop集群都包括不止一个节点。这些节点可以按功能分成几个组，比如master组，worker组，client组等等。每个组里面的节点都有不同的资源要求，比如CPU，内存，存储。节点部署是在保证每个节点资源需求的前提下，按照一定策略将Hadoop集

kbh 0喜欢 / 0评论 2013-10-28

Hadoop 1.2.1编译Eclipse插件

主要是自己遇到了其他文章中都没出现的问题。废话不说了，现在就开始搭建。首先我是在Ubuntu的虚拟机下工作的，准备工作一定要做好。而这个版本又是ubuntu12利用apt-get install下载的默认版本，所以会造成很多问题。[javac] 注: 某些

kbh 0喜欢 / 0评论 2013-10-20

Hadoop debug 方法

做Hadoop开发，需要对hdfs，mapreduce组件等进行修改、测试，如果每次做修改后都打成jar包上传到服务器打log测试的话将非常麻烦和耗时的。所以如果能够通过eclipse进行远程调试将会非常方便与惬意的。hadoop远程调试十分简单，只需要自

kbh 0喜欢 / 0评论 2013-10-17

利用Hadoop MapReduce 做数据排序

我们的需求是想统计一个文件中用IK分词后每个词出现的次数，然后按照出现的次数降序排列。由于Hadoop在reduce之后就不能对结果做什么了，所以只能分为两个job完成，第一个job统计次数，第二个job对第一个job的结果排序。第一个job的就是hado

kbh 0喜欢 / 0评论 2013-10-12

Hadoop添加datanode或者tasktracker节点

其实openssh客户端应用程序包已经提供了专门的命令来处理这个操作。[xiaoyu@hadoop03 ~]$ ssh-copy-id -i .ssh/id_rsa.pub 192.168.88.171The authenticity of host '1

kbh 0喜欢 / 0评论 2013-09-14

原生态在Hadoop上运行Java程序

第一种：原生态运行jar包1，利用eclipse编写Map-Reduce方法，一般引入Hadoop-core-1.1.2.jar。这里Test.jar在本地，jar没必要上传到hdfs上参数依次为本地mapred程序，hdfs的测试数据即输入文件，输出文件

kbh 0喜欢 / 0评论 2013-09-04

树莓派Raspberry Pi搭建Hadoop集群

Hadoop是由Java实现的，所以在树莓派上运行就和在其他x86平台上运行一样简单。首先，我们需要安装支持树莓派Raspberry Pi的JVM。可以选用OpenJDK或者Oracle的JDK 8。我个人推荐JDK8，其速度稍微快些，但是OpenJDK

kbh 0喜欢 / 0评论 2013-07-15

Hadoop在Linux下伪分布式的安装以及wordcount实例的运行与

配置完毕后，在命令行中输入java -version，如出现下列信息说明java环境安装成功。java version "1.6.0_20"Java SE Runtime Environment Java HotSpot Server

kbh 0喜欢 / 0评论 2013-07-10

Hadoop Web项目使用Ajax监控Mapreduce过程

Hadoop Web项目的改进版，新增Ajax技术。Ajax主要是在浏览器中输入hdfs路径时的后台检查和在监控任务执行状态时使用Ajax去和后台交互，获取job信息。具体下载目录在 /2013年资料/6月/17日/Hadoop Web项目使用Ajax监控

kbh 0喜欢 / 0评论 2013-06-17

加载中...

kbh

0 关注 0 粉丝 0 动态