文章_大木行走_极客社区

大木行走

https://i.ancii.com/guoqiangxiong/

大木行走

大木行走 guoqiangxiong

文章

Hadoop集群下jps查看不到datanode信息的解决办法

在每次hdfs namenode -format之后，namenode的cluster id都会被自动更新，一般这种情况先去看datanode的logs日志，确定是cluster id不一致的问题了，这时候应该去到hdfs的tmp/dfs/current文

大木行走 0喜欢 / 0评论 2019-11-08

Hadoop的搭建和第一个Hadoop小项目：单词计数

我自己是在windows10上搭建的hadoop。单词计数应该是很多人入门Hadoop的第一个小项目。我自己看的参考资料是《MapReduce设计模式》。运作这个小例子是不需要启动Hadoop的。我自己的解决方案是在系统变量添加HADOOP_HOME，在系

大木行走 0喜欢 / 0评论 2019-11-05

hadoop2.4.1伪分布式搭建

回到windows --> 打开网络和共享中心 -> 更改适配器设置 -> 右键VMnet1 -> 属性 -> 双击IPv4 -> 设置windows的IP：192.168.1.100 子网掩码：255.255.255.

大木行走 0喜欢 / 0评论 2019-08-31

LINE案例研究：使用Fluentd从批处理到流日志处理

Terabyte级：Fluentd用作主要数据流处理器，每天处理数TB的数据。Fluentd充满活力和开放的社区是其在LINE上取得成功的关键。将Fluentd的可扩展性提升到一个新的水平：他们的一位工程师在Fluentd之上构建了一个无模式SQL流处理引

大木行走 0喜欢 / 0评论 2019-07-01

搭建hadoop分布式环境

Hadoop分布式安装说明。[hadoop@hadoop1 ~]$ ssh hadoop34.安装JDK[hadoop@hadoop1 ~]$ tar -zxvf jdk-8u161-linux-x64.tar.gz. [hadoop@hadoop1 ~]

大木行走 0喜欢 / 0评论 2019-06-30

hadoop需要哪些技术支持

hadoop是一个开源软件框架，可安装在一个商用机器集群中，使机器可彼此通信并协同工作，以高度分布式的方式共同存储和处理大量数据。Hadoop 还提供了软件基础架构，以一系列 map 和 reduce 任务的形式运行 MapReduce 作业。Map 任务

大木行走 0喜欢 / 0评论 2019-06-28

零基础学习hadoop开发先明白这层关系

零基础学习hadoop开发先明白这层关系大数据hadoop无疑是当前互联网领域受关注热度最高的词之一，大数据技术的应用正在潜移默化中对我们的生活和工作产生巨大的改变。这种改变给我们的感觉是“水到渠成”，更为让人惊叹的是大数据已经仅仅是互联网行业的风口了，更

大木行走 0喜欢 / 0评论 2019-06-28

实用贴:hadoop系统下载安装教程

我是下载的一个大快搜索的DKhadoop发行版，三个节点的标准版本，个人研究或者学习hadoop三节点完全够用。本篇分享hadoop的安装步骤依然是也DKhadoop为例。五月份的时候跟和大二、大三的几个学生聊hadoop的事情，他们吐槽点都集中在环境的搭

大木行走 0喜欢 / 0评论 2019-06-28

Hadoop HDFS原理分析

HadoopHadoop由两部分组成，分别是分布式文件系统和分布式计算框架MapReduce. fsimage：元数据镜像文件，里面记录了自最后一次检查点之前HDFS文件系统中所有目录和文件的序列化信息；随后，这些返回的DataNode会按照Hadoop集

大木行走 0喜欢 / 0评论 2019-06-27

2018年第25周-Hadoop的MR程序-天气数据分析

天气数据通过ftp从ftp.ncdc.noaa.gov地址获取/pub/data/noaa/目录下的天气数据，我写了个ftp抓取程序去抓取，如1950的天气数据摘录如下：

大木行走 0喜欢 / 0评论 2019-06-27

Hadoop（二）Hadoop的HelloWorld（单机模式下的安装和使用）

本文已同步至个人博客liaosi's blog-Hadoop（二）Hadoop的HelloWorld本文示例使用的VMWare虚拟机，Linux系统版本是CentOS 7_64位，Hadoop的版本是Hadoop 2.8.2，JDK版本是1.8，使用的账号

大木行走 0喜欢 / 0评论 2019-06-27

Docker创建的集群下使用ansible部署hadoop

Docker创建的集群下使用ansible部署hadoop基础环境MBP, Palallels Desktop, Centos7. 集群架构集群包含4台“虚拟主机”，采用Docker创建容器的方式创建，无需创建多台虚拟机，简单方便。[root@centos

大木行走 0喜欢 / 0评论 2019-06-21

（单机）CentOS 7_64位系统下搭建Hadoop_2.8.0分布式环境

准备条件：CentOS 7 64位操作系统 | 选择minimal版本即可，也可以选择带完整版Hadoop-2.8.0 | 本文采用的是Hadoop-2.8.0版本。JDK1.8 | 本文采用jdk-8u131-linux-x64.tar.gz版本。- 解

大木行走 0喜欢 / 0评论 2019-06-21

hadoop上下架datanode

hadoop中的hdfs文件系统，可以动态的增加、删除节点，增加比较容易，在新的节点上配置好hadoop的各种xml文件后，直接启动即可。为了平衡集群内各个datanode节点平衡，可以执行hdfs中的balancer命令，使用方式如下：。[-exclud

大木行走 0喜欢 / 0评论 2019-06-20

扣丁学堂大数据培训分享用好Hadoop的问答详解

Hadoop的使用相信只要是对此感兴趣的小伙伴们或多或少都会知道一些，那么具体知道多少就说不好了，就算是不知道的小伙伴也没有关系，下面是扣丁学堂大数据培训小编给大家整理的用好Hadoop的问答详解，希望对小伙伴们有帮助。首先，如果要从事大数据相关领域的话，

大木行走 0喜欢 / 0评论 2019-05-28

千锋扣丁学堂大数据培训之零基础学习大数据路线和方向

今天千锋扣丁学堂大数据培训老师给大家介绍一下关于零基础小白如何学习大数据路线和方向的详细解介绍，随着人们对大数据的认识越来越深入，很多零基础人员看到了大数据的未来，也想学习这个前沿技术，踏入时代的领军行业，其大数据本质是：数据挖掘深度和应用广度的结合。对海

大木行走 0喜欢 / 0评论 2019-05-27

大数据开发之用CombineFileInputFormat优化Hadoop小文件

HDFS设计是用来存储海量数据的，特别适合存储TB、PB量级别的数据。但是随着时间的推移，HDFS上可能会存在大量的小文件，这里说的小文件指的是文件大小远远小于一个HDFS块的大小;HDFS上存在大量的小文件至少会产生以下影响：。本文将介绍如何在MapRe

大木行走 0喜欢 / 0评论 2018-02-26

Ubuntu 16.04下将Hadoop2.7.3源代码导入到Eclipse Neon中

或许你一定找了很多博客都无果，那么不用担心，我和你一样，这也是这篇文章存在的意义，废话少说，进入正题。Installing required packages for clean install of Ubuntu 14.04 LTS Desktop:.

大木行走 0喜欢 / 0评论 2017-06-17

Hadoop之自定义输入数据

一，准备文件数据：

大木行走 0喜欢 / 0评论 2016-05-03

Hadoop-2.4.1学习之如何确定Mapper数量

MapReduce框架的优势是可以在集群中并行运行mapper和reducer任务，那如何确定mapper和reducer的数量呢，或者说Hadoop如何以编程的方式控制作业启动的mapper和reducer数量呢？从这样一句含糊不清的话无法得知究竟如何确

大木行走 0喜欢 / 0评论 2014-11-11

加载中...

大木行走

0 关注 0 粉丝 0 动态