文章_forjustice_极客社区

forjustice

https://i.ancii.com/jidong2622/

forjustice

forjustice jidong2622

文章

ubuntu下编译Hadoop

$ sudo apt-get install autoconf automake libtool zlib1g-dev pkg-config libssl-dev libsnappy-dev libbz2-dev. 注意 libssl-dev安装换成 li

forjustice 0喜欢 / 0评论 2019-11-19

Hadoop HA集群搭建

在hadoop2.0中通常由两个NameNode组成，一个处于active状态，另一个处于standby状态。Active NameNode对外提供服务，Standby NameNode不对外提供服务，仅同步active namenode的状态，以便能够在

forjustice 0喜欢 / 0评论 2019-11-04

动手写的第一个MapReduce程序--wordcount

之前运行过了hadoop官方自带的第一个例子wordcount,这次我们自己手写一个,这个相当于是编程语言中的helloworld一样.首先我们了解一下我们要写的MapReduce是处理的哪个部分,我们知道hadoop处理文件是先将要处理的文件拆分成很多个

forjustice 0喜欢 / 0评论 2019-09-16

HIve的安装

hive的使用依赖hadoop,所以先介绍hadoop。笔者是在Centos7.3上安装的hadoop,使用的是hadoop-3.2的版本。直接按照hadoop-2.9文档安装即可。hadoop的环境变量一定要设置，不然hive启动的时候会提示找不到had

forjustice 0喜欢 / 0评论 2019-09-08

hadoop配置与wordcount

hadoop配置与wordcount参考的博客大多都是hadoop2.x和低版本的java之上的，配置过程写出来看似很简单，看别人的博客也感觉步骤都差不多，但是自己配置时候出了很多问题：datanode启动不了，网页不能正常显示，datanode莫名死掉，

forjustice 0喜欢 / 0评论 2019-07-01

hadoop-2.6.0-cdh5.7.0源码编译支持压缩

准备：解压hadoop-2.6.0-cdh5.7.0.tar.gz源码包，看到里面有个BUILDING.txt文件，里面列出了编译所需依赖组件。Unix SystemJDK 1.7+Maven 3.0 or laterFindbugs 1.3.9 Prot

forjustice 0喜欢 / 0评论 2019-07-01

Hadoop小文件解决方案-基于NameNode内存和MapReduce性能解决方案

在第一篇文章中，我讨论了什么构成了一个小文件，以及为什么Hadoop存在小文件问题。我将一个小文件定义为小于Hadoop块大小75％的任何文件，并解释说由于NameNode内存使用和MapReduce性能，Hadoop更喜欢较少的较大文件。在这篇文章中，当

forjustice 0喜欢 / 0评论 2019-06-30

hadoop kerberos操作

User xxxx not found解决方案因为在hadoop集群中没有创建xxx用户

forjustice 0喜欢 / 0评论 2019-06-29

学习hadoop需要什么基础

学习hadoop需要什么基础“学习hadoop需要什么基础”这已经不是一个新鲜的话题了，随便上网搜索一下就能找出成百上千篇的文章在讲学习hadoop需要掌握的基础。再直接的一点的问题就是——学Hadoop难吗？用一句特别让人无语的话回答就是：难不会，会不难

forjustice 0喜欢 / 0评论 2019-06-28

超详细Dkhadoop虚拟机安装图文教程

超详细Dkhadoop虚拟机安装图文教程前两天看到有人留言问在什么情况下需要部署hadoop，我给的回答也很简单，就是在需要处理海量数据的时候才需要考虑部署hadoop。关于这个问题在很早之前的一篇分享文档也有说到这个问题，数据量少的完全发挥不了hadoo

forjustice 0喜欢 / 0评论 2019-06-28

HDFS

HDFS可能由成百上千的服务器所构成，每个服务器上存储着文件系统的部分数据。因此错误检测和快速、自动的恢复是HDFS最核心的架构目标。HDFS的设计中更多的考虑到了数据批处理，而不是用户交互处理。POSIX标准设置的很多硬性约束对HDFS应用系统不是必需的

forjustice 0喜欢 / 0评论 2019-06-28

搭建全分布式Hadoop

local_file: 本地文件名remote_user: 远程主机用户名, 用户名相同时可省略remote_ip: 远程主机ip, 不知道的话使用ifconfig命令查看即可/home/user_name: 你想传输文件到远程主机的地址其他配置找到上传文

forjustice 0喜欢 / 0评论 2019-06-26

hadoop入门操作

hadoop cluster搭建好之后，就可以执行一些简单的命令，来了解hadoop的使用。${HADOOP_HOME}/bin/hdfs dfsadmin -reporthdfs dfsadmin这个命令对于管理员还是很管用的，比如还有关于管全模式。最后

forjustice 0喜欢 / 0评论 2019-06-26

Spark安装部署

0x01 软件环境Spark 官方提供了三种集群部署方案： Standalone, Mesos, YARN。其中 Standalone 最为方便，本文主要讲述结合 YARN 的部署方案。0x02 安装scala2.1 下载Spark官方要求 Scala 版

forjustice 0喜欢 / 0评论 2019-06-25

Hadoop配置LDAP集成Kerberos

关于 Kerberos 的安装和 HDFS 配置 kerberos 认证，请参考 HDFS配置kerberos认证。参考使用yum安装CDH Hadoop集群安装 hadoop 集群，集群包括三个节点，每个节点的ip、主机名和部署的组件分配如下：。19

forjustice 0喜欢 / 0评论 2019-06-20

hadoop fs

1，hadoopfs–fs[local|<filesystemURI>]：声明hadoop使用的文件系统，如果不声明的话，使用当前配置文件配置的，按如下顺序查找：hadoopjar里的hadoop-default.xml->$HADOOP

forjustice 0喜欢 / 0评论 2016-01-08

查看hadoop目录下文件大小

tty:[14] jobs:[0] cwd:[~]

forjustice 0喜欢 / 0评论 2015-09-15

spark+hadoop+cenos6.5+VitualBox4.3.6整合开发(末)

spark0.8.1+shark0.8.1+hadoop2.2的整合，总体感觉是累。中间的章节由于时间问题还没整理处理，这里做些总体的评论。与传统hadoop结合方面，shark是一边倒在了CDH,cloudra給了钱也不能丢完节操啊。因为shark不支持

forjustice 0喜欢 / 0评论 2014-05-16

hadoop+zookeeper+hbase环境搭建的一些问题

host文件配置 /etc/hosts文件若没配置好,会引起一系列不见遇见的问题,有时候会在这些问题上面花费较多的时间.hadoop配置文件 core-site.xml 配置尽量手动配置这个选项，否则的话都默认存在了里系统的默认临时文件/tmp里。这用于记

forjustice 0喜欢 / 0评论 2013-07-23

这些数据科学家必备的技能，你拥有哪些？

88％的数据科学家受过高等教育且拥有硕士学位，其中46％拥有博士学位。完成学位课程后，大多数数据科学家还进行在线培训，例如学习如何使用Hadoop或大数据查询等特殊技能。CrowdFlower对3490个LinkedIn上数据科学工作者进行的一项研究发现A

forjustice 0喜欢 / 0评论 2019-03-26

加载中...

forjustice

0 关注 0 粉丝 0 动态