文章_xuplus_极客社区

xuplus

https://i.ancii.com/xuplus/

xuplus

xuplus xuplus

文章

大数据平台常见开源工具集锦，看看你都知道哪些

11月23日，多云时代开启企业业务新高度，安全如何与时俱进？大数据平台是对海量结构化、非结构化、半机构化数据进行采集、存储、计算、统计、分析处理的一系列技术平台。本文整理了大数据平台常见的一些开源工具，并且依据其主要功能进行分类，以便大数据学习者及应用者快

xuplus 0喜欢 / 0评论 2019-11-06

在hadoop的编程中输入输出参数路径的设定

在hadoop的编程中，如果你是手写MapReduce来处理一些数据，那么就避免不了输入输出参数路径的设定，hadoop里文件基类FileInputFormat提供了如下几种api来制定：如上图，里面有 addInputPath()，每次添加一个输入路

xuplus 0喜欢 / 0评论 2016-10-25

hadoop特点

Hadoop的优缺点介绍：（一）优点：（一）高可靠性。Hadoop按位存储和处理数据的能力值得人们信赖;（二）高扩展性。Hadoop是在可用的计算机集簇间分配数据并完成计算任务的，这些集簇可以方便地扩展到数以千计的节点中。Hadoop能够在节点之间动态地

xuplus 0喜欢 / 0评论 2016-09-19

Flume数据收集

copy hadoop-common-x.x.x.jar、commons-configuration-x.x.jar、hadoop-auth-x.x.x.jar、hadoop-hdfs-x.x.x.jar到flume/lib下，flume把数据写如到hdf

xuplus 0喜欢 / 0评论 2015-10-11

Hadoop NameNode单点问题解决方案之一 AvatarNode

HadoopNameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群，目前是运行版本为Hadoop0.20，transactionlogs写入一个共享的NFSfiler。经常遇到需要中

xuplus 0喜欢 / 0评论 2015-07-18

基于Eclipse的Hadoop应用开发环境配置

如果安装插件成功，打开Window-->Preferens，你会发现Hadoop Map/Reduce选项，在这个选项里你需要配置Hadoop installation directory。配置完成后退出。在Map/Reduce Locations中

xuplus 0喜欢 / 0评论 2015-04-22

重新编译Hadoop

3 执行 mvn package -Pdist,native -DskipTests -Dtar 进行编译

xuplus 0喜欢 / 0评论 2015-01-26

Hive基本语法使用

hive> create table studentROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' ESCAPED BY '\\' STORED AS TEXTFILE;hive> create t

xuplus 0喜欢 / 0评论 2014-12-17

Oozie运行Hadoop

1.解压oozie目录下的oozie-client-3.3.2.tar.gz、oozie-examples.tar.gz、oozie-sharelib-3.3.2.tar.gz

xuplus 0喜欢 / 0评论 2014-01-01

cloudera cdh中hadoop-client包的作用

hadoop-client是为了让开发者可以很方便的使用当前节点hadoop的jar包，ch4版本的hadoop将目录分为“/usr/lib/hadoop-hdfs”、“/usr/lib/hadoop-mapreduce”，“/usr/lib/hadoop

xuplus 0喜欢 / 0评论 2013-11-22

Hadoop 配置分享

-- 请使用IP，不要使用localhost -->. -- 使用你的自己定义路径 -->. -- 登录ubuntu的用户名和密码 -->

xuplus 0喜欢 / 0评论 2013-10-28

Hadoop和云计算的关系

Hadoop主要是由HDFS和MapReduce组成，HDFS是一个分布式文件系统，MapReduce则是用于并行处理大数据集的软件框架。因此，Hadoop是一个能够对大量数据进行分布式处理的软件框架，它是一种技术的实现。基于Hadoop,用户可编写处理海

xuplus 0喜欢 / 0评论 2013-08-09

大数据实践:探秘淘宝Hadoop集群

当下中国超大规模的单Master节点Hadoop集群在哪里？据悉，淘宝Hadoop集群拥有2860个节点，清一色基于英特尔处理器的x86服务器，其总存储容量50PB，实际使用容量超过40PB，日均作业数高达15万，为淘宝网的日常运营做出了关键支撑。近日，《

xuplus 0喜欢 / 0评论 2013-07-06

hadoop视频教程

Hadoop是什么，为什么要学习Hadoop?Hadoop实现了一个分布式文件系统，简称HDFS。Hadoop是一个能够对大量数据进行分布式处理的软件框架。但是Hadoop是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop是可靠的，因为它假设计算元素

xuplus 0喜欢 / 0评论 2013-02-16

hadoop与eclipse

2Unsupported major.minor version 51.0 -- 这个老手一看就知道是java version的错误，需要调整jdk版本，一般使用1.6的

xuplus 0喜欢 / 0评论 2012-10-17

bulkload出现了KeeperException问题

可是zookeeper的jar包是在$HADOOP_HOME/lib下，并且前天在调用bulk load命令的时候，是没有任何问题的。是环境变量的问题影响的，由于前两天一个同事在另一个用户下使用cloudera的安装程序安装了hadoop，将安装的hado

xuplus 0喜欢 / 0评论 2012-09-02

Hadoop:java.io.IOException: Tmp directory

bin/hadoop jar hadoop-examples-1.0.3.jar pi 10 100的时候，是没有问题的，然后我stop-all.sh，修改了一些配置文件，运行start-all.sh，然后再次运行上面的命令的时候，就出现了这样的情况，20

xuplus 0喜欢 / 0评论 2012-08-30

hadoop namenode配置以及问题处理

-- Put site-specific property overrides in thisfile. -->

xuplus 0喜欢 / 0评论 2012-08-25

Hadoop杂记

namenode+jobtracker可以放在一台机器上，datanode+tasktracker可以在一台机器上，辅助namenode要单独放一台机器，jobtracker通常情况下分区跟datanode一样，namenode存储目录需要格式化，data

xuplus 0喜欢 / 0评论 2012-07-31

[翻译]无敌Hadoop(MapR 版本)

这意味着，任何故障，无论是硬件，软件或用户错误不需要通过管理员操作。通常管理员可以访问的数据中心，并进行维护，现在是常规，而不是紧急情况。如购物车磁盘已满,管理员可以随时更换硬盘。在与客户的讨论，这是立即明确表示，他们是Hadoop的高可用性的各种描述相混

xuplus 0喜欢 / 0评论 2012-05-30

加载中...

xuplus

0 关注 0 粉丝 0 动态