文章_陈先森_极客社区

陈先森

https://i.ancii.com/garychenqin/

陈先森

Android/Hadoop

文章

Hadoop生态圈以及各组成部分的简介

适合大数据的分布式存储与计算平台。可以把Hadoop下的原始结构化数据变成Hive中的表。支持一种与SQL几乎完全相同的语言HiveQL。除了不支持更新、索引和事务，几乎SQL的其它特征都能支持。用于协调分布式系统上的各种服务。例如确认消息是否准确到达，防

陈先森 0喜欢 / 0评论 2016-11-20

启动Hadoop时遇到Name or service not knownstname 错误

今天在启动Hadoop时遇到Name or service not knownstname这样的错误。1 : Name or service not knownstname master 2 : Name or service not knownstnam

陈先森 0喜欢 / 0评论 2016-10-30

Hadoop User Experience（HUE）安装与HUE配置Hadoop

Hue程序被整合到一个类似桌面的环境，以web程序的形式发布，对于单独的用户来说不需要额外的安装。Hue官网无法下载，超时。使用CDH版本安装。我的系统是CentOS，安装CentOS依赖包；export PATH = $PATH:$MAVEN_HOME/

陈先森 0喜欢 / 0评论 2016-07-20

YARN加载本地库抛出Unable to load native-hadoop library解决办

用官方的Hadoop 2.1.0-beta安装后，每次hadoop命令进去都会抛出这样一个Warning. 果然是80386，是32位的系统版本，而我的hadoop环境是64位OS原来直接从apache镜像中下载的编译好的Hadoop版本native li

陈先森 0喜欢 / 0评论 2016-06-22

Hadoop2.5.2 HA高可靠性集群搭建(Hadoop+Zookeeper)

Hadoop中的NameNode好比是人的心脏，非常重要，绝对不可以停止工作。如果该NameNode数据丢失或者不能工作，那么整个集群就不能恢复了。这是hadoop1中的单点问题，也是hadoop1不可靠的表现。如下图所示，便是hadoop1.0的架构图；

陈先森 0喜欢 / 0评论 2016-03-04

分布式Hadoop1.2.1集群的安装

安装其实很简单，把下载下来的Hadoop文件拷贝到相应的目录下，然后接压缩即可，关键是先要安装好JDK,前期的Linux要配置好。

陈先森 0喜欢 / 0评论 2014-05-13

Ambari与Hadoop的配置、管理和监控项目入门

Ambari is 100% open source and included in HDP, greatly simplifying installation and initial configuration of Hadoop clusters. I

陈先森 0喜欢 / 0评论 2014-05-10

Hadoop 2.2.0集群安装

在安装hadoop前需要安装ssh，配置各节点间的基于密钥的免密码登录，安装jdk1.7并配置JAVA_HOME，关于这些操作请参考其他文档，本文不做赘述，只给出/etc/profile中关于JAVA_HOME和HADOOP_HOME的配置参考：。对第三项

陈先森 0喜欢 / 0评论 2014-04-29

Hadoop 使用 MapReduce 排序思路

本文主要讲对key的排序，主要利用Hadoop的机制进行排序。partition作用是将map的结果分发到多个Reduce上。当然多个reduce才能体现分布式的优势。由于每个partition内部是有序的，所以只要保证各partition间有序，即可保证

陈先森 0喜欢 / 0评论 2014-03-24

mahout-0.7-cdh4.5.0安装

由此可见，安装mahout的服务器必须先安装hadoop。

陈先森 0喜欢 / 0评论 2014-03-21

Hadoop伪分布式的安装

Hadoop伪分布式一般用于学习和测试.生产环境一般不使用.在windows系统上安装linux系统,以CenOS为例.hadoop版本是hadoop1.1.2. 对linux指令不熟悉的同学最好使用图形化界面来改(建议). 在第九行,去掉注释,配置JAV

陈先森 0喜欢 / 0评论 2014-03-20

在Hadoop2.3下运行WordCount程序

看到如下状态表示一切正常Datanodes available: 1 . examples/file2.txt 内容如下：pmpbox okpmpbox v1.0pmpbox onlineI think pmpbox will help you!也可把结果

陈先森 0喜欢 / 0评论 2014-03-14

Hadoop作业引用第三方jar文件

在eclipse中写mapreduce程序, 引用第三方jar文件, 可以利用eclipse Hadoop插件直接run on hadoop提交, 很方便. 不过插件版本要和eclipse匹配, 不然总是local执行, 在50070是没有job产生的.一

陈先森 0喜欢 / 0评论 2014-02-05

基于arm架构单片机的Hadoop服务器尝试

之前听说了百度用arm服务器搭建了webserver和网盘之类的东西，然后又看到有人用Android电视棒里面装Ubuntu，于是就有了用arm尝试做Hadoop服务器的想法。但是目前arm 64位的cpu还没有出货，所以这只是个前奏性质的尝试。从淘宝上面

陈先森 0喜欢 / 0评论 2013-12-23

Hadoop2.2 单机测试程序WordCount

Hadoop wordcount程序是经典的hadoop入门测试程序，主要根据给出一堆文件file1、file2...，统计出file1、file2...中单词出现的次数。我们在单机上测试运行这个程序，我的测试系统是Mac OS。3 配置环境变量：vi /

陈先森 0喜欢 / 0评论 2013-11-30

Hadoop2.2.0单节点安装及测试

一：环境准备：基于Windows下的VMware Player4.0.3中的Ubuntu12.04-64server.下载免费的VMware Player并安装好; 下载免费的Ubuntu 12.04 server版并在VMware中安装好；二：基础安装

陈先森 0喜欢 / 0评论 2013-10-25

应该在什么时候使用Hadoop

有人问我，“你在大数据和Hadoop方面有多少经验？”我告诉他们，我一直在使用Hadoop，但是我处理的数据集很少有大于几个TB的。他们又问我，“你能使用Hadoop做简单的分组和统计吗？”他们递给我一个包含600MB数据的闪盘，看起来这些数据并非样本数据

陈先森 0喜欢 / 0评论 2013-09-28

Hadoop虚拟化的性能对比和调优经验

·Hadoop和其他消耗不同类型资源的应用一起部署共享数据中心可以提高总体资源利用率；·灵活的虚拟机操作使得用户可以动态的根据数据中心资源创建、扩展自己的Hadoop集群，也可以缩小当前集群、释放资源支持其他应用如果需要；试验结果在图2中显示，虚拟化Had

陈先森 0喜欢 / 0评论 2013-09-18

基于Ubuntu 12.04+Hadoop1.2.0 的Hadoop集群搭建

首先准备5台电脑。我这里使用的是OpenStack虚拟出来的五台电脑。每个实例安装的系统是Ubuntu 12.04.2 LTS，虚拟配置如下：。然后使用vi/etc/hosts修改各个主机的/etc/hosts中的内容，将上边的内容编缉进去。需要使用roo

陈先森 0喜欢 / 0评论 2013-07-18

用Hadoop AVRO进行大量小文件的处理

An ordered collection of objects. All objects in a particular array must have the same schema.An unordered collection of key-val

陈先森 0喜欢 / 0评论 2013-06-19

加载中...

陈先森

0 关注 0 粉丝 0 动态