文章_matengzz_极客社区

matengzz

https://i.ancii.com/matengzz/

matengzz

matengzz matengzz

文章

HDFS的运行原理

HDFSHadoop分布式文件系统。是根据google发表的论文翻版的。论文为GFSGoogle 文件系统。①保存多个副本，且提供容错机制，副本丢失或宕机自动恢复。②运行在廉价的机器上。③适合大数据的处理。HDFS默认会将文件分割成block，64M为1个

matengzz 0喜欢 / 0评论 2016-03-15

spark查看历史任务的信息

3、启动 start-history-server.sh 命令4、然后就可以看到历史任务的详细信息

matengzz 0喜欢 / 0评论 2015-05-18

hdfs-site.xml参数详解

namenode的http访问页面中针对每个文件的内容显示大小，通常无需设置。NN所使用的元数据保存，一般建议在nfs上保留一份，作为1.0的HA方案使用，也可以在一台服务器的多块硬盘上使用。设置hdfs超级权限的组，默认是supergroup，启动had

matengzz 0喜欢 / 0评论 2015-04-10

HDFS详解

HDFS简介HDFS的基本概念1.1、数据块HDFS默认的最基本的存储单位是64M的数据块。和普通文件系统相同的是，HDFS中的文件是被分成64M一块的数据块存储的。不同于普通文件系统的是，HDFS中，如果一个文件小于一个数据块的大小，并不占用整个数据块存

matengzz 0喜欢 / 0评论 2015-02-03

将hdfs文件保存到hbase中

0.0 wlan.dat文件内容: 1363157985066 13726230503 00-FD-07-A4-72-B8:CMCC 120.196.100.82 i02.c.aliimg.com 24 27 2481 24681 200

matengzz 0喜欢 / 0评论 2014-12-24

大数据系列2：建立开发环境编写HDFS和Map Reduce程序

将hadoop-eclipse-plugin-1.2.1.jar 复制到eclipse/plugins目录下，重启eclipse。Window-> Open Perspective -> Other 选择Map/Reduce，图标是个蓝色的象。

matengzz 0喜欢 / 0评论 2013-10-02

本地文件上传至hdfs文件系统

将本地文件存储到Hadoop中的hdfs中去,uploadPath问本地文件的路径,hdfsFileName为存入hdfs中的文件名,FileStatus[] inputFiles = local.listStatus;//得到本地文件列表。FSDataO

matengzz 0喜欢 / 0评论 2013-03-09

读书笔记2：Hadoop组件-（1）HDFS的文件操作

//FileStatus存储文件和目录的元数据,listStatus获取dir目录下的文件列表

matengzz 0喜欢 / 0评论 2013-01-09

Hadoop HDFS 编程

HDFS是一个分布式文件系统，然而对于程序员来说，HDFS就是一个普通文件系统，Hadoop进行的底层封装，程序员按照相应的API来对HDFS上的文件操作，和对本地磁盘文件操作没有太多区别。但是最初接触时可能还是会碰到这样那样的问题。

matengzz 0喜欢 / 0评论 2012-12-18

hadoop中的balancer

对于HDFS集群，经常长时间的运行，尤其是大量的delete操作后，集群中各个Datanode上的空间使用率可能会存在比较大的差异。所以需要一种机制使各个Datanode保持平衡，防止少数Datanode存储过多的文件。少数使用率过高的Datanode会导

matengzz 0喜欢 / 0评论 2012-06-11

使用Fuse挂载HDFS

1.3.ant compile-c++-libhdfs -Dlibhdfs=1 -Dcompile.c++=1. ln -s c++/Linux-$OS_ARCH-$OS_BIT/lib build/libhdfs. 启动hadoop集群后，

matengzz 0喜欢 / 0评论 2011-09-13

Hadoop in Action简单笔记（一）

map和reduce之间按照key进行group，hadoop负责处理、只需要写map和reduce程序。单点，但SNN可以作为master的备用。JobTracker：分配提供的job成为多个task，监控各个task，检测各个task的心跳，重启动失败

matengzz 0喜欢 / 0评论 2011-08-09

HDFS知识点总结

学习完Hadoop权威指南有一段时间了，现在再回顾和总结一下HDFS的知识点。HDFS不适合用在：要求低时间延迟数据访问的应用，存储大量的小文件，多用户写入，任意修改文件。HDFS数据块：HDFS上的文件被划分为块大小的多个分块，作为独立的存储单元，称为数

matengzz 0喜欢 / 0评论 2017-08-21

HBase伪分布式安装(HDFS)+ZooKeeper安装+HBase数据操作+HBase架

HBase1.2.2伪分布式安装+ZooKeeper-3.4.8安装配置+HBase表和数据操作+HBase的架构体系+单例安装,记录了在Ubuntu下对HBase1.2.2的实践操作,HBase的安装到数据库表的操作.包含内容1.HBase单例安装2.H

matengzz 0喜欢 / 0评论 2016-08-09

Hadoop中HDFS写入文件的原理剖析

要为即将到来的大数据时代最准备不是，下面的大白话简单记录了Hadoop中HDFS在存储文件时都做了哪些个事情，位将来集群问题的排查提供一些参考依据。输出流控制一个DFSoutPutstream，负责处理数据节点和名称节点之间的通信。这就是hadoop的容错

matengzz 0喜欢 / 0评论 2015-02-18

Hadoop的分块与分片

HDFS存储系统中，引入了文件系统的分块概念，块是存储的最小单位，HDFS定义其大小为64MB。与单磁盘文件系统相似，存储在HDFS上的文件均存储为多个块，不同的是，如果某文件大小没有到达64MB，该文件也不会占据整个块空间。在分布式的HDFS集群上，Ha

matengzz 0喜欢 / 0评论 2013-10-17

Hadoop 文件系统shell命令

调用文件系统Shell命令应使用 bin/Hadoop fs <args>的形式。所有的的FS shell命令使用URI路径作为参数。对HDFS文件系统，scheme是hdfs，对本地文件系统，scheme是file。其中scheme和auth

matengzz 0喜欢 / 0评论 2013-07-16

Hadoop文件系统介绍

提起Hadoop文件系统，首先想到的是HDFS，HDFS是Hadoop主要的文件系统，Hadoop还集成了其他文件系统。下面将逐个介绍。3 HFTP，这是在HTTP上提供对于HSFS分布式文件系统进行制度访问的一个文件系统，注意该文件系统与FTP没有关系，

matengzz 0喜欢 / 0评论 2013-04-05

Hadoop FS Shell命令大全

调用文件系统Shell命令应使用 bin/Hadoop fs <args>的形式。所有的的FS shell命令使用URI路径作为参数。对HDFS文件系统，scheme是hdfs，对本地文件系统，scheme是file。其中scheme和auth

matengzz 0喜欢 / 0评论 2013-03-02

Hadoop集群（第8期）_HDFS初探之旅

matengzz 0喜欢 / 0评论 2012-12-23

加载中...

matengzz

0 关注 0 粉丝 0 动态