paulfrankzhang_极客社区_安科网

paulfrankzhang

https://i.ancii.com/paulfrankzhang/

动态

Ta还没有发布动态 ...

文章

Hadoop的HDFS和MapReduce

整个HDFS集群只有一个NameNode，它存储整个集群文件分别的元数据信息。这些信息以fsimage和editlog两个文件存储在本地磁盘，Client通过这些元数据信息可以找到相应的文件。此外，NameNode还负责监控DataNode的健康情况，一旦

paulfrankzhang 0喜欢 / 0评论 2014-08-16

HDFS的一致性分析

在分析HDFS的一致性之前, 我们先得解决HDFS客户端行为的几个问题。HDFS是根据Google的GFS论文所实现的, 初期时它的主要设计目标是为了存储MapReduce所操作的大型数据集。一般情况下, 各个reducer的结果将分别写入一个HDFS文件

paulfrankzhang 0喜欢 / 0评论 2014-01-28

通过脚本实现简单替换HDFS上的文件

有时需要替换HDFS上的文件，但Hadoop目前没提供相应的hadoop fs -mv命令，如是自己动手通过脚本实现，此脚本支持通配符，支持文件夹整个上传等：。/usr/bin/env bashprePath=$2args=$1func_putFile()

paulfrankzhang 0喜欢 / 0评论 2013-10-21

Hadoop如何修改HDFS文件存储块大小

可以在执行上传文件命令时，显示地指定存储的块大小。我这里查看HDFS上的TEST目录下的jdk-7u25-linux-x64.gz 文件存储块大小。

paulfrankzhang 0喜欢 / 0评论 2013-09-14

Hadoop0.22.0及其RAID部署

使用0.22.X系列版本的Hadoop快有一年时间了，主要集中在HDFS上。期间自己参与了部署Hadoop集群，也参与了分析HDFS的源码。这几天，由于项目需要，转移到了0.22.0版本了，需要重新部署Hadoop集群。这次部署要牵扯到mapreduce项

paulfrankzhang 0喜欢 / 0评论 2013-06-16

查看更多文章

0 关注 0 粉丝 0 动态

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号-5 京公网安备11010802014868号