文章_FIGHTANGEL_极客社区

FIGHTANGEL

https://i.ancii.com/fightangel/

FIGHTANGEL

FIGHTANGEL fightangel

文章

Router-Based HDFS Federation 在滴滴大数据的应用

HDFS 的 Master/Slave 架构，使得其具有单点瓶颈，即随着业务数据的大规模膨胀，Master 节点在元数据存储与提供服务上都会存在瓶颈。ViewFS 方案也存在一些问题：对于已经发布出去客户端升级比较困难；对于新增目录需要增加挂载配置，与产品

FIGHTANGEL 0喜欢 / 0评论 2019-11-19

HDFS fs命令

drwxr-xr-x - root supergroup 0 2015-05-19 11:08 /usr

FIGHTANGEL 0喜欢 / 0评论 2015-05-20

hadoop UnsupportedFileSystemException 问题

使用hdfs操作文件的时候遇到以下两个异常：。类似No FileSystem for scheme: hdfs 原因是jar包或打包问题。

FIGHTANGEL 0喜欢 / 0评论 2018-08-15

如何少走弯路入门Python人工智能（先学习好分布式存储HDFS）

既然 HDFS 是存取数据的分布式文件系统，那么对 HDFS 的操作，就是文件系统的基本操作，比如文件的创建、修改、删除、修改权限等，文件夹的创建、删除、重命名等。对 HDFS 的操作命令类似于 lLinux 的 shell 对文件的操作，如 ls、mk

FIGHTANGEL 0喜欢 / 0评论 2019-07-03

golang整洁之道（一）

设计工整的go项目配置文件问题背景项目经常会涉及到配置文件，而配置文件往往包含多方的配置信息，可能同时涉及到MySQL，kafka，hive，hdfs等等。不加思索的yaml配置文件最快，最直接的方案自然是如下示例，直接写yaml部分。用代码实现需求通常不

FIGHTANGEL 0喜欢 / 0评论 2019-07-01

hadoop UnsupportedFileSystemException 问题

使用hdfs操作文件的时候遇到以下两个异常：。类似No FileSystem for scheme: hdfs 原因是jar包或打包问题。解决方法如下：1.通过配置方式：。// 这个解决hdfs问题

FIGHTANGEL 0喜欢 / 0评论 2018-08-15

深入浅出Mesos（三）：持久化存储和容错

编者按】Mesos是Apache下的开源分布式资源管理框架，它被称为是分布式系统的内核。Mesos最初是由加州大学伯克利分校的AMPLab开发的，后在Twitter得到广泛使用。InfoQ接下来将会策划系列文章来为读者剖析Mesos。本文是整个系列的第一篇

FIGHTANGEL 0喜欢 / 0评论 2016-10-21

记一次HDFS Delegation Token失效问题（续）

在上篇讲到了，HDFS Delegation Token 问题的解决方法是 Spark-Submit 方式可以进行解决，经过了一段时间的反思和查看 Livy 和 Spark-Submit 两者日志之后，有了一点新发现，并且测试认证了，该方式是可行的，那么是

FIGHTANGEL 0喜欢 / 0评论 2019-06-30

Spark 实战入门

FIGHTANGEL 0喜欢 / 0评论 2016-02-22

hadoop hdfs fsimage和eidts

而在Hadoop2.X中，这个动作是由Standby NameNode来完成。

FIGHTANGEL 0喜欢 / 0评论 2016-01-09

HDFS架构[官网整理]

HDFS是一个分布式文件系统，可以运行在廉价的商用机器上。它与现有的其他分布式文件系统有很多相似之处，当然也有很多不同之处。HDFS具有较高的容错性，适用于存储较大集合的数据，并能够支撑较高的吞吐能力。HDFS放宽了一些POSIX要求，以能够流式的访问数据

FIGHTANGEL 0喜欢 / 0评论 2014-08-16

(转)HDFS中PathFilter类

在单个操作中处理一批文件，这是很常见的需求。比如说处理日志的MapReduce作业可能需要分析一个月内包含在大量目录中的日志文件。在一个表达式中使用通配符在匹配多个文件时比较方便的，无需列举每个文件和目录来指定输入。hadoop为执行通配提供了两个FIle

FIGHTANGEL 0喜欢 / 0评论 2014-07-18

Hadoop2.x HDFS shell命令

清空回收站，文件被删除时，它首先会移到临时目录.Trash/中，当超过延迟时间之后，文件才会被永久删除。Sets Access Control Lists of files and directories.

FIGHTANGEL 0喜欢 / 0评论 2014-06-18

hadoop在文件分片blocksize

hadoop在文件的split中使用到了一个变量是 blocksize，这个值默认配置是 64M ，1.0的代码给的默认值是32M ，这个值我们先不要纠缠他到底是多少，因为这个值是可配置的，而且已经给了默认配置64M ，只有我们不配置的时候

FIGHTANGEL 0喜欢 / 0评论 2013-08-27

[转发］hadoop 默认参数

配置hadoop，主要是配置core-site.xml,hdfs-site.xml,mapred-site.xml三个配置文件，默认下来，这些配置文件都是空的，所以很难知道这些配置文件有哪些配置可以生效，上网找的配置可能因为各个hadoop版本不同，导致无

FIGHTANGEL 0喜欢 / 0评论 2012-06-05

[转发]Apache Hadoop 0.21版本新功能ChangeNode

ApacheHadoop0.21.0在2010年8月23日release了。apache社区上一个release的版本还是0.20.0版本，还是在去年的四月份release的。所以这个版本中引入了许多新的功能，也有许多新的改进。根据tom哥的统计，在had

FIGHTANGEL 0喜欢 / 0评论 2012-05-27

bulk-load装载hdfs数据到hbase小结

hbase提供了现成的程序将hdfs上的文件导入hbase,即bulk-load方式。它包括两个步骤：。将会启动mapreduce程序在hdfs上生成t8这张表，它的rowkey分别为1357，对应的value为2468

FIGHTANGEL 0喜欢 / 0评论 2011-10-12

开源框架Hadoop实现分布式计算

本节和大家一起学习一下分布式计算开源框架Hadoop，本节主要内容有Hadoop概念的介绍和Hadoop相关计算方法，希望通过本节的学习，大家对Hadoop的分布式计算有一定的认识。Hadoop是Apache开源组织的一个分布式计算开源框架，在很多大型网站

FIGHTANGEL 0喜欢 / 0评论 2011-08-07

Hadoop NameNode单点问题解决方案之一 AvatarNode

HadoopNameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群，目前是运行版本为Hadoop0.20，transactionlogs写入一个共享的NFSfiler。经常遇到需要中

FIGHTANGEL 0喜欢 / 0评论 2011-03-29

跟上大数据的步伐：快速搭建Spark集群

Spark 是 UC Berkeley AMP lab 开源的类 Hadoop MapReduce 的通用的并行计算框架，Spark 基于 map reduce 算法实现的分布式计算，拥有 Hadoop MapReduce 所具有的优点，并且能更好地适用

FIGHTANGEL 0喜欢 / 0评论 2019-06-20

加载中...

FIGHTANGEL

0 关注 0 粉丝 0 动态