Category: Storm/Hadoop

Hadoop Hive UDF 开发

152 views    comments Comments (0)

Hive UDF 开发 Hive进行UDF开发十分简单,此处所说UDF为Temporary的function, […]

大数据流式处理框架:Storm、Spark、Samza

180 views    comments Comments (0)

摘要:许多分布式计算系统都可以实时或接近实时地处理大数据流,本文将对Storm、Spark和Samza等三种A […]

讨厌Hadoop的12件事

158 views    comments Comments (4)

Hadoop是一个很神奇的创造,但它发展过快而表现出一些瑕疵。我爱大象,大象也爱我。不过这世上没什么是完美的, […]

从Apache Storm学到的经验教训

166 views    comments Comments (5)

摘要:Storm是一个免费、开源的分布式实时计算系统。从Storm的由来到第一个版本的诞生,从离开Twitte […]

Hadoop 常见的45个问题解答

151 views    comments Comments (0)

摘要:时至今日,Hadoop已成为最流行的离线数据处理平台,然而它的集群配置起来并不简单。如果你学习Hadoo […]

一句话介绍Hadoop家族产品

187 views    comments Comments (2)

Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, H […]

浅谈Hive vs. HBase

185 views    comments Comments (1)

摘要:对于刚接触大数据的用户来说,要想区分Hive与HBase是有一定难度的。本文将尝试从其各自的定义、特点、 […]

腾讯:Hadoop大规模集群实践

187 views    comments Comments (1)

摘要:TDW是腾讯最大的离线数据处理平台。本文主要从需求、挑战、方案和未来计划等方面,介绍了TDW在建设单个大 […]

hadoop:常见的45个问题解答

164 views    comments Comments (0)

摘要:时至今日,Hadoop已成为最流行的离线数据处理平台,然而它的集群配置起来并不简单。如果你学习Hadoo […]

Hadoop:13个让大象飞起来的开源工具

190 views    comments Comments (0)

摘要:借助Google的三大论文,Hadoop打开了低成本海量数据处理之门;同时,借助了开源运动,Hadoop […]

Storm 入门(5)—— 事务一致性

207 views    comments Comments (0)

5 一致性事务 Storm是一个分布式的流处理系统,利用anchor和ack机制保证所有tuple都被成功处理 […]

Storm 入门(4)—— 消息处理

199 views    comments Comments (0)

4.1 简介 storm可以确保spout发送出来的每个消息都会被完整的处理。本章将会描述storm体系是如何 […]

Storm 入门(3)—— ZooKeeper目录结构

189 views    comments Comments (0)

Twitter Storm的所有的状态信息都是保存在Zookeeper里面,nimbus通过在zookeepe […]

Storm 入门(2)—— 构建Topology

111 views    comments Comments (0)

2.1 Storm基本概念 在运行一个Storm任务之前,需要了解一些概念: Topologies Strea […]

Storm 入门(1)—— 简介

107 views    comments Comments (0)

1.1   实时流计算 互联网从诞生的第一时间起,对世界的最大的改变就是让信息能够实时交互 […]

回顶部