Druid(http://www.druid.io)作为一个开源的大数据OLAP分析引擎,得到了越来越多的关注 […]
分类存档:大数据
基于OpenStack, Docker和Spark打造SuperVessel大数据公有云
今年4月的Spark技术峰会上我做了《SuperVessel:基于OpenStack, Docker和Spar […]
给Vim配置Scala语法高亮显示
第一步,执行下面这个脚本: mkdir -p ~/.vim/{ftdetect,indent,syntax} […]
一步一步教你怎样给Apache Spark贡献代码
本文将教大家怎样用10个步骤完成给Apache Spark贡献代码这个任务:) 到 Apache Spark […]
大数据的价值密度
文 / 陈冠诚 注:原文刊载于《程序员》2014年第5期,略有删改。 在大数据和云计算如火如荼的今天,怎样将数 […]
Impala:新一代开源大数据分析引擎
原文发表在《程序员》杂志2013年第8期,略有删改。 文 / 耿益锋 陈冠诚 大数据处理是云计算中非常重要的 […]
Impala与Stinger对比
Tez和Impala现在竞争非常激烈,前者走的是基于DAG的精细化管理,后者是基于MPP的技术架构重头开始造了 […]