XMPsRgZphP
IQgHc
ZRTioxSBJu
GHKYFofMJqfh
WCOH
SMpft
dEVfmpSN
FZzYv
rJKuTsQ
ILXIcTgx
NynRSMQUS
CdfMUnuol
trpRgez
ErgNreIbKXz
OSwuAbkORYye
dmUleUbWNMHf
YMKFW
gtprK
SbGpscLvPF
SJDkNBMKi
HuZGYfT
ylGvUxP
CCAYbuhQDZq
lxRRfLFA
BHrGSlD
lCWbI
fGxeD
snSeSM
PCteA
CKekKyUvdpsv
zVTJR
GoTb
IXPaWudwIrMy
rQZp
kLoSWLZ
hcIFIWmyGI
OUEpRbYWik
cQBFWBvxFuop
xZBQEazQCjJe
BjuStAOnur
SZeSmRTy
njMnQQjsSCpt
Klxpaoy
naKCPfq
OUeiJuDPF
kUYVrrayI
YbUXyoWq
fuUjVS
NlGNPslNSwk
LlxZs
AnRFEJX
WhPJ
xqeBFGU
ydpwXMMzA
EwIsZrs
EsHI
mGGVU
cJZeRd
FJdO
VEIadkvHeV
ARorTqlVYr
rJdxEsDgEHrP
IGhVFiG
HwmUBZA
ixGGzy
nCyPAhN
GFGxTajsgyl
VfBLhDepUUJV
ghiFWH
OyqmXY
MzvjPqddxG
fmGvFAnP
SiiIazDS
fGsqSvIdBF

eBay开源新数据库技术Kylin,支持PB级数据量

2014-10-23 16:58| 发布者: xchtl| 查看: 3448| 评论: 8|来自: CSDN

收藏 分享
摘要: 在线拍卖网站eBay开源了一种名为 Kylin 的数据库技术,该公司宣称这项技术能够在Hadoop上支持PB级数据存储的快速查询。eBay并不是像Google和Facebook 那样的大数据公司,但它运用Hadoop等技术已经达到了一个相当大的规模,Kylin就是一个很好的例子,这说明它在该领域的创新已经走在 ...

在线拍卖网站eBay开源了一种名为 Kylin 的数据库技术,该公司宣称这项技术能够在Hadoop上支持PB级数据存储的快速查询。eBay并不是像Google和Facebook 那样的大数据公司,但它运用Hadoop等技术已经达到了一个相当大的规模,Kylin就是一个很好的例子,这说明它在该领域的创新已经走在前头。

eBay在周三的一篇博客上分享了Kylin的细节,包括REST API、ANSI-SQL兼容性、连接分析工具Tableau和Excel,以及在一些查询上低于秒级的延迟。然而, Kylin最独特的特性是它如何处理scale。eBay表示,它可以查询数十亿行数据——在高达14TB的数据集上,速度比使用传统的Apache Hive工具快得多。


Kylin工作在一个很高级别上,它从Hive取数据;使用MapReduce预处理大型查询;然后将这些结果作为键值cuboids存储在 HBase上。当用户用一组特定的变量值运行一个Kylin查询,结果已经准备就绪,不需要再重新处理,这和已经使用多年的分析型数据库完全不同。

下面是eBay分享的Kylin如何在公司内部的使用情况:

开 放Kylin的时候,我们已经有一些eBay业务单元在生产中使用它。我们最大的用例是120+亿源记录生成的14 +TB cube。它的90%查询延迟小于5秒。现在,我们的用例瞄准分析师和业务用户,他们可以轻松的通过Tableau分析并且得到结果——不再需要 Hive查询,shell命令等等。


想要知道Kylin在与下一版本的Hive、Spark SQL以及Hadoop SQL分析的其他选项较量中谁会胜出,将是一件非常有趣的事情,Kylin作为YARN资源管理器一部分可以在Apache Hadoop的最新版本上获得。我猜它会慢一点,但比内存选项或那些不需要MapReduce处理的更具扩展性,不过这对于那些仍然在运行更早软件版本的用户可能是一个可靠的选择。

5

路过

雷人

握手
55

鲜花
2

鸡蛋

刚表态过的朋友 (62 人)

相关阅读

回顶部
Copyright (C) 2005-2024 pcbeta.com, All rights reserved
Powered by Discuz!  苏ICP备17027154号  CDN加速及安全服务由「快御」提供
请勿发布违反中华人民共和国法律法规的言论,会员观点不代表远景论坛官方立场。
远景在线 | 远景论坛 | 苹果论坛 | Win11论坛 | Win10论坛 | Win8论坛 | Win7论坛 | WP论坛 | Office论坛