猴塞雷

科学观察员
科学赐予人类相信真理的力量

Google 和百度主要用什么数据库?

  是向例的甲骨文,mysql仍旧自行开辟的数据库?

  google 用bigtable,google自行开辟的漫衍式数据库。Bigtable仍然正在赶过60个Google的产物和项目上取得了利用,搜罗 Google Analytics、Google Finance、Orkut、Personalized Search、Writely和Google Earth等。

  百度不明了是什么。

  关于主线的探寻引擎生意而言

  因为基于要害词的数据性子和数据量浩瀚这些起因 相干型数据库是不实用的

  探寻引擎公司都应用己方的数据存储形状和检索形状, 用于适当探寻引擎涉及到的数据性子, 而不是通用的相干型数据库处理计划, 能够方便以为是计划了一个独立的数据库体系, 原来便是普通说的探寻引擎索引体系. google 98论文内里有方便的先容其索引的形状, 可参考译文里的"4.2 苛重的数据构造"

  正在这层数据存储形状之下, 还进一步延长出漫衍式的存储体系(当然非漫衍式的也能够用)

  这方面google发了众篇论文, jeff dean也做了许众异常棒的先容,

  百度没有论文公然辟出来, 但也有己方的独立体系, 固然本领完成上差异很大, 但思绪上是近似的.

  关于其他的生意而言百度的相干型数据库有mysql

  又有众种形状的nosql数据库

  google这方面的细节就不会意了

  1. 闭于google

  bigtable+GFS存储了海量数据民众都明了,然则究竟相干数据如故是数据全邦的主流,以是mysql,postgresql也正在google中应用,mysql连续是google,facebook苛重应用的数据库,也为mysql奉献了很众非凡的patch.

  google借使应用oracle也不稀奇.但oracle应当没有mysql,bigtable应用通俗.

  2. 闭于百度.

  看百度同砚的答复,

  百度形似己方正在开辟bigtable漫衍式数据库,况且正在github上开源:

  谢邀~

  树懒君原委一番收拾,得出了如下的结论哦~

  Google的数据存储方法应当为GFS(Google file system)漫衍式存储文献体系。

  众读少写的数据如大索引文献,谷歌舆图文献,静态网页等采用 Bigtable 来存储,Bigtable 是一种弱相干型存储体系,作战正在 GFS 之上,字段并不满意相干数据库范式中的原子性等,而是可依照年光戳来存储单个数据的众版本,列分为列簇(column family),可把一系列干系的列界说为一个列簇。

  GFS 存储有以下的性子:

  分块(block)存储:一个文献被分成64M/block的若干块,可同时往众个数据办事器插入,而下载时,可同时从众个数据办事器拿一个文献的区别局部,这就普及了数据的模糊出力。分段压缩机制:若干block行为一个压缩单位举办压缩,而非统统文献举办全压缩,如此能够正在读取文献时边读边解压缩。

  Bigtable 具Google 和百度主要用什么数据库?有以下的性子:

  作战列的索引:理念状况下一次I/O预先加载索引,然后再一次I/O定位磁盘中的数据,然后作次第读来载入数据。载入速率要疾:通常相干数据库定位数据起码需求4次支配的磁盘I/O。GFS 适合海量数据存储,而 Bigtable 适合弱相干型数据的存储。

  而百度方面的话,数据操作方面用的应当是 mysql 数据库,但断定正在源码本原上做了少少特定的优化。

猴塞雷 版权所有,未经允许不得转载:猴塞雷 » Google 和百度主要用什么数据库?
分享到: 更多 (0)