程序有所改变。发帖如还有问题请报告
【征集】西西河的经济学，及清流措施，需要主动参与者，『稷下学宫』新认证方式，24年网站打算和努力目标

主题：【原创】闲话Google集群 [1] 引子 -- 邓侃

共:💬33 🌺147 新:

老大河待整

全看树展主题 · 分页首页上页下页末页

家园

【原创】闲话Google集群 [1] 引子

[1] 引子链接出处

[2] 存在的理由链接出处

[1] 引子

奥运会是一个快乐的大party，party快结束了，我们也该收收心，补补功课了。补什么功课呢？

7月份以来，新员工陆续上岗，领导指示，"塑造锐意进取，开拓创新的企业文化"。塑造企业文化的任务不太好办。组织学习七个好习惯之类的书籍，大家觉得有说教甚至洗脑的嫌疑。组织郊游，大家事后惦记着的，是下一次什么时候郊游，去哪里，但是很少有人想着如何改进工作。

最近几个月，公司的用户数量大涨，这是好事。但是欣喜之余，后台服务器的吞吐量和稳定性面临严峻考验。总部领导垂询，有没有办法强化后台服务器集群，力争趋近5个9的指标？所谓5个9，就是绝大多数（99.99999%）的时间内，服务器集群稳定工作。即便5个9的指标一时达不到，那么能达到2个9也比现状强。

和大家商量商量，干脆，把两个任务合而为一，读论文吧。

读论文的目的有二，1. 扩大视野，强化专业知识，2. 唤起大家对专业对工作的兴趣。

认识一位美女的妈妈。女儿如花，做妈妈的很得意，但是也有烦恼。漂亮女儿的学习不好，先学会计，觉得繁琐，后转学护士，又记不住大量的医学名词。于是让我找美女谈谈。美女说，"我对会计和护士没兴趣，没兴趣就读不好"。问，"哪你对什么事情感兴趣呢？" 答，"和人打交道的事情。"

我的看法，兴趣和投入是密切相关的。投入越大，相关知识和技能就越强。能力越强，就越有自信。越有自信，就越有兴趣。

想成为世界顶级选手，的确需要天赋。但是入门并不需要强调天赋，主要还是多花时间。但是正襟危坐，悬梁刺股，是不是好方法，值得商榷。美女的问题是，有没有办法把学习，变得像谈恋爱那样有趣？这的确是一个值得思考的问题。

和一位初三的小同学去外地旅游。路上问小同学三个问题，1. "平均而言，坐火车的旅客有钱，还是乘飞机的旅客有钱？" 2. "火车站里的小偷多，还是飞机场里的小偷多？" 3. "为什么多数小偷不去飞机场行窃，而是选择火车站？" 一路上你问我答，辩论热烈。

最后，小同学问，"我们讨论这些问题有什么意义？为什么不谈谈数理化?" 思辨的快乐，无所不在。小同学言下之意，如果能像辩论小偷的经济模式那样，辩论数理化问题，功课就不是负担而是快乐了。

刘翔退出比赛，网上热议。1. 比赛是娱乐还是提振国家尊严？2. 留得青山在不怕没柴烧，还是明知其不可为而为之，哪一个是真英雄？3. 国家集训式的计划体制，还是商业推动，哪一个体制更适合中国体育国情？有了辩论，大家就有兴趣，讨论也就更深入。

为什么讨论技术问题，很少出现热烈的辩论？不是问题本身无趣，而是进入壁垒比较高。要参与辩论，首先必须明白论战双方在讲什么。进入壁垒高，参与者就少。人数少了，自然就不热烈。

如何挑起技术辩论？或许横向比较是一个招儿。集群技术有几个学派？这些学派的差异在哪里？为什么Google不沿用现成的技术，而是另起炉灶？都说Google的集群做的好，是不是其它集群技术就没有前途？

有记者问李开复，Google的技术优势在哪里？开复答，1. PageRanking的排序算法，2. 超大规模集群。 Google的集群，2000年初的时候由一千多台服务器组成。到了2006年初，根据Google给Dell的订单推算，估计是40万到50万台服务器的规模。两年多过去了，目前Google的集群有多大？有论者猜测，估计已经超过1千万台机器了，这个猜测是否准确，待考。

PageRanking的算法相对比较容易跟风，但是想效仿Google的集群就不是那么容易了。Google的集群里到底藏了什么药？我们这个系列就谈谈这个问题。之所以是闲聊，1. 节奏和篇幅比较随意，2. 强调横向比较，背景解释比较多， 3. 掺杂个人观点（当然会明确标注），欢迎大家拍砖。

关键词(Tags): #Google，#集群，#互联网，#操作系统，#网络， 元宝推荐：铁手,老马丁,

本帖一共被 7 帖引用 (帖内工具实现)

复【原创】闲话Google集群 [1] 引子

家园

闲话Google集群 [2] 存在的理由

[1] 引子链接出处

[2] 存在的理由链接出处

[2] 存在的理由

早期的搜索引擎，基本原理是关键词匹配。

譬如用户输入关键词"奥运会"，搜索引擎的任务是查找与奥运会相关的网页。如果恰好有一篇网页，内容无他，"奥运会，奥运会，。。。"，连说100遍。早期的搜索引擎肯定把这个网页放在结果的首页，说不定还置顶，因为， 1. 网页内容中，"奥运会"这个关键词出现的频率非常高，2. 没有出现与奥运会不相干的内容。

早期搜索引擎的问题很明显，但是如何解决，却是仁者见仁智者见智。

1996年，刚刚入学Stanford计算机系的Larry Page和Sergey Brin哥俩儿觉得，提高搜索引擎的准确性，或许可以从网页与网页之间的相互链接入手。譬如，网页A中提到奥运会时，给了一个链接，指向网页甲，那么网页甲的内容很可能与奥运会相关。如果不仅网页A有这样的链接，而且网页B，C，D等等，都有类似的链接，那么网页甲的内容与奥运会相关的可能性就极高。

批评者说，这不是三人成虎吗？Larry心里也没谱，就跑去问他的导师，Terry Winograd。

导师外形很像爱因斯坦，想了一想，说，"先把Stanford校园网内所有网页收集下来，验证一下你们的想法。然后扩大到更大范围，再验证一下。如果验证的结果不错，就把全世界互联网的所有网页，统统收集下来，做一个搜索引擎，上线，让全世界的人用，让全世界的人都来验证你们的猜想。"

两年后，1998年，Google上线了，三人成虎的猜想被实践证明是行之有效的。

Terry导师大手一挥，"把全世界互联网的所有网页，统统收集下来"，可把Larry和Sergey哥俩儿忙坏了。互联网上有多少网页，统统收集下来，需要占用多少硬盘空间？Larry和Sergey当时是博士班一年级学生，囊中羞涩，买不起那么多设备，没办法，开始四处讨钱。

托了七大姑八大姨，拐弯抹角找到了一个大款，名叫Andy Bechtolsheim。此公早年在CMU拿了EE的硕士后，跑到Stanford读CS/EE博士。没来得及拿到博士学位，就伙同Scott McNealy和Vinod Khosla，下海开公司去了，这个公司就是大名鼎鼎的SUN Microsystems。 Scott McNealy任SUN的CEO长达20多年，而Andy Bechtolsheim功成身退，跳出SUN自己开了一个小公司，后来这个小公司卖给了Cisco。

坊间传说，Larry和Sergey拜访Andy的时候，Andy正在电话上。冗长的电话，Larry和Sergey两个小伙子血气方刚，哪里耐得住这份性子，抬腿告辞。因为是朋友介绍，Andy有点过不去，就追到门口。问，"二位上门，有何需求？"

Larry和Sergey铁青着脸，说，"也没什么大事，就是想找点钱，做一个大规模文件系统。"

Andy问，"多大规模呢？存储什么数据？"

Larry和Sergey，"打算把互联网上所有网页都下载，然后建一个搜索索引。"

Andy，"把互联网上所有网页统统下载？！需要多大空间？几个Giga不行吧，几个Tera也不行吧，几个Peta，几个Zetta？。。。嗯，我看几个Googol也许才能撑得住。知道Googol吗？就是10的100次方，就是一个1后面拖100个0！"

Larry和Sergey，"是的，我们的确就是打算处理海量数据。"

Andy，"你们打算怎么做？买个EMC？那玩意儿很贵的哟，我可没那么多钱让你们烧。"

Larry和Sergey，"我们打算自己动手，用一堆PC做一个分布式集群。"

Andy，"PC？死机了怎么办？干嘛不用工作站，干嘛不用NFS？"

Larry和Sergey，"工作站比PC贵太多，NFS的不是很切合我们的需要。。。"

Andy挤出一点笑容，"好吧，小伙子们，给朋友一个面子，而且年轻人探险也是值得鼓励的。给你们10万吧，省着点花啊！"

Andy掏出支票本，一边签名一边问，"你们的公司叫什么？"

Larry和Sergey面面相觑，那时候他们还没来得及给公司取名。"要不就叫Googol吧？"，"Googol不太好拼写，要不改一改，叫Google吧。" Google这个名字从此诞生。

。。。

以上是传说，但是有几点倒是有价值的。

1. 以Andy的身价，10万美元实在是九牛一毛。1998年10万美元的投资，到了2004年Google上市时，值多少钱？现在又增长到多少钱？不忍心计算，估计Andy后悔得肠子都青了。

2. 如果需要10个Tera byte，也就是1万个Giga的硬盘的空间，或许1个EMC服务器就够了。但是同样空间，却需要10个PC。从价钱看，10个PC大致是5千美元，而一个硬盘空间相似的EMC服务器要价1.5万美元左右。当硬盘空间的规模大幅度增长的时候，购买EMC高端设备的花费，将远远超过购买众多低端PC的成本。

3. 用廉价的PC，就必须想办法保障稳定性。换句话说，少数PC死机了，不能影响整个集群的正常工作。

4. 处理海量数据，内存和IO速度是生死劫。廉价的PC，内存有限，IO接口速度也有限。如何解决？

5. 应付海量数据的存储技术很多，EMC，NFS（Network File System），AFS（Andrew File System），RAID（Redundant Array of Inexpensive Disks），还有SAN（Storage Area Network）和NAS（Network Attached Storage）等等。Google的两位创始人，为什么不沿用现成的技术，而是选择了另辟蹊径，莫非自讨苦吃？

欲知答案，且听下回分解。

关键词(Tags): #操作系统，#互联网，#Google，#系统架构设计，

本帖一共被 2 帖引用 (帖内工具实现)

复闲话Google集群 [2] 存在的理由

家园

好看

复闲话Google集群 [2] 存在的理由

家园

等待下文

复【原创】闲话Google集群 [1] 引子

家园

先谢过，慢慢参加讨论中