互联网巨头如谷歌和亚马逊的IT运行操作,远远超过大多数企业连做梦较大,但他们的经验教训,从管理那些堆积如山的系 […]
互联网巨头如谷歌和亚马逊的IT运行操作,远远超过大多数企业连做梦较大,但他们的经验教训,从管理那些堆积如山的系统学习能在行业利益他人。
在几个会议在最近几周,来自谷歌和亚马逊的工程师透露了一些他们用来以最小的行政头疼扩展其系统的秘密。
在华盛顿举行的USENIX LISA(大型安装系统管理)发布会上,谷歌的网站可靠性工程师托德·安德伍德强调公司的必要性,可能是??令人惊讶之一:节俭。
“很多东西谷歌确实是关于是超级便宜,”他告诉观众的系统管理员。
谷歌被迫疯狂地控制成本,因为它已经了解到,“任何有需求的扩展是一个灾难,如果你不便宜吧。”
作为一个服务变得更加普及,其成本必须在一个“子线性”增长的方式,他说。
“增加一个亿的用户,你真的要增加不到1000量子任何费用你所负担的,”安德伍德说。开支的“量子”可能是别人的时间,计算资源,或电源。
这种想法是落后于谷歌的努力不从,如思科或瞻博网络公司购买现成的,现成的路由设备。更具成本效益,以建立自己的,安德伍德说,谷歌会需要这么多的端口,它是。
他驳斥了这一观点,即挑战谷歌的面孔是唯一的一家公司它的大小。首先,谷歌是由许多小的服务,如Gmail和谷歌。
“所有谷歌的规模是不是谷歌处理的最里面的应用程序开发人员,他们经营的这些东西都是可以理解的每一个你和每个人,”他告诉听众。
另一种技术谷歌采用的是自动化一切可能。“我们正在做太多的机器'对他们的工作,”他说。
理想情况下,一个组织应该摆脱其系统管理的完全,而只是建立和创新上的其他人提供的现有服务,安德伍德说,尽管他承认这是不可行呢。
安德伍德,谁拥有天赋的戏剧性,说:“我认为系统管理是结束了,我认为我们应该停止这样做很大部分是有必要很长一段时间是一个坏主意,但我认为它已经成为一个拐杖。 “
谷歌最大的竞争对手不是冰或苹果或Facebook。相反,它本身就是,他说。该公司的工程师们致力于使自己的产品尽可能可靠,但是这不是他们的唯一任务。如果产品太可靠 – 这是说,超越5个9的可靠性(99.999%) – 那么该服务会在公司眼中的“浪费钱”。
“关键是没有达到100%的可用性问题的关键是实现目标的可用性 – 99.999% – 而移动一样快,你可以??,如果你大量超出你是在浪费钱,门槛,”安德伍德说。
“机会成本是我们最大的竞争对手,”他说。
接下来的一周在亚马逊网络服务(AWS)重:发明在拉斯维加斯,詹姆斯·汉密尔顿,AWS的副总裁和杰出的工程师会议上,讨论的技巧亚马逊使用规模。