服务器之家:专注于服务器技术及软件下载分享
分类导航

服务器资讯|IT/互联网|云计算|区块链|软件资讯|操作系统|手机数码|百科知识|免费资源|头条新闻|

服务器之家 - 新闻资讯 - 云计算 - 37Signals CTO:十年上云之旅画句号,彻底下云后,半年省千万

37Signals CTO:十年上云之旅画句号,彻底下云后,半年省千万

2024-01-03 12:00未知服务器之家 云计算

在上云风行十余年后,由于成本、隐私、安全及业务需求变化,一股“下云”之风逐渐兴起。 前段时间X平台通过优化云服务使用并迁移更多工作负载至本地基础设施,月度云成本降低60%,每年节省达6000万美元,引起业内轩然大波


37Signals CTO:十年上云之旅画句号,彻底下云后,半年省千万




在上云风行十余年后,由于成本、隐私、安全及业务需求变化,一股“下云”之风逐渐兴起。

前段时间X平台通过优化云服务使用并迁移更多工作负载至本地基础设施,月度云成本降低60%,每年节省达6000万美元,引起业内轩然大波。

无独有偶,作为“下云”理念的坚定追随者David Heinemeier Hansson(DHH),即 Ruby on Rails 的创作者,早前在博客上宣布其公司 37Signals 成功实施下云策略甚至预计未来五年内将节省高达700万美元而受到热议。近期,针对网友们在社交媒体上频繁提出的14个问题,DHH 进行了集中的回应和解答。

云成本太高,决定下云

让我们先回顾下 37Signals 的下云历程。2022年10月19日,DHH 宣布公司将把核心产品 Basecamp 和 HEY 正式实施“下云”策略。Basecamp 是一个全球范围内广泛使用的 Web 端项目管理平台,云上历程已有十年之久。HEY 作为全功能的电子邮件服务,自推出以来一直依赖于云服务。但 37Signals 发现,长期租用计算资源并不是一个成本效益高的选择。因此,37Signals 决定回归本地基础设施,

DHH 在今年2月表示,预计在“下云”后,公司未来五年将节省约700万美元的服务器费用,同时无需改变现有的运维团队规模。为了证实这一预测,他进行了一系列的成本分析。

2022年我们在云上花费了320万美元。其中将近100万美元用于在 S3 中存储 8PB 的文件,并在多个区域之间完全复制。剩余的230万美元则用于支持其他所有服务:应用服务器、缓存服务器、数据库服务器、搜索服务器等。

我们计划在2023年将云成本削减至零,并考虑在2024年从 S3 中退出 8PB。

经过深思熟虑,我们决定花费60万美元购买硬件。在云计算时代,60万美元的硬件投资听起来可能很多。但如果保守按照五年期来摊销计算,每年仅需12万美元!

当然,这只是硬件成本的一部分,还必须考虑连接到电源和带宽的费用。目前,我们通过 Deft 在两个数据中心之间每月租用八个专用机架,花费约为6万美元。我们故意超额配置了空间,实际上可以将所有新服务器放置在现有机架中,而无需额外的空间或电源。因此,总支出仍保持在每年72万美元左右。

综合来看,每年的总支出为84万美元。与云计算的230万美元相比,我们将拥有更快速的硬件、更多的核心、成本较低的 NVMe 存储,以及低成本的扩展空间(只要服务器能放入每个数据中心的四个机架中)。

粗略估计,这将使我们每年节省150万美元。在此期间,预留50万美元用于应对不可预见的费用,五年内总共节省700万美元。

今年6月,DHH 宣布,经过六个月的努力,最后一个应用已成功迁回到本地硬件。下云已完成!

37Signals CTO:十年上云之旅画句号,彻底下云后,半年省千万

半年下云省千万,DHH 下云答疑

37Signals 的下云引起了广泛关注。“数百万人通过 LinkedIn、X 平台和邮件列表阅读了我们的更新。我收到了数千条评论,大家纷纷要求进一步的信息披露,提供反馈意见,并对我们这种反其道而行之的大胆举措表示惊讶。当其他公司正忙于上云时,我们已经成功实现了下云的壮举。面对种种质疑和惊异,我们用实际成果作出了回应:不仅快速、高效地完成了下云,而且客户受到的影响几乎为零。截至九月,我们的云账单已经节省了100万美元,并且这一数字还在持续降低。”DHH如此说道。

37Signals CTO:十年上云之旅画句号,彻底下云后,半年省千万

下云工作的完成,对于 37Signals 来说无疑是一大胜利。2022年该公司的云服务费用高达320万美元,往年的费用更是这一数字的两倍,这意味着37Signals 下云仅半年时间就节省了近千万的费用!然而,围绕下云这一决策的疑问仍然层出不穷。为了节省时间,避免重复解答相同的问题,DHH 编写了一份详尽的“常见问题解答”(FAQ)。以下是FAQ的内容:

1、你节省下来的硬件费用会不会被更大的团队工资所吞噬?

没有,因为我们在云退出后并没有改变团队的组成。那些在云端操作 HEY、Basecamp 和其他应用程序的人,现在正在我们自己的硬件上操作这些应用。

这是云营销的核心欺骗,声称一切都将变得如此简单,你几乎不需要任何人来操作它。但我从来没真正见过这种情况,无论是 37signals 还是其他运行大型互联网应用程序的公司。云计算有一些优势,但它通常不在于减少运营人员数量。

2、你为什么不直接优化你的云账单呢?

我们曾详细列出2022年的云服务费用320万美元,这甚至是经过高度优化、每月严格审查、大幅讨价还价后的价格,而曾经的云服务费用是这的两倍之多。我们几乎已经榨干了柠檬中的每一滴汁液,而且这是一项需要不断重复的工作。

这就是为什么我如此看好中型及以上软件公司下云的原因之一。对于拥有与我们相同数量的客户的业务来说,每个月花费我们之前开支的2倍、3倍甚至4倍,这是非常容易的。下云对大多数公司来说意味着可以节省更多的成本。

3、但是如果你写了一个云原生应用程序呢?

云原生经常被吹捧为利用云的真正方式,但这只是更多的云营销废话。它通常围绕着一种错误的信念,即无服务器功能和相关的按需工具将使成本更低。但如果你需要一磅糖,你买独立包装的小方糖是省不了钱的。

4、安全方面呢?你不担心被黑吗?

在互联网上运行软件所面临的大多数安全问题来自应用程序及其直接依赖项。无论你是拥有运行该应用程序的计算机还是从云提供商那里租用,正确保护定制应用程序所需的工作都没有任何实质性的不同。

如果有什么区别的话,那就是在云端运营服务可能会给人们一种虚假的安全感。认为这不是他们需要担心的事情,但其实是需要担心的。

但是,现代容器化应用程序交付的最大优点是,你不再需要花费大量时间手动修补机器。它的大部分都打包在 Dockerfiles 中,无论你是在云上租用机器还是在自己的机器上运行,部署运行在最近更新的 Ubuntu 上的新版本的应用程序都是一样的。

5、你不需要一个世界级的超级工程师团队来做这件事吗?

我从不回避夸赞 37signals 优秀员工的机会,因为我为我们在这里组建的团队感到自豪。但是,如果声称他们有一些特殊的神奇见解,可以让他们操作我们自己的硬件,那就太狂妄了。互联网在1995年开始出现。云作为默认选择可能直到2015年才出现。所以二十多年来,公司一直在操作硬件来运行他们的应用程序。这并不是一些随着时代的流逝而消失的古老知识。我们可能不知道金字塔是如何建造的,但我们仍然知道如何将 Linux 机器连接到互联网。

此外,运行自己的硬件所需的90%的专业知识与在云上运行所需的专业知识相同。至少一旦你达到我们的规模,拥有数百万用户和每月数十万美元的账单是这样的。

6、这是否意味着你们正在建设自己的数据中心?

除了超大规模企业和谷歌、微软、Meta 等少数大型公司之外,没有人在建设自己的数据中心。几乎所有人都只是在专业数据中心运营商(如 Equinix )那里租几个机柜、一个房间或一层楼。

因此,拥有自己的硬件并不意味着要担心安全、电力输送、消防系统或任何其他细节,这些设施可能需要花费数亿美元建造。

7、但是堆叠服务器以及拉网线怎么办?谁来做?

我们使用的是一家名为 Deft 的数据中心服务提供商。像他们这样的公司还有很多。你付钱给他们,让他们把你买来的服务器拆箱,直接送到数据中心,然后他们把服务器堆叠、上架,你就能看到IP地址上线了。就像云一样,即使它不是即时的。

我们的运营团队基本上从未涉足我们的数据中心。他们在世界各地远程工作。现在的操作体验更像云计算,而不是互联网早期,当时每个人都自己布线。

8、可靠性呢?云不能帮你做到这些吗?

当我们在云中运行时,我们使用两个地理上分散的区域,每个区域内都有大量冗余。这正是我们现在正在做的,因为我们已经脱离了云计算。我们在两个地理位置分散的数据中心中托管自己的硬件,每个数据中心都能够承载我们需要的全部负载,并且每个关键的基础设施都有副本。

可靠性在很大程度上取决于冗余。你应该能够在任何时候丢失任何一台电脑,任何组件,而不会造成任何问题。我们在云上拥有这种能力,而现在使用我们自己的硬件也能做到。

9、国际化业务的性能怎么样?云不是更快吗?

我们之前的云设置在美国使用了两个不同的区域,然后使用了在世界各地都有本地边缘节点的 CDN 网络。我们下云后,做了同样的事情,就像可靠性一样。我们在美国使用两个数据中心,并使用国际 CDN 来加速内容交付。

基本上是一样的。关于国际足迹的困难部分通常不是保护数据中心或设置硬件,而是设计应用程序来处理多个主数据库的编写、处理复制延迟问题,以及其他使应用程序在全球互联网上快速运行所需的有趣的事情。

我们目前正在计划在欧洲的一个数据中心进行 HEY 的一个前哨实验,我们只是依靠我们在 Deft 的朋友来设置它。与所有硬件采购一样,交付的时间确实比云计算长。没有什么比得上云技术的“我想在日本有10台服务器在线”并30秒后看到它,这是惊人的。

但对于我们这类业务来说,你必须为这种即时启动支付的疯狂溢价是不值得的,等待几周才能看到服务器上线是一个完全可以忍受的代价。

10、你考虑到以后更换服务器的成本了吗?

是的,我们是根据服务器5年的使用期限进行计算的。这是保守的,我们的服务器已经运行了7-8年,运行良好。但大多数人通常使用的是5年的时间间隔,这便于进行财务比较。

但问题来了。我们花了60万美元买了大量新服务器。我们通过下云节省的费用已经支付了这笔投资!因此,如果明年出现一些惊人的技术突破,我们想再次购买一堆新东西,我们可以很容易地做到这一点,并且仍然在成本上领先。

11、那么隐私法规和 GDPR 呢?

在隐私法规和 GDPR 方面,云计算并没有给你带来任何真正的优势。如果说有什么不同的话,那就是消极的一面,因为所有主要的超大规模计算机都是美国的。所以,如果你在欧洲,你从微软、谷歌购买云服务,你需要面对的事实是,美国政府可以合法地迫使提供商交出数据和记录。

因此,如果严格遵守 GDPR 是你设立欧洲公司的关键,那么您最好拥有自己的硬件并从欧洲数据中心提供商处运行它。

12、突发需求怎么办?自动伸缩呢?

购买自己的硬件时,最令人震惊的事情是意识到它变得如此便宜和强大。仅在过去的4-5年里就取得了巨大的进步,这就是云计算变得越来越糟糕的原因之一。

也就是说,你可以负担得起过度配置自己的硬件,让自己有足够的余量来处理峰值,但这几乎不会对长期预算产生影响。

也就是说,如果你经常面临超出基线5-10倍或更高的需求峰值,你可能是潜在的云用户。亚马逊在“黑色星期五”或“网络星期一”所需的性能远远超过一年中的其他时间,所以灵活的硬件是有意义的。

但你也可以混搭。俗话说“买基线,租尖峰”。然而,许多公司甚至不需要为此烦恼。只要在你的增长曲线之前购买一些强大的机器,随着时间的推移密切关注使用情况,如果你不得不进行计划外的扩展,通常在一周左右的时间内,你就可以让一整组服务器上线。

13、你在服务合同和许可费用上花了多少钱?

什么都没有。在互联网上运行应用程序所需的一切通常都是开源的,我们在云中运行所有东西都是开源版本,我们的RDS数据库变成了 MySQL 8,我们的 OpenSearch 变成了开源的 ElasticSearch。

有些公司可能确实喜欢服务合同带来的舒适感,而且有很多供应商可以提供这样的服务。我们曾经断断续续地使用 Percona 的 MySQL 专家提供的出色服务,但它不会从根本上改变底层。

你必须远离最具商业色彩的机构。通常情况下,如果他们的客户名单上有银行或政府,你应该另寻他处,除非你就是喜欢烧钱。

14、如果云这么贵,你当初为什么要选择“上云”呢?

因为我们买账了。相信了所谓的更便宜、更容易、更快捷。但只有最后的承诺才真正实现了,在云上,可以快速配置一整套服务器。但这并不是我们经常做的事情,所以不值得支付巨额溢价。

我们花了数年时间,试图从“规模经济”和“易用性”中节省开支,但这从未真正实现。托管服务仍然需要管理,摩尔定律带来的进步很少被转化为节省成本。

事后看来,我真的很高兴我们对云做了适当的尝试。我们学到了很多,并因此改进了我们的流程。但我真希望我们能早几年做这个计算。

参考资料:




延伸 · 阅读

精彩推荐