数据库圈子 2024 年度回顾
本文以翻译 Andy Pavlo 老师的《Databases in 2024: A Year in Review》为主。
从 2022 年开始,学习 Andy 老师的年度总结已成为每年元旦的保留项目 :)。以下是过去两年的笔记::Databases in 2022: A Year in Review 笔记、Databases in 2022: A Year in Review 笔记
以前年度回顾的文章会写到 OtterTune 主页,但是这个公司实际已经不复存在了,所以今年把年度总结文章写到了学校的主页上。
过去一年有很多事情值得回顾,包括价值十位数的收购事件、供应商因许可证变更而大肆行动,以及最著名的数据库界八十多岁老人挥霍现金招募一名大学四分卫以给他的新欢留下深刻印象。
年度回顾文章热度越来越高,有的大学甚至列为数据库必读文章。以下是过去几年的年度回顾文章:
- Databases in 2023: A Year in Review
- Databases in 2022: A Year in Review
- Databases in 2021: A Year in Review
"我的数据库,Licence 我做主"
我们生活在数据库的黄金时代。对于不同领域的各种类型的应用,都有许多出色的(关系型)数据库可供选择。许多数据库虽然有风投 (VC) 支持的营利性公司负责开发,但却是开源的。
但是 VC 希望能盈利,所以他们在云端为自己开发的数据库管理系统(DBMS)推出托管服务。然而,云服务 (cloud) 使得开源 DBMS 的开发者并没有那么容易赚到钱。如果一个 DBMS 变得过于流行,那么云供应商(如亚马逊)就会将其作为一项服务推出,并能赚更多的钱。这种威胁使得许多数据库公司转向更严格的源代码许可证,以防止云供应商转售他们的产品。MongoDB 在 2018 年率先采取了这一举措,当时他们转向了服务器端公共许可证(SSPL)。
在过去的一年里,许可证变更非常动荡,其中最突出的两个是 Redis 和 Elasticsearch。
Redis
Redis 有限公司正积极迈向首次公开募股(IPO)之路。该公司最初在 2011 年以 Redis Labs 的名称起步,2021 年从其创建者 Salvatore Sanfilippo 手中收购了 Redis 商标后,更名为 Redis 有限公司。在过去几年里,Redis 有限公司一直试图巩固对 Redis 领域的控制。该公司还通过增加对向量和其他数据模型的支持,试图摆脱系统主要被用作内存缓存的这种认知。
2024 年 3 月,Redis 有限公司宣布他们将从系统最初的(非常宽松的)BSD-3 许可证切换为双重许可证,包括专有的 Redis 源代码可用许可证和 MongoDB 的服务器端公共许可证(SSPL)。该公司在宣布这一许可证变更的同一天,还宣布收购了 Speedb,它是 RocksDB 的一个开源分支。
Redis 许可证变动引发了强烈反对。在许可证变更的同一周,基于原始 BSD-3 代码线宣布了两个分支:Valkey 和 Redict。Valkey 始于亚马逊,但谷歌和甲骨文的工程师很快加入。仅一周时间,Valkey 项目成为 Linux 基金会的一部分,对 Redis 有限公司进行了反击,几家大公司将开发工作转向了它。当 Redis 有限公司对其备受喜爱的商标变得轻佻并开始接管开源 Redis 扩展时,这并没有改善人们对它不怀好意的看法。
在 2024 年 12 月,Redis 的创造者宣布他正在与 Redis Ltd.的管理层联系,并希望回归以重新团结 Redis 社区。
Elasticsearch
Elastic N.V.是一家盈利性公司,支持领先的文本搜索数据库管理系统 Elasticsearch 的开发。2021 年,他们宣布转向 Elastic License 和 MongoDB 的服务器端公共许可证(SSPL)的双重许可模式,这是对亚马逊的 Elasticsearch 服务日益突出的回应,尽管该服务自 2015 年就已推出。亚马逊对此举并不友好,并宣布推出 OpenSearch 分支。
三年后的 2024 年 8 月,Elastic N.V.宣布撤销许可证变更,转而采用 GNU Affero 通用公共许可证(AGPL)。他们宣布这一变更的博客文章引用了肯德里克·拉马尔(Kendrick Lamar)的歌曲(例如《Not Like Us》)。亚马逊不喜欢被称为“数据库界的德雷克(Drake)”,并在次月宣布将 OpenSearch 项目的所有权转移给 Linux 基金会。
Andy 观点
这场动荡似乎仅仅是因为许可证问题,但请记住,数据库中蕴含着巨大的财富。而这仅仅是两个系统!我甚至还没有讨论 Greenplum 在九年后悄然关闭其开源仓库并转为专有软件的事情。但人们没有注意到,因为已经没有人愿意再运行 Greenplum 了。我所知道的唯一一个做出同样开源逆转的数据库管理系统是 2023 年的 Altibase。
坦率地说:我不喜欢 Redis。它速度慢、事务功能也很假,并且它的查询语法很怪异。我们在 CMU 的实验发现 Dragonfly 的性能数据要令人印象深刻得多(即使是在单个 CPU 核心的情况下)。在我的数据库课程中,我将 Redis 查询语言作为典型反例。然而,我对 Redis Ltd. 被亚马逊超越的困境表示同情。但是,该公司高估了构建像 Redis 这样简单系统的壁垒;它比构建一个功能齐全的数据库管理系统(例如 Postgres)要低得多,所以有几个替代原始 Redis 的选择。他还没有强大到让社区容忍他们修改开源许可证的地步。
Elasticsearch 的发展历程与 Redis 类似,只不过它在情节上走得更远。具体表现为:公司宣布许可证变更,竞争对手创建了一个开源分支,然后公司又恢复到开源许可证,但引起的反响不大。
请注意,与其他采取类似行动的系统相比,Redis 和 Elasticsearch 受到了更多的抵制。当 MongoDB、Neo4j、Kafka 或 CockroachDB 宣布更改许可证时,并没有人大力去 fork 这些系统。CockroachDB 甚至在 2024 年再次更改了许可证,以迫使大型企业开始付费。Redis 和 Elasticsearch 不能这样,是因为它们的用户群体很大,更多的人对这种许可证变更感到不满。就 Redis 而言,我感觉到人们认为 Redis Ltd.不公平地从他人的工作中获利,因为该公司的创始人并不是该系统的最初创造者。对 Redis 的源代码库进行分析还表明,其中相当大比例的代码贡献来自公司外部(例如腾讯、阿里巴巴)。这种“窃取荣誉”也是 HashiCorp 在 2023 年更改 Terraform 的许可证时引起愤怒的原因。
在这些许可证变更中,首要问题是数据库市场中开源独立软件供应商(ISV)的长期生存能力。云服务供应商是拥有无限资金的巨头。如果一个开源数据库管理系统(DBMS)获得成功,他们将开始托管它,并比独立软件供应商赚取更多的钱。或者他们会只兼容你的数据库管理系统的协议层、后端则换成其他系统。就像 2024 年 3 月 AWS 为其 Timestream DBMS 添加 InfluxDB v2 协议支持一样。
-
【更正】2025 年 1 月 1 日更新:我之前曾说过,AWS 在其现有的 Timestream 数据库管理系统之上添加了 InfluxDB v2 协议。AWS 并非只是复制该协议,而是与 Influx Data 合作,提供 InfluxDB v2 数据库管理系统的托管服务。来源1
-
【更正】2025 年 1 月 1 日更新:我错过了 ScyllaDB 在 2024 年 12 月宣布的消息,即他们将停止其数据库管理系统的开源(AGPL)版本,并使企业版“源代码可用”。来源2
The Databricks vs. Snowflake: 战火蔓延
Databricks 和 Snowflake 之间的敌意依旧。这场争斗是一场典型的数据库之战,已经蔓延到了各个领域。这两家公司之前在查询性能方面的争执已经扩展到了数据管理的其他领域,并且成本变得更高。
2024 年 3 月,Databricks 率先出击,宣布花费 1000 万美元构建拥有 1320 亿参数的 DBRX 开源大语言模型。Mosaic 团队领导了 DBRX 模型的开发,Databricks 在 2023 年以 13 亿美元收购了该团队。一个月后,Snowflake 来到同一战场,用拥有 4800 亿参数的 Arctic 开源大语言模型点燃战火。Snowflake 吹嘘他们仅花费 200 万美元训练他们的模型,同时在诸如 SQL 生成等“企业”任务方面表现优于 DBRX。可以看出,Snowflake 最关心的是对 Databricks 发起攻击,因为他们的公告显示其他大语言模型比他们表现更好(例如 Llama3),但他们强调自己比 DBRX 更好。一位人工智能研究员对 Snowflake 在分析中为何如此关注 DBRX 而不是其他模型感到困惑;这个人不知道这两个数据库竞争对手之间有多少恩怨。
在公开的大语言模型之战激烈进行的同时,Databricks 和 Snowflake 之间的战争在 Catalog 方面又开辟了另一条战线。在 2010 年代的大部分时间里,Hive 的 HCatalog 一直是数据湖上事实上的目录系统。Iceberg 和 Hudi 分别在 2010 年代后期由 Netflix 和 Uber 推出,作为替代品出现,并且都成为了由风险投资资助的初创公司支持的顶级 Apache 项目。这些系统提供元数据服务来跟踪文件,并支持在对象存储(例如 S3)上进行新数据的事务性摄入。Databricks 有一个名为 Unity 的专有目录服务,该服务与其 DeltaLake 平台配合使用。Snowflake 在 2022 年宣布他们与 Iceberg 支持的表进行初步集成。在接下来的几年里,他们扩大了对 Iceberg 的支持。然后,他们考虑收购 Iceberg 背后的主要公司 Tabular,以与 Databricks 的 Unity 和 DeltaLake 竞争。据说 Snowflake 即将以 6 亿美元完成这笔交易。但随后 Databricks 闯入并斥资 20 亿美元收购了 Tabular。Databricks 在 Snowflake 首席执行官在 2024 年 6 月的会议主题演讲当天宣布了此次收购,当时他正在宣布他们新的开源 Polaris 目录服务。Databricks 在接下来的一周宣布开源他们的 Unity 目录,继续打击 Snowflake。简直是一场“谋杀”。
Andy 观点
这场数据库之战的有趣之处在于,它不仅仅关乎原始性能数字。它不像 20 世纪 90 年代的甲骨文与 Informix 之争,那时他们主要吹嘘更快的查询延迟。的确,当 Informix 起诉甲骨文(后来不得不撤回诉讼)时,这场战斗也不仅仅是基准测试的较量,因为甲骨文挖走了一些 Informix 的高级管理人员。后来,全世界发现 Informix 的首席执行官篡改了公司账目以夸大收入数字,以便在与甲骨文的竞争中看起来更好,并且不得不进行为期两个月的联邦监狱服刑。
相反,Snowflake 与 Databricks 之战已经扩展到围绕数据库的生态系统。也就是说,它涉及人们将数据导入数据库所使用的基础设施,以及他们在该数据上使用的工具。用于分析查询的向量化执行引擎现在是一种商品。Databricks 和其他所有 OLAP 供应商都遵循 Snowflake 在 2013 年的架构设计,该设计最初基于 Snowflake 的一位联合创始人的博士论文。现在重要的是用户友好性方面(这些方面难以货币化并与竞争对手进行比较)、与其他工具的兼容性以及人工智能/大型语言模型的魔力。
至少 Snowflake 和 Databricks 之间的竞争对消费者有好处。这种激烈程度意味着更好的数据产品和技术(例如,Snowflake 的 Polaris 现在是一个 Apache 项目),并最终(希望如此)降低价格。它不像甲骨文和 Salesforce 首席执行官之间以前的口水战,那是两个有钱人在互相攻击。
无处不在的 DuckDB
就像 Postgres 是任何关系数据库新手的默认选择一样,DuckDB 已成为学习 OLAP 的首选。此前,Pandas 占据了 DuckDB 的王者地位。鉴于 DuckDB 令人难以置信的可移植性,人们正在努力将其嵌入到对 OLAP 工作负载支持不佳的现有数据库管理系统中。今年,我们看到了四个不同的扩展发布,用于将 DuckDB 嵌入到 Postgres 中。
2024 年 5 月,Crunchy Data 首次宣布推出其专有的插件,用于重新连接 Postgres,将 OLAP 查询路由到 DuckDB。后来,他们宣布了其插件的扩展版本,以利用 DuckDB 的地理空间功能来加速 PostGIS 查询。
2024 年 6 月,ParadeDB 宣布了他们的开源插件(pg_analytics),该插件使用 Postgres 的外部数据包装器 API 调用 DuckDB;他们之前在早期版本(pg_lakehouse)中使用 DataFusion,但后来转向了 DuckDB。
然后,在 2024 年 8 月,下一个针对 Postgres 的 DuckDB 插件(pg_duck)发布。这个插件的源代码托管在 DuckDB Labs 的 GitHub 组织下。因此,这是 Postgres 官方认可的 DuckDB 扩展。最初的公告将这个项目吹嘘为 MotherDuck、Hydra、微软和 Neon 之间的合作。后两者(据称)因开发控制权的争议而被排除在外。该仓库作者只有 MotherDuck 和 Hydra。
最新的 DuckDB 插件于 2024 年 11 月随着 pg_mooncake 推出。Mooncake 与其他三个不同,因为它支持通过 Postgres 将数据写入具有完整事务支持的 Iceberg 表。
Andy 观点
大多数 OLAP 查询不会访问那么多数据。Fivetran 分析了来自 Snowflake 和 Redshift 的跟踪数据,结果显示查询扫描的数据量中位数仅为 100MB。如此少量的数据意味着对于大多数情况,单个 DuckDB 实例就足以处理大多数查询。
DuckDB 的便利性和可移植性是其在 Postgres 社区中广泛传播的原因。尽管 ClickHouse 自 2016 年就已存在,但直到最近它才像 DuckDB 那样易于运行(请参阅这篇讨论[Clickhouse 负责的部署] 2018 年部署 ClickHouse 步骤的博客文章)。这些 DuckDB 插件是进入更广泛数据生态系统的单一入口点。用户不再需要安装单独的扩展来访问 Iceberg 中的数据以及单独访问 S3。DuckDB 可以为你处理所有这些。它使公司能够在不需要昂贵的数据仓库的情况下获得高性能分析。
Postgres 对扩展和插件的支持令人印象深刻。20 世纪 80 年代 Postgres 的原始设计目标之一是可扩展。其目的是轻松支持新的访问方法、新的数据类型以及对这些数据类型的操作(即对象关系型)。我们的研究表明,与其他所有数据库管理系统相比,Postgres 拥有最广泛和多样化的扩展生态系统。自从2016年,Postgres 引入 hook机制。我们还发现,如果数据库管理系统缺乏合理机制,那么不同插件和扩展可能会相互干扰并导致不正确的行为。
早期将列存储添加到 Postgres 的项目(例如 Citus、Timescale)只解决了部分问题。列数据格式改善了从存储中检索数据的方式。然而,如果数据库管理系统仍然使用面向行的查询处理模型(例如 Postgres),则无法充分利用这些格式。使用 DuckDB 既提供了列存储又提供了向量化查询处理。
这里可能有一个关于火鸡包鸭再包鸡(turducken)的笑话,涉及一头大象,但我不会讲这个笑话,因为我不想被解雇或再次被大学留校察看。(笔者也不知道这个梗到底是啥)
随机事件
去年数据库发生了许多一次性事件,你可能忽略了。以下是对它们的快速总结:
产品发布
Amazon Aurora DSQL: AWS 如何实现他们新的类似 Spanner 的数据库管理系统(DBMS)还没有太多公开信息(参考 Mark Brooker 关于该数据库管理系统架构的讨论)。关键理念是分布式日志服务(有传言称它将基于现已不存在的 QLDB)和通过时间同步进行时间戳排序。但这个公告向你展示了“Aurora”这个名字在数据库世界中拥有多么高的品牌认知度,因为 AWS 将其用于这个新的数据库管理系统,它似乎与他们的旗舰产品 Aurora Postgres RDS 没有共享任何代码。
CedarDB:Umbra 是由世界上最伟大的数据库系统研究员(Thomas Neumann)编写的最先进的数据库管理系统之一。但是 Thomas 满足于留在他的大学致力于 Umbra 的研究,舒适地处于 Clickbench 排行榜的首位,而不必担心麻烦的客户。这就是为什么他的顶尖博士生fork了他的代码,并将其作为 CedarDB 进行商业化。
谷歌 Bigtable:这个公告唯一有趣的部分是,2000 年代后期 NoSQL 运动的前先锋现在在 2024 年支持 SQL。
Limbo:Turso 已经在对 SQLite 的 libSQL 分支进行了一段时间的开发,但他们在 2024 年全力以赴,宣布用 Rust 对 SQLite 进行完全重写。在他们的公告中,他们正确地指出 SQLite 的价值不仅仅来自于它的代码,还来自于确保它在任何地方都能正确运行的疯狂测试工程。这就是为什么 Limbo 的开发人员正在与一家由前 FoundationDB 人员创办的确定性测试初创公司合作。有关此测试的更多信息,请参阅 FoundationDB 的 2020 年 CMU-DB 演讲。
微软 Garnet:这个键值存储是来自微软研究院令人印象深刻的 FASTER 系统的继任者。它与 Redis 兼容,并支持查询间并行性、大于内存的数据库和真正的事务。如今,Redis 不应该是任何人的首选。
MySQL v9:在 MySQL v8 全面上市六年后,团队推出了 v9。但是人们很快发现,如果你的数据库有超过 8000 个表,它就会崩溃。我对这个新版本的功能列表并不满意。Oracle 正在将所有的时间和精力投入到其专有的 MySQL Heatwave 服务中。MySQL 仍然被广泛使用,但兴奋点已经不在了。每个人都转向了 Postgres。
Prometheus v3:距离 Prometheus 的最新主要版本已经过去了七年。现在有很多兼容的替代方案,因此原始的 Prometheus 可能不是一些公司的最佳选择。
收购
《Alteryx 被私募股权收购》:我从未见过有人使用 Alteryx,对它也没有什么看法。
《MariaDB 被私募股权收购》:希望收购 MariaDB 公司的私募股权人士能够清理这个烂摊子。请参阅我去年对“MariaDB 一团糟”的分析。
《OrioleDB 被 Supabase 收购》:如果你是领先的 Postgres 独立软件供应商之一,这次收购是有意义的。Postgres 有一个很棒的前端,但存储架构过时了。OrioleDB 解决了这个问题。
《PeerDB 被 ClickHouse 收购》:有了更好的 ETL 工具,可以将数据从 Postgres 导出到 ClickHouse。这是 ClickHouse 公司的明智之举。
《PopSQL 被 Timescale 收购》:他们为自己买了一个漂亮的 SQL 编辑器界面。这是一种用户友好性的提升。
《Speedb 被 Redis Ltd. 收购》:请参阅上面的讨论。他们可能会使用 Speedb 让 Redis 将数据写入磁盘。Speedb 的开发者从未解释他们在其 RocksDB 分支中做了哪些更改和改进(或者是我找不到?)。请参阅 Mark Callaghan 最近对“Speedb 与 RocksDB”的比较。
《Rockset 被 OpenAI 收购》:这对该公司来说是个大新闻,但不幸的是,他们不得不在 2024 年 9 月关闭 DBaaS。Rockset 有一个很棒的工程团队,其中一些是来自 Facebook 的顶尖数据库工程师。我只是一直不喜欢他们的数据库管理系统在其索引中存储三份你的数据。
《Tabular 被 Databricks 收购》:再次请参阅上面的讨论。Iceberg 是标准(对不起,Hudi);甚至亚马逊 S3 现在也支持它。Polaris 的采用将如何发展以及他们是否能够长期保持兼容性还有待观察。
《Verta.ai 被 Cloudera 收购》:我猜 Cloudera 还活着?
《Warpstream 被 Confluent 收购》:用 golang 重写 Kafka,然后使其写入 S3。我为 Warpstream 团队感到高兴,但 Confluent 本可以自己做到这一点。
融资
- Databricks - 100 亿美元 J 轮融资
- DBOS - 850 万美元种子轮融资
- LanceDB - 800 万美元种子轮融资
- SDF - 900 万美元种子轮融资
- SpiceDB - 1200 万美元 A 轮融资
- TigerBeetle - 2400 万美元 A 轮融资
CedarDB、SpiralDB 和其他一些公司有一些更多的融资,但这些金额尚未公开。
落幕
亚马逊 QLDB:如果亚马逊都想不出如何通过区块链数据库赚钱,那就没人能做到了。是的,我知道 QLDB 不是真正的 P2P 区块链,但也足够接近了。
OtterTune:Dana, Bohan 和我在这个研究项目和初创公司上工作了近十年。现在它失败了。我对一家特定公司在最后如何对待我们感到失望,所以他们永远被禁止招聘卡内基梅隆大学数据库专业的学生。他们知道自己是谁以及做了什么。
我还想特别赞扬安德烈斯·弗伦德在 2024 年于微软从事 Postgres 工作时发现了xz 后门。这次攻击是一场为期两年的行动,旨在将恶意代码注入一个在计算中广泛使用的重要压缩库。虽然这个后门针对的是 SSH 而不是直接针对 Postgres,但这是另一个例子,说明为什么数据库工程师是世界上最好的程序员之一。
Andy 观点
Databricks 连续第二年在数据库领域的所有融资中脱颖而出,以令人咋舌的 100 亿美元 J 轮融资令人惊叹。此前,他们在 2023 年进行了 5 亿美元的 I 轮融资,2021 年进行了 16 亿美元的 H 轮融资。这次不同的是,这笔资金用于从对 Databricks 不可避免的首次公开募股(IPO)感到不耐烦的员工手中购买股票。CMU DB Group有几位校友在 Databricks 工作,包括一位前排名第一的博士生。我知道他们中的一些人在决定下一步行动之前,正焦急地等待着 Databricks 的 IPO。
来年将是许多数据库初创公司的实力考验。没有人想成为下一个 MariaDB 公司,因此有几家公司正在等待搭乘 Databricks 的顺风车,然后自己进行 IPO。来年利率的下降可能会为几家在两年多前筹集了大量资金的数据库公司(例如 CockroachDB、Starburst、Imply、DataStax、SingleStore、Firebolt)开辟额外的资金来源。在这群公司中脱颖而出的是 dbtLabs,我听说它正在轻松地大获成功。
另请参阅数据库列表中 2024 年发布的新数据库管理系统列表:https://dbdb.io/browse?start-year=2024。
老当益壮的 Larry Ellison (八卦)
你知道今年谁过 80 岁生日吗?传奇人物拉里·埃里森!再一次,我们看到他是一个拒绝安定下来或被框定的人。首先,拉里将自己推上了《福布斯》亿万富翁排行榜,成为世界第三富豪。2024 年 3 月,甲骨文股票大幅上涨,他在一天内赚了 150 亿美元。手头宽裕的拉里在 2024 年 7 月开始购物,并签署了一项以 60 亿美元收购派拉蒙影业的协议,送给他的独子(第三任妻子)。然后,他决定放松一下,仅以 2.77 亿美元购买了一个棕榈滩度假胜地。这些举动都发生在短短一年内,而且都是数据库买单。
但与拉里在 2024 年最重大的成就相比,这些都只是小事。2024 年 11 月,当我们的拉里·埃里森新闻提醒在半夜把我们吵醒时,我认识的每个人都很惊讶。头条新闻都在吹嘘拉里如何帮助密歇根大学橄榄球项目招募到了顶尖的大学四分卫。该大学此前曾宣布,这名球员将从路易斯安那州立大学转学到密歇根大学。他们的新闻稿中奇怪地提到了“拉里和他的妻子乔琳”对招募工作的帮助。记者们很快证实,这个“拉里”就是独一无二的拉里·埃里森!拉里为助力活动捐款 1200 万美元,为这位最佳四分卫转学到密歇根大学提供资金。这个故事中更大的谜团是这个“乔琳”的身份。调查人员发现了拉里观看网球比赛的旧照片,照片中有一个戴着密歇根帽子的女人。两周后,一家主要新闻机构在早上 5:30 爆出了这个消息(我的提醒又把我吵醒了),这个女人的身份是乔琳(凯伦)朱,他们证实她是拉里的新妻子。
Andy 观点
我为拉里在过去一年所取得的成就感到无比自豪。他没有从任何一所大学毕业,并且与密歇根大学之前也没有任何联系。然而,由于他一生的挚爱大约十年前曾在密歇根大学就读,拉里创造了奇迹,他开出了一张仅 1200 万美元(约占他净资产的 0.0055%)的支票。我告诉拉里,这对我来说意义非凡,因为我以前排名第一的博士生现在是密歇根大学计算机科学系著名数据库小组的教授。这个故事更精彩的地方在于拉里又恋爱了!在当今世界,太多的人在努力寻找那个特别的人。约会应用程序一团糟,快速约会活动很尴尬,而且现在如果你自己没有孩子却在操场周围闲逛去结识单身父母被认为是不礼貌的。然后,就在你认为终于找到了合适的人时,当你了解到他们不经常洗袜子或者喜欢在冷麦片上放辣酱时,一切都崩溃了。这就是为什么每个人都告诉我,拉里在 2010 年与浪漫小说家梅兰妮·克拉夫特(第四任妻子)离婚后再也不会结婚了。在他 2020 年与尼基塔·卡恩(第五任妻子)离婚后,那些人也对我说了同样的话。但我更了解情况,拉里与凯伦·朱(第六任妻子)秘密结婚证明了我是对的!
结语
我原本打算以这是三年来我第一次在庆祝新年前夜时没生病来开启这篇文章。但后来我的亲生女儿让我感染了新冠,所以我现在因这个病倒了。我在 9 月份打了加强针,他们给了我帕克斯洛维德,所以我会挺过去的。
我对 OtterTune 的失败感到失望。但我学到了很多,并且与许多聪明的人一起工作。我非常感谢英特尔资本和睿思资本一直支持我们到最后。我希望很快能宣布我们的下一个创业项目(提示:是关于数据库的)。
与此同时,我很高兴能全职回到卡内基梅隆大学。我和吉涅什·帕特尔有一些很棒的研究项目,我们希望在即将到来的一年里完成。我也期待着在这学期教授一门关于查询优化的新课程。我需要想办法提升我的研究成果,因为在 2024 年 9 月,维基百科因为我的文章引用不足而删除了关于我的条目。
当 DJ Mooshoo 被关在库克县监狱时,我们对他不离不弃。我们希望在 2025 年让他重获自由。
最后,我要为 ByteBase 的文章《2024 年数据库工具:年度回顾》点赞。在过去的几年里,他们给我发邮件请求允许将我的年终数据库文章翻译成中文放在他们的博客上。今年,他们等不及我写完这篇文章,所以他们模仿了我的风格,写了一篇标题和主题都相同的非官方文章。