詳述 · 8件の出来事
データベースの歴史
1970年代
02 件
Dicklyon (Wikimedia Commons) · CC BY-SA 4.0 · Commons ↗ IBM サンノゼ研究所の E. F. Codd が、 CACM 誌に論文「A Relational Model of Data for Large Shared Data Banks」を発表。 集合論と一階述語論理を土台にした関係代数を提唱し、 アプリケーションがデータの物理的な格納方法に依存しないという「データ独立性」を打ち立てた。 当時主流だった階層型・網型 DBMS(IMS、 IDS) への根本的な対抗案であり、 1980 年代以降の Oracle・DB2・SQL Server・MySQL・PostgreSQL を含むすべての RDBMS の理論的起点となった。 Codd は 1981 年 ACM チューリング賞を受賞。

Oracle PR / Hartmann Studios (Wikimedia Commons) · CC BY 2.0 · Commons ↗ Larry Ellison・Bob Miner・Ed Oates が 1977 年に設立した Software Development Laboratories(後の Relational Software, Inc.、 さらに Oracle Corporation) が、 1979 年 6 月に Oracle V2 を出荷。 史上初めて市場に出た SQL ベースのリレーショナル DBMS となった。 Codd の関係モデル論文(1970) を商業製品化したのは、 論文を発表した IBM 自身ではなく、 PDP-11 上で動くこの小さなスタートアップだった。 米国 CIA を初期顧客に成長し、 2024 年現在 Oracle の売上は 500 億ドル超、 Ellison は世界富豪トップ 10 の常連となる。
1990年代
02 件Oracle Corporation (Wikimedia Commons, vectorised by Vulphere) · Public Domain (text logo, ineligible for copyright); MySQL is a trademark of Oracle · Commons ↗ Michael「Monty」Widenius・David Axmark・Allan Larsson がスウェーデンで MySQL AB を設立、 GPL/商用デュアルライセンスの RDBMS「MySQL」の最初のバージョンを公開。 Linux・Apache・MySQL・PHP/Perl/Python の頭文字を取る LAMP スタックの中核として、 2000 年代の Web 隆盛を支えた。 2008 年 Sun Microsystems が 10 億ドルで MySQL AB を買収、 2010 年 Oracle が Sun を買収したことで Oracle 傘下へ。 Monty は 2009 年に MariaDB をフォーク、 オープンな後継系統を維持し続けている。
PostgreSQL Global Development Group (Wikimedia Commons) · BSD (3-clause) · Commons ↗ UC Berkeley の Michael Stonebraker が指揮した Postgres プロジェクト(1986-1994) を引き継ぐ形で、 PostgreSQL 6.0 がリリース。 SQL 言語の正式採用と外部開発コミュニティへの移管を経て、 BSD ライセンスの本格 RDBMS として再出発した。 ACID 厳守・MVCC・拡張可能型システム・PostGIS(地理空間) や pgvector(ベクトル検索) といった追加機能の豊富さで支持を集め、 Stack Overflow Developer Survey では 2020 年代に MySQL を抜いて「最も愛されるデータベース」の常連となる。
2000年代
01 件MongoDB, Inc. (Wikimedia Commons) · Public Domain (ineligible for copyright); MongoDB is a trademark · Commons ↗ Dwight Merriman・Eliot Horowitz らが立ち上げた 10gen(後の MongoDB Inc.) が、 ドキュメント指向 NoSQL データベース「MongoDB」のバージョン 1.0 を公開。 行と列の表ではなく BSON 形式の JSON ドキュメントを格納し、 スキーマレスでスケールアウト可能という設計が「NoSQL ムーブメント」の象徴となった。 2017 年 NASDAQ 上場、 2024 年現在の ARR は 20 億ドルを超え、 リレーショナルが寡占していた DBMS 市場に「ドキュメントモデル」という有力な選択肢を定着させた。
2010年代
02 件Adrian.moloca (Wikimedia Commons) · CC BY-SA 4.0 · Commons ↗ AWS が re:Invent 2012 で Amazon Redshift を発表(GA は 2013 年 2 月)。 ParAccel 社の MPP 技術をベースにしたカラム指向の分析データウェアハウスで、 ペタバイト級のクエリを Teradata・Netezza・Oracle Exadata 等の従来オンプレ DWH の約 1/10 のコストで提供することを売り文句にした。 「DWH は専用ハードを買って構築する」という前提を覆し、 BigQuery(2010 年 GA)と並んで「クラウド DWH」というカテゴリを成立させ、 後の Snowflake・Databricks による解体・再構築へと続く流れの起点となる。
Snowflake Inc. (Wikimedia Commons) · Public Domain (ineligible for copyright); Snowflake is a trademark · Commons ↗ Benoit Dageville・Thierry Cruanes・Marcin Żukowski(Oracle・Vectorwise 出身) が 2012 年に設立した Snowflake が、 2014 年 6 月のベータを経て 10 月に正式 GA。 ストレージ(S3 等のオブジェクトストレージ) とコンピュート(仮想ウェアハウス) を完全分離し、 必要な分だけ計算を起動できるクラウドネイティブ DWH を実現した。 Redshift・BigQuery とは異なる「マルチクラウド・マルチクラスター・共有データ」アーキテクチャで急成長、 2020 年 9 月の IPO は初日終値ベースで時価総額約 700 億ドル、 当時史上最大の SaaS IPO となる。 2024 年現在の売上は 30 億ドル超。
2020年代
01 件Gknor (Wikimedia Commons) · CC BY-SA 4.0 · Commons ↗ PostgreSQL 拡張 pgvector が 2023 年に v0.4.x → v0.5.x へと進み、 LLM 時代の RAG(Retrieval-Augmented Generation) 用ベクトル DB として爆発的に普及した。 embedding(テキストや画像を高次元ベクトルに変換した表現) を PostgreSQL のテーブルに格納し、 コサイン類似度・L2 距離・内積で近傍検索ができる。 ChatGPT 公開(2022 年 11 月) で急増した RAG 需要に対し、 Pinecone・Weaviate・Chroma などの専用ベクトル DB と「既存の PostgreSQL に拡張を入れる」アプローチが競合する構図を作った。 AWS RDS・Azure Database for PostgreSQL・Supabase など主要マネージド PostgreSQL がこぞって pgvector をサポート開始。