詳述 · 14件の出来事
AIの歴史
1950年代
1956年夏、ニューハンプシャー州ダートマス大学で開かれた約8週間のワークショップで、John McCarthy・Marvin Minsky・Claude Shannon・Nathaniel Rochester ら10名が「artificial intelligence」という言葉を提案・採用した。具体的な技術的成果よりも、後の数十年にわたるこの分野の独立した呼称と研究者ネットワークを生んだことが歴史的意義となる。
Cornell Aeronautical Laboratory の Frank Rosenblatt が、入力に重みをかけて閾値判定する単純な学習機構「パーセプトロン」を発表。1960年には IBM 704 上で動かしたソフトウェアを 400 画素のセンサに接続した実装「Mark I Perceptron」を US Navy 向けに披露した。ニューラルネットワークという系譜の出発点で、後の MLP・畳み込みネットワーク・深層学習に至る基本骨格となる。
1960年代
MIT の Joseph Weizenbaum が開発した自然言語対話プログラム。最も有名なスクリプト「DOCTOR」はロジャース派の心理療法士を模倣し、ユーザの入力をパターンマッチで切り取って質問に変換する単純な仕組みだった。にもかかわらず多くの実験参加者がこの機械を「自分を理解している」と感じたため、Weizenbaum 自身がのちにこの現象を批判する書物(『Computer Power and Human Reason』, 1976)を書くことになる。
1970年代
英国学術研究評議会の依頼により James Lighthill が AI 研究の現状を評価し、1973年に発表された報告書は「これまでの AI 研究は、初期の楽観論が約束した成果を出していない」と結論づけた。これを受けて英国政府は AI への助成を大幅に削減、米国でも DARPA が同種の方針転換を行い、「第一次 AI 冬」と呼ばれる十年に及ぶ低迷期が始まる。Newell や Minsky が想定していた楽観的なスケジュールへの最初の本格的な反論となった。
1980年代
Stanford の MYCIN(細菌感染症の診断)や DEC の XCON(VAX 構成の自動化)が示した、特定領域の専門知識を「if-then」ルールで明示的にコード化するアプローチが、1980年代前半に産業界へ広がる。日本では通産省が「第五世代コンピュータ」計画を主導(1982-1992)。ピーク時の1985年には世界の AI 関連支出は10億ドル規模に達するが、ルールベース系の保守困難さと汎化能力の欠如により、80年代末には急速に失速する(第二次 AI 冬)。
1990年代
IBM のチェス専用機 Deep Blue が、当時のチェス世界王者 Garry Kasparov との6番勝負(リターンマッチ)に 3.5-2.5 で勝利した。前年(1996年)の対戦では Kasparov が勝っていたが、IBM はその後の1年でハードウェアと評価関数を大幅強化した。チェスのトップレベルにおいて、機械が人間に勝った最初の決着であり、AI 報道の文脈では象徴的な節目とされる(実態はゲーム木探索+特化評価関数で、現代的な学習は含まない)。
2010年代
Toronto 大学の Alex Krizhevsky・Ilya Sutskever・Geoffrey Hinton らが、画像認識ベンチマーク ImageNet 2012 でトップ5エラー率 15.3% を達成。2位の従来手法(26.2%)を10ポイント以上引き離す決定的な差で、畳み込みニューラルネットワーク(CNN)を二枚の NVIDIA GTX 580 GPU で学習させたアーキテクチャ「AlexNet」が、深層学習の実用性を一夜にして証明した。これ以降、コンピュータビジョンの主流は手作業の特徴量設計から深層学習へと完全に移行する。
DeepMind の AlphaGo が、囲碁世界トップ棋士のひとり李世乭(イ・セドル)との5番勝負を 4-1 で制した。組合せ爆発のため「あと10年は機械に解けない」とされてきた囲碁の壁を、モンテカルロ木探索+深層強化学習の組合せで突破した出来事。第2局37手目の「神の一手」と呼ばれた打ち回しは、人間の対局では見られない発想として棋士コミュニティを驚かせた。
Google Brain と Google Research の Ashish Vaswani らが、Self-Attention のみで構築される系列変換アーキテクチャ Transformer を提案。それまで自然言語処理の主役だった RNN・LSTM を、並列化可能で学習効率の高い構造で置き換えた。論文の引用数は2026年時点で15万を超え、現代の大規模言語モデル(BERT、GPT 系、Claude、Gemini)はすべてこのアーキテクチャの拡張である。
デュアルコア A5、800万画素カメラ、そして音声アシスタント Siri。発表会の翌日、10月5日に Steve Jobs が他界し、iPhone 4S は事実上、彼の遺品となった。Siri は買収した SRI 発のスタートアップ技術をベースとし、自然言語によるスマートフォン操作という発想を主流に押し出した。
2020年代
OpenAI が公開した 1750 億パラメータの言語モデル。前年の GPT-2(15億パラメータ)から100倍以上の規模拡張で、文章生成・要約・翻訳・コード生成を含む多様なタスクを少数例の Prompt から処理できる「Few-shot」能力を示した。研究コミュニティの議論を大規模言語モデルの「スケーリング則」へ集中させ、AI 投資の方向性を一変させた。
OpenAI が ChatGPT を一般公開。GPT-3.5 を対話用にチューニングし、無償で誰でもブラウザから使える形にしたサービスで、公開後5日で100万ユーザ、2ヶ月で1億ユーザに到達した(消費者向けインターネットサービスの最速記録)。生成AIという概念を専門研究の文脈から一般の家庭・学校・職場へ一夜にして移行させ、Google・Meta・Anthropic・Microsoft の方針転換を引き起こす起点となった。
OpenAI が GPT-4 を発表。画像入力に対応する初の主要 LLM で、米国の司法試験や AP 試験で受験者上位の成績を示した。パラメータ数・学習データ・アーキテクチャの詳細は非公開とされ、「公開と研究」という GPT-3 までの建前から、商業的に閉ざされた研究機関への OpenAI の転身を象徴する世代となった。
Apple が独自に展開する生成AIスイート「Apple Intelligence」を全面に押し出した世代。要約・書き換え・画像生成・Siri 強化を、可能な限りオンデバイスで実行する設計が特徴で、必要な場合のみ Apple 専用のサーバ(Private Cloud Compute)に処理を委ねる。AIの主導権を OpenAI や Google に渡さないための、ハードウェアと OS の共設計だった。