t0nAr1sm

Appleをもっと身近に、もっと深く。

Cloudflare大障害は“設定ミス” 5分ごとに落ちた理由

Cloudflare障害で多数のサイトが表示エラーを起こしている様子(Failed to load resource の連続エラー)

✅この記事では、2025年11月18日に発生したCloudflareの大規模障害の「本当の原因」を整理します。技術的にはかなり難しい話ですが、できるだけ専門用語をかみ砕いて、「結局なにが起きていたのか」を順番に追いかけていきます。

どうも、となりです。

このブログはふだんApple中心ですが、今回の障害で「自分のブログやサービスも大丈夫かな?」と不安になった方や、「なんでこんなに広範囲で落ちたのか気になっている」という方も多いと思います。ちょうど9to5Macが要点をまとめてくれていたので、自分自身の整理もかねて、Cloudflareの説明をベースに振り返ってみることにしました。

昨日の障害では、XやChatGPTを含むインターネットの広い範囲が一斉に重くなったり、完全にアクセス不能になりましたよね。前回は「どんなサービスが落ちて、なぜ影響が大きくなったのか」を中心にまとめました(くわしくはCloudflare障害の全体像まとめもあわせてどうぞ)。

今回はその続編として、Cloudflare自身が公開した技術レポートをもとに、なぜ5分おきに“落ちては復活する”不思議な動きになっていたのか、そして「なぜ最初はサイバー攻撃だと思い込んでしまったのか」を丁寧に紐解いていきます。

そもそも何が起きていたのか(おさらい)

まず、ざっくりと状況を整理しておきます。Cloudflareは、世界中のウェブサイトやアプリの前に立ってトラフィックをさばく巨大な“交通整理役”です。たとえるなら、インターネットという高速道路に並ぶ、世界中の料金所みたいな存在なんですよね。

2025年11月18日(日本時間19日未明ごろ)、その料金所ネットワークの一部が5分ごとにダウン → 復活 → ダウン…を繰り返す状態になりました。その結果、Cloudflareを使っているサービスの多くで

  • ページがまったく開けない
  • 一時的に繋がるけど、すぐエラーになる
  • Xのタイムラインが更新できない

といった症状が世界中で同時多発していた、というのが今回の障害の全体像です。

要点まとめ:Cloudflareが明かした「4つのポイント」

  • Cloudflareは当初、超大規模DDoS攻撃(分散型サービス妨害攻撃)だと誤解していた
  • 実際には、Bot対策用データベースの権限変更ミスがきっかけで障害が発生
  • 誤った設定から生成された巨大な設定ファイルが世界中のサーバーに配布され、ソフトウェアが異常終了
  • 設定ファイルが5分ごとに再生成される仕組みだったため、「5分おきに落ちる」周期的な障害になった
  • Cloudflareは「インターネット全体に与えた影響は受け入れがたいものだった」として、強いトーンで謝罪している

 

 

なぜ「サイバー攻撃」だと思い込んだのか

今回の障害は、Cloudflare内部から見てもかなり紛らわしい挙動だったようです。Cloudflareが最初に「これはハイパースケール級のDDoS攻撃かもしれない」と判断した理由は、主に次の2つです。

  • 5分おきに大量の接続が失敗し、また自然に戻る → 通常のバグなら“勝手に直る”ことは少ない
  • Cloudflare本体とは別の場所に置いているステータスページまで同時に落ちた → 「インフラ側と監視ページの両方を狙った攻撃」に見えた

のちにわかったことですが、このステータスページ側の障害はたまたま同じタイミングで起きた別の問題で、Cloudflare本体の不具合とは無関係だったそうです。ただ、リアルタイムで問題を切り分けているチームからすると、確かに「両方同時に落ちている=攻撃かも?」と考えてしまうのは無理もないですよね。

本当の原因:権限変更→設定ファイル肥大化→ソフトが落ちる

では、実際には何が起きていたのでしょうか。Cloudflareの説明を、できるだけシンプルに分解してみます。

1. 発端は「データベースの権限を変えた」こと

Cloudflareは、怪しいアクセスを見分けるためにBot Management(ボット管理)システムを運用しています。これは、過去のログや機械学習モデルをもとに「このアクセスは人間っぽい/ボットっぽい」と判定する仕組みです。

このBot Managementでは、判定に使う特徴量をまとめた「フィーチャーファイル(feature file)」というデータを、一定間隔で自動生成しています。問題は、ここに関わるデータベースの権限設定を変えたことから始まりました。

権限を変更した結果、本来1行で出てくるはずのデータが複数行として出力されてしまい、そこから作られるフィーチャーファイルのサイズがほぼ2倍に膨れ上がってしまった、とCloudflareは説明しています。

2. 「デカすぎる設定ファイル」でネットワークソフトがクラッシュ

このフィーチャーファイルは、その後、世界中のCloudflareサーバー(エッジサーバー)に配布されます。各サーバーのネットワーク制御ソフトウェアは、

  • 新しいBotの特徴を取り込むために定期的にこのファイルを読み込み
  • 「怪しいアクセスかどうか」を判断する材料として利用

という動きをしています。

ところが、このソフトウェア側には「フィーチャーファイルはこれ以上のサイズは想定しない」という上限値が設定されていました。今回のトラブルでファイルサイズがその上限を超えてしまい、

  • 上限を超えたファイルを読み込む
  • ソフトウェアがエラーを起こしてクラッシュ(異常終了)
  • 結果としてそのサーバーがトラフィックをさばけなくなる

という連鎖が、世界中のサーバーで一気に発生してしまった、というわけです。

3. 5分周期の謎:良いファイルと悪いファイルが“コイントス”状態に

では、なぜ5分おきに復活したり落ちたりしていたのでしょうか。ここにも、仕組み上の理由があります。

フィーチャーファイルは、Cloudflare内部のClickHouseデータベースクラスターで5分ごとに再生成されていました。このクラスターは、ちょうど権限周りのアップデート作業の途中で、

  • 新しい権限設定が反映されたノード
  • まだ古い権限のままのノード

が混在していた状態だったそうです。

その結果、5分ごとに行われるクエリが、

  • 「古いノード」に当たる → 正常サイズの“良いファイル”が生成
  • 「新しいノード」に当たる → サイズが2倍になった“悪いファイル”が生成

というコイントスのような運試しになってしまいました。悪いファイルが生成されると世界中に一斉配布され、多くのサーバーがクラッシュ。次の5分でたまたま良いファイルが生成されると、また復活する──これが「5分おきに落ちたり戻ったり」していた正体です。

 

 

注目したいポイント:インターネットは“設定1つ”で揺れる

個人的に一番グッときたのは、今回の障害が「高度なサイバー攻撃」ではなく、かなり地味な権限設定のミスから始まっていたという点です。インフラエンジニア界隈には「変な挙動が出たら、まず権限を疑え」という“あるある”があるのですが、世界規模のサービスでも同じなんだなと感じました。

もうひとつ大きいのが、Cloudflareが自社のミスをかなり赤裸々に公開していることです。データベース名や処理の流れ、設定ファイルのサイズ上限に関する設計の甘さまで含めて書き出していて、「痛いけれど、再発させたくない」という気持ちが伝わってきます。

そして何より、この一件は「インターネットの多くが、少数のインフラ企業にどれだけ依存しているか」を改めて浮き彫りにしました。ユーザーとしては、Xやチャットサービスが落ちるとついそのアプリだけの問題に見えがちですが、実際にはその裏にいる共通インフラのほころびが原因ということも少なくないんですよね。

ひとこと:ミスをどう共有するかも“インフラの品質”

今回のCloudflareのレポートを読んでいて感じたのは、「障害が起きないことだけでなく、起きたあとにどれだけ誠実に説明できるかも、インフラ企業の実力だ」ということです。もちろん、ユーザー側からすれば「まず落とさないでほしい」が本音です。ただ、複雑なシステムである以上、ゼロ障害はほぼ不可能です。

だからこそ、原因をできるだけわかりやすく言葉にして、技術的な細部も含めて公開してくれる姿勢には、ある種の信頼感も生まれます。インターネットを支える“縁の下の仕組み”は普段見えにくいですが、今回のようなレポートは、その内部を垣間見せてくれる貴重な機会でもあるなと感じました。

まとめ:権限ミス1つが、世界の「つながる」を揺らした

2025年11月18日のCloudflare障害は、表側から見ると「XやChatGPTを含む多くのサービスが一斉に落ちた事件」でした。しかし裏側では、

  • データベースの権限変更がきっかけで
  • Bot対策用の設定ファイルが想定以上に肥大化
  • ネットワーク制御ソフトがクラッシュ → 世界中のサーバーが一時的に機能停止
  • さらに5分ごとに設定ファイルが再生成される仕組みが、周期的な障害を引き起こした

という、細かい歯車が重なった結果だったことがわかりました。

こうした話は、ふだんはインフラエンジニアの世界の出来事に見えますが、実際には私たちの日常の「当たり前に繋がる」感覚と地続きです。あなたが今日も何気なくiPhoneでニュースを読んだり、メッセージを送ったりできている背景には、こうした仕組みと、それを運用する人たちの試行錯誤があるんだな……と、ちょっとだけ想像してみるのも面白いかもしれません。

ではまた!

Source: 9to5Mac, Cloudflare