間違ってシステム破壊して地獄を見た話。【ごめんなさい】
こんばんは。最近アニメを見る時間すらもったいないと思ってる系オタクです。
話は変わりますが本日の12時頃から18時頃までこのサイトにアクセスできなくなる障害が発生しておりました。重ねてお詫び申し上げます。m(_ _)m
<復旧完了>
【2021年3月15日 17時45分】に認証関係の修復及びサーバーの連結作業・クリーンアップ等の安定化処理がすべて完了し、ブログ等の各種サービスの復旧・正常稼働の確認をしました。<該当URL>https://t.co/fgNWCZcB7z
ご迷惑をおかけし申し訳ございませんでした。 https://t.co/WRl2AgXlbh
— tomomi(Webアプリ作ってるオタク) (@tomox0115) March 15, 2021
復旧までの6時間、私は青ざめながら格闘したので日記っていう形で残しておきます。
地獄の発端
今回、なぜ問題が起きたのかを正直にお伝えします。
Python3.7をソースコンパイルしてインストールしたのですがMakeエラーが。そこで間違ってapt(パッケージマネージャーね)を使って消した。その際、apt autoremoveを「無心で」してしまった。
ですがautoremoveした中にネットワーク関連のパッケージも入っていた。
そんな事も知らず結果反映のために再起動。←ハイ死亡。
具体的な症状
再起動したため、SSHを含むすべてのネットワークが不通に。
リモートホストとしてLinuxを使っていたのでSSH接続はシステムの命綱なんです。
ですがネットワーク系統が全不通。
もちろんネットワーク系が逝ったのでApache Webサーバーも稼働できない。
↑これがサイトが落ちた原因です。
そこでとりあえず保管しているファイルだけは救出しようと思いConoHa標準のSFTPを使おうとしたら遮断。そりゃそうだよね。ネットワーク逝ってんだもん(泣)
どうしよう、さぁどうしよう。
幸い、ConoHaVPSにはローカル接続経由の管理コンソールがDashboardで使える。一応コマンドラインで操作を。
GitHub経由でバックアップしようとかLaravelの簡易サーバー機能でダウンロードしようとか馬鹿げた案もあったんですけどSSH系統の不備でなくネットワークが完全に終わってることを「ping」で確認。
ping 182.22.59.229(←YahooのIPアドレス)
って打ってもUnreached Server.みたいなこと言われてアァ…終わった。。。
おそらくネットワークドライバ関連だろうと思い解決策を探そうとするもConoHaのハードウェア関連についてもわからないから打つ手なし。
VPS再構築すればいいんだけど再構築したらこのサイトも消える!
そしていろいろサーバーについて調べ上げてたらようやく解決への兆しが。
解決法
以下の通りクソめんどいです。。。
ネットワーク系が逝ったので標準機能の追加ディスクをマウントして~を行いました。
超大変なんですけどデータを復旧できるなら致し方がないです。
追加ディスク(3.5円/時間)を購入し、障害が起きたVPSに連結。
ディスクをマウントしてファイル移行。
もちろんデータベースやApacheのバーチャルホスト設定もオールバックアップしてから旧VPSとの連結解除し独立させる。
そして、新たにSFTP接続用のVPSを契約(もう解除済み)し、さっきの追加ディスクを連結。
SFTPを使ってダウンロード。
tar.gzに圧縮して1.49GBでした。おおいなぁ…
そしてサーバー再構築。
私の好きなUbuntuです。
ちゃんと起動できました。(当たり前)
SFTPも稼働しているのでリストアしまくる。
日本語対応をして、
Apacheも復活!
そして、18時頃完全復活。
伝えたいこと
apt autoremove を信用するな!
これです。ちゃんとautoremoveの内容を確認しましょう!!!!!