刺身の上にたんぽぽ乗せる日記

プログラミングしたり、自販機の下に落ちてる小銭を集めたりしてます

サーバが死んだ

https://www.mail-archive.com/debian-bugs-dist@lists.debian.org/msg1264075.html
Rescueで起動するとこれとそっくりな症状。なんと糞タイムリーな。

Welcome to Debian GNU/Linux jessie/sid!
[ 3.012374] <30> systemd[1]: Inserted module 'autofs4'
[ 3.038538] <30> systemd[1]: Set hostname to
[ 3.062844] <27> systemd[1]: Failed to create root cgroup hierarchy:
Invalid argument
[ 3.063076] <27> systemd[1]: failed to allocate manager object: Invalid
argument

以下復帰するために試した手順についてメモ。
試行錯誤でやって、なんとか動いた手順、というだけなので、恐らく正しい手順ではない。

  • grubdebianのrescueではなく、普通のやつを起動パラメータを修正して起動する。
    • eを押して修正モードに
    • linux ..... quietのquietを消してinit=/bin/bashにする。これでsystemdが走る前にbashに移れる
  • ファイルシステムがreadonlyで特に何もできないので、

# mount -o remount,rw /

これで書き込み可能に。
多分何度も失敗しながらやり直すことになるので、セットアップのコマンドをシェルスクリプトに保存しておく。emacsは動かなかったけど、jedは動いた。

#!/bin/sh
mount -o remount,rw /
/etc/init.d/networking start
ifconfig eth0 (server ip address) netmask (netmask)
route add default gw (gw ip address)
hostname broken
/etc/init.d/ssh start

これでネットにつながって、sshdが立ち上がる。nameserverの設定はやらなくても大丈夫だった。

あとは必要なサービスを動かす

/etc/init.d/nginx start
/etc/init.d/supervisor start

これでなんとかそれっぽく動くところまで持ってくることができるようになった。
systemdの208で起きる問題らしいので、バックアップが終わり次第ダメ元での215を入れようかと思う。

https://bbs.archlinux.org/viewtopic.php?id=176171
VPSとの相性でも起きる問題らしいので、cloudcore側に解決して欲しい問題なんだが、全く相手にしてくれなかった。腹立たしい。

追記:
上記の状態でapt-getは使えるようになったので、systemdの215を試してみるも直らず。
systemdをダウングレードするか別のinitを使うか迷って結局sysvinitにすることにした。dselectからsysvinit選ぶ。systemdの色々削るけど、めげずに選ぶ。再起動したら普通に動いた。