2020/07/05(日)NILFS使用時にLinux Kernelエラーが起こる問題の解決策
最近の新しいLinux KernelでNILFS(NILFS2)を使用すると、最初の書き込み時に
BUG: unable to handle kernel NULL pointer dereference at 00000000000000a8
となるエラーの解決方法(対処療法)。
NILFSとは
ログ構造化ファイルシステムと言われる、ファイルを変更するたびに常にスナップショットを自動的に保存できるLinux標準サポートのファイルシステムです。
/home 以下などをNILFSにしておくと、間違えてファイルを書き換えたときや、間違えてファイルを削除したときに、1時間前や1週間前の状態に遡ってファイルを復元することができます。
間違ってファイルを削除(上書き)してまうこと、ファイルを直接変更してしまってから元に戻したいことは誰しもあると思いますが、NILFSならいつでも元に戻せるため人為的にミスにとても強く重宝しています。
新しいカーネルで動作不安定に
このNILFSですが、最近の(ここ1年ぐらいの)カーネルで動作不安定になる不具合があります。Debian 10.4をインストールした際にこの問題に当たってしまいました……。
調べるとカーネルのファイルキャッシュに対するちょっとした変更(パッチ)が原因となっているようです。解決策はLinux系のMLにありました(そしておそらく投稿者の記事)。
要約すると「NILFSをマウントする前に、ダミー書き込みをすれば良い」とのことです。
簡単な解決策
/etc/fstab では自動マウントせずに(noautoオプションをつける)、rc.localでマウントするように変更します。
dd if=/dev/sda6 of=/dev/sda6 count=1 mount /home
/dev/sda6 やマウント場所は該当のパーティション等に合わせてください。ddコマンドで512バイトほどダミー書き込みをしてからマウントします。たったこれだけで問題は解決します。
やや複雑な解決策
rc.local でマウントする方法では、NILFSパティーション以下にDBデータ等サービスで使用するデータを置く場合や/varがNILFSパーティションだった場合に問題があります。rc.local のタイミングでマウントするのでは遅すぎるからです。
ですので、理想としてはfstabでマウントする直前にダミー書き込みを実行したいのです。
Debian系のsystemd環境では以下のような設定ファイルを置くことで、fstab実行直前にダミー書き込みを実現できます。
# /etc/systemd/system/nilfs2-dummy-write.service [Unit] Description=NILFS2 dummy write DefaultDependencies=no After=local-fs-pre.target Before=local-fs.target [Service] ExecStart=/bin/dd if=/dev/sda6 of=/dev/sda6 count=1 Type=oneshot [Install] WantedBy=sysinit.target
ファイル作成後、サービスとして認識されたか確認します。
# systemctl list-unit-files --type=service | grep dummy nilfs2-dummy-write.service disabled
認識されているようなら、サービスを有効にします。
# systemctl enable nilfs2-dummy-write # systemctl list-unit-files --type=service | grep dummy nilfs2-dummy-write.service enabled
参考文献
まとめ
- NILFS/NILFS2はとても便利なのに利用者が少ない。
- パッチが出てるので、近々修正されるとは思う。
- systemdの勉強になった。