NAS 1号機(その3:zfsのraidz修復)

dump & restoreが完了したので、shutdownした後に、ada4をraidzの5個目のHDDと交換して再度boot upした。
起動後、自動的にada4の修復が始まり、34時間近くかかって修復が完了したんだけど、checksum errorが一杯発生してしまった。

% zpool status
  pool: onion
 state: ONLINE
status: One or more devices has experienced an unrecoverable error.  An
        attempt was made to correct the error.  Applications are unaffected.
action: Determine if the device needs to be replaced, and clear the errors
        using 'zpool clear' or replace the device with 'zpool replace'.
   see: http://illumos.org/msg/ZFS-8000-9P
  scan: resilvered 3.26T in 1 days 09:43:39 with 0 errors on Tue Oct 20 16:16:47 2020
config:

        NAME                        STATE     READ WRITE CKSUM
        onion                       ONLINE       0     0     0
          raidz1-0                  ONLINE       0     0     0
            ada0p2                  ONLINE       0     0     0
            ada1p2                  ONLINE       0     0     0
            ada2p2                  ONLINE       0     0     0
            ada3p2                  ONLINE       0     0     0
            diskid/DISK-XXXXXXXXp2  ONLINE       0     0   198

errors: No known data errors

しかし何故checksum errorが発生したんだろう。不安だったのでscrubしてみたら

% zpool status
  pool: onion
 state: ONLINE
status: One or more devices has experienced an unrecoverable error.  An
        attempt was made to correct the error.  Applications are unaffected.
action: Determine if the device needs to be replaced, and clear the errors
        using 'zpool clear' or replace the device with 'zpool replace'.
   see: http://illumos.org/msg/ZFS-8000-9P
  scan: scrub repaired 4K in 0 days 09:14:51 with 0 errors on Wed Oct 21 01:34:18 2020
config:

        NAME                        STATE     READ WRITE CKSUM
        onion                       ONLINE       0     0     0
          raidz1-0                  ONLINE       0     0     0
            ada0p2                  ONLINE       0     0     0
            ada1p2                  ONLINE       0     0     0
            ada2p2                  ONLINE       0     0     0
            ada3p2                  ONLINE       0     0     0
            diskid/DISK-XXXXXXXXp2  ONLINE       0     0   199

errors: No known data errors

またchecksum errorが増えてしまった。(zpool clearせずにscrubしたので、今回は1個エラーが発生したことになる。)不安ではあるが、一旦checksum errorをクリアして、後日、再度scrubしてみることにした。それよりも、ada4p2にならずdiskid表示のままなのが見た目が悪くて気になる。ada4p2表示に戻す方法が判らない。表示の問題だけでなく、このままではada4だけgpartで操作することができないのも面倒。今後のメンテナンスでも判りにくいのでgpt labelを使うことに方針変更し、live USBでshellを起動した後、

# zpool import -R /mnt -d /dev/gpt onion
# zpool status
  pool: onion
 state: ONLINE
  scan: resilvered 172K in 0 days 00:00:02 with 0 errors on Wed Oct 21 09:36:35 2020
config:

        NAME                  STATE     READ WRITE CKSUM
        onion                 ONLINE       0     0     0
          raidz1-0            ONLINE       0     0     0
            gpt/freebsd-zfs0  ONLINE       0     0     0
            gpt/freebsd-zfs1  ONLINE       0     0     0
            gpt/freebsd-zfs2  ONLINE       0     0     0
            gpt/freebsd-zfs3  ONLINE       0     0     0
            gpt/freebsd-zfs4  ONLINE       0     0     0

errors: No known data errors
# zpool export onion
# reboot

これでgpt labelで表示されることになり、gpart show ada4等も無事動作するようになった。

その2へ戻る その4へ続く