BD-Rの管理(その5:mysqlのcliで漢字が入力できました。現在DB構築中)

別のマシンからnetwork経由で接続してみたら、ちゃんとcliで日本語が入力できました。どうも、DBサーバにしたマシンの環境の問題だったみたいです。
ちょっと忙しいのと、実際にDB化の作業を行うのはBDドライブ付きのマシンからなので、原因究明は行っていません。
BDドライブは1個しか持っていないので、そのマシンから正常に作業できれば取り敢えず問題ないので。BD-Rを40枚程DBに取り込んでみましたが、titleの文字列がかなりいい加減なので、都度、scriptを微修正して対応中です。読み(ふりがな)を手で入力するのは面倒なので、ふりがな無しで済ませることにしました。libreofficeの時と違って、where title like '%ほげほげ%'で検索できるので、私の用途では、ふりがな無しで全く問題ないことが確認できました。今までoracleしかまともに触ってなかったので、mysqlに慣れるまでちょっと面倒ではありますが、mysqlを先に覚えたらoracleなんか使いたくないと思うだろうなぁという感じがします。取り敢えず、FreeBSD 13-current with udf2patchのマシンでBD-Rをread onlyでmountして、perlのscriptを走らせてmysqlへ取り込んでmysqlのclient terminalからviewを覗いて便利に使えることを確認している状況です。
BD-Rの個体を識別したかったのですが、よく判らなかったので、digaで1枚ずつdisk label(/BDAV/info.bdavの0x41番地からに格納される奴)を書き込んでいます。連続ドラマは基本的にtitleから話数を自動で抽出するようにしましたが、diga DMR-BW900で書き込んだものはやたら短いtitleにちょん切られているため、まれにtitleに含まれていた話数部分が欠落してしまっていることがあり、その場合にはBD-R上のtitleを新しいdiga(これはかなり長いtitleまで大丈夫)で修正してから読み取るようにしました。当初はDB上のtitleはBD-Rから読み取ったものを手で修正することを想定していたので、読み取ったままのtitleと修正可能なtitleの2個を格納していたのですが、1個だけにしても問題ない感じです。(disk labelを手動で書いているため、万一、誤って同一のラベルを異なるdiskに書いてしまっても大丈夫なように、DBに取り込むscriptでは取り込み済の値があればコンペアするようにしているため、修正前のtitleを残していました。修正した際だけ書くことも考えましたが、titleはkeyにしたいのでnullならもう1個のほうを見に行くという複雑なことを行って検索効率が落ちるのを嫌って、重複して格納しています。)

その4へ戻る その6へ続く