2010年9月18日土曜日

長月十八日

非常に困難なものであると予想された中国全土の塩政史関係データ入力だが、予想よりも好調である。

基本古籍庫のテキストデータは、200文字以内しかコピーできないという制約がある。
もちろんこれは悪用を防ぐためだが、使いにくいことには違いない。
が、それは我慢すればいい範疇の問題ではある。少なくとも手打ちで入力するよりは効率的だ。
で、文字位置調整のために改行部位には全角スペースを使っているのだが、これはExcelのデータ区切り機能を使い、スペースでデータを区切ってしまえばまとめてつぶせる。
これにより、例えば

成都縣行鹽陸引一千八百五十四張於簡州買鹽至本縣行銷  華陽縣行鹽陸引二千一百張於簡州買鹽至本縣行銷

という文字列は、

成都縣行鹽陸引一千八百五十四張於簡州買鹽至本縣行銷
華陽縣行鹽陸引二千一百張於簡州買鹽至本縣行銷


とふたつのセルに移しこむことができる。
さらに楽をしたいなら「鹽」と「於」などで切っても良いのだが、まぁそこまでせずとも各セルにほしいデータをコピペすればいいわけであり、その隣のセルに算用数字に置き換えた塩引数を入力するわけである。観数字を算用数字に置き換えることもできるだろうが、まぁそれもいい。
すると、

成都縣 陸引一千八百五十四張 1854
華陽縣 陸引二千一百張 2100


という感じになる。最終的にはこうして得られた数字を合計するわけである。

以上の作業は、ほとんどすべて四庫全書本のデータである。もう少しいろいろな時代の史料を欲しくもあるのだが、ある時代において網羅的に集められたデータというのは、建国当初を除けばなかなか得られないものである。四庫全書本のデータはおおむね雍正10年ごろのものなので、清中期ごろのデータとしては重宝するものになるだろう。

まぁ、やっぱり今月中で終わらせるのは無理だろうけど。

0 件のコメント:

コメントを投稿