2010年11月19日金曜日

霜月十八日

先日、10冊の本をデジタル化するのに1時間と書いたが、1時間半ぐらいかかるようだ。
で、少し考えた。

仮にこの労働に時給1000円の価値があるとすると、90分で10冊の図書を処理するわけだから、1冊あたり150円のコストがかかることになる。
この作業に主に投入する機材として、スキャナとKindelが挙げられるが(裁断機とPCは除く)、両者のコストを6万円とし、減価償却に1200日(つまり使えなくなるまで約3年半)かかるとする。
一週間に30冊の本をデジタル化すると仮定すると、一年間には約1500冊、3.5年では5000冊オーバーが処理されることになる。つまり1冊あたり12円である。まぁ、現実にはそこまで大量の本を処理するわけでもなし、出来るものでもないので、20~50円ぐらいになるだろうか。
合計すると、一冊当たり180円前後のコストがかかっているわけである。

これは果たして妥当なコストなのだろうか。
文庫もしくは新書をBookoffで、100円で買うとするなら、だいたい300円ほどの出費というわけである。
状態のいいやつを400円程度で買う場合でも、500円。
まぁ、手が出ないとか腹にすえかねるとかそういう感情は湧きそうにない。

将来的にはDXあたりの9インチモデルを買い、論文なんかも抹殺したいところである。
ただし、学術書は註をチェックする必要が多いので、ページ送りが感覚的に行えない電子書籍は今一つ向いていない。一方通行的に読む小説などの読み物には向いているのだが。
このあたりが電子書籍が紙に劣る点だろう。ちょっと、うまく解決する方法を思い付けそうにない。

2010年11月14日日曜日

霜月十四日

我が蔵書のデジタライズ作業は、毎週40冊を目標としている。
その根拠は、裁断を行う場所である大学に持ち込みやすい小型カバンには8冊が丁度入るようになっており、理屈の上では5日通うわけだから8*5=40冊というわけである。
もちろん、現実にそんな風に行くとは全く思っていない。

ある程度裁断した本を貯めておき、この週末にかけてデジタライズしてみたのだが、日産10冊あたりが目処のようである。
工程としては、

1. スーパーファインのカラーモード(300dpi)で取り込み
2. 取り込み原稿からPDF Knifeを用いて、最初と最後の3頁(巻頭挿絵などのカラー頁がある場合はそれも)を分割。
3. スーパーファインの白黒モード(600dpi)で2の部分以外を取り込み
4. pdfpdfpdf.comを用いて2と3を結合
5. ChainLPを用いてトリミング
6. Kindleにファイルを転送後、KinColEditorを用いてコレクションの反映
7. 2および4で出来たファイルはバックアップ用に保存

という段取りである。だいたい10冊で1時間ほどかかるだろうか。
最初から白黒だけでやればもっと早いのだろうが、将来、カラー化導入の可能性を踏まえ、一応残しておく。また、カラー版での取り込みは、裁断ミスなどのチェックを兼ねている。
作業に取りかかる前は、大した手間は要るまいなどとたかをくくっていたのだが、存外に作業量が多い。手際よく処理するようつとめると、他の仕事などとてもしていられない。

つまるところ、意外と面倒なので、仮に裁断をしっかり40冊やったとしても、週に四回もこれをやっていられるかどうか分からないのである。
ただし、10冊なら10冊分の処理をすれば、その分のスペースが空くというのは快感である。
なんというか、ある種かさぶたをはがすときの快感というものに近かろうか。その手の性癖には今ひとつ疎いので、適当なのかどうかは分からないが。
もっとも、これまでぎりぎりにまで詰め込んできているので、多少減ったとしても、実感できるほどの変化はまだない。
文庫本及び新書サイズのストックでさえ、ざっと見たところ2~300冊はある。部屋の随所に詰め込んであるモノを開放すれば、その数倍はあるだろう。実家に置いてきたものを含めれば、更にその倍はあるかもしれない。
まぁ、仮に隔日で一年間この作業を行うとしたら、およそ1000冊ほど片付くわけである。さすがにそれだけ減らせれば、ずいぶんと変わるだろう。
先は長いので、のんびりやる所存である。

2010年11月13日土曜日

霜月十三日

図書館において、僕の仕事は、ひとことでいえば「雑用」である。

一応、表芸は遡及、つまり古典籍の書誌情報の作成になるのだが、こちらは手下に任せれば問題ない体制を作り上げたので、僕自身はほとんどタッチしない。トラブルシューティングと各担当の調整、作業計画の立案及び評価が仕事である。
……いやまぁ、バイトのする仕事じゃないというかどう見ても管理職です本当に(ry

で、今年度からメインになりだしたのがリポジトリ。これについては折々触れている。

もうひとつは、貴重書の管理。こいつは表芸とも一応関係する。現時点でほとんどの貴重書が遡及されていないので、いつかは作業対象となるためだ。
もっとも、下手に遡及してオンライン検索が可能になると、わけのわからない連中が見せてくれと世界中(文字通り)から押し寄せてくる可能性が馬鹿にならないほどあるので、上司は乗り気ではない。僕も、まぁ同意見である。

代わりに、デジタル撮影して画像をアップロードし、それを見てもらう。デジタルアーカイブという作業だが、これも表芸のひとつ。
もちろん、撮影やサーバーの管理などは僕の手に余るので、それらについては内部や外部の専門家に委託することになる。
僕がするのは、撮影対象のリスト選定である。

貴重書はマスターカードと呼ばれる資料整理カードと、それをまとめた函架簿と呼ばれる台帳によって管理される。いちおう、貴重書目録も公刊されているのだが、戦前に編纂されたものは、さすがに古すぎ、最近になって編纂されたものは、あいにくと出来が悪すぎるため、どちらも使い勝手が悪い。
仕方ないので、数年前に函架簿からExcelにデータを入力した。全部で6000件ぐらいはあるだろう。
面倒な作業だったが、今ではこれが作業管理のベースとなっているのだから、ま、やっておくべき仕事ではあったのだろう。

で、このExcelのシートを眺めながら、撮影対象を決めるわけである。
仏教系大学であり、非常に多くの資料を引き継いでいることから、ラインナップは豊富である。当然、仏教書が中心となり、次いで日本文学関係。そして史料関係。
僕の本業からして、本当は史料類を優先して公開したいのだが、まぁ、一般受けしそうにないので、そこはある程度抑える。予算には限りがあるためだ。
一般受けしそうな絵の入る図書を選び、また源氏物語や平家物語のような冊数の多い図書を収め、その周辺に史料類を放り込むというようにして埋めていくわけである。

例年は僕一人で決めていたのだが、今年は日本文学を専攻する同僚にもリストの一部を渡し、助言を求めた。常日頃から、東京方面の研究者たちがウチの蔵書について知りたがっていると聞かされていたので、何ならそういう人たちの中で信用できる人に、こっそりと検討してもらってもかまわないと言っておいた。

数日後、返事が返ってきた。
どうも、僕が選んだリストは、刺激が強すぎるものらしい。そこからさらに厳選したリストを作成して向こうさんに見せたそうなのだが、それでもかなり興奮していたそうな。

なんでも、東京方面の大学が持っている本は、すべて研究されつくしているそうな。
こちらが昔から抱え込んできた本は、いわば「未発掘」の資料らしい。
ウチの大学は、いろんな意味で閉鎖的であり、外部への情報発信にあまり熱心ではない、らしい。まぁ、それは僕にもある程度わかる。
大学の格からすると不相応なほど充実した資料を持っているので、あまりよそへ出歩く必要がないのだ。
さすがに近年はそうも言ってられなくなっており、こうした傾向がいろいろと足を引っ張っているのだが、それは措く。
話を戻して、そういうわけで東京方面の研究者からすると、閉まったままの宝箱的な位置づけにあるらしい。

同僚から、「このリスト、安易に公開しないでくださいね」とのお言葉をいただいた。
下手をすると、研究者からストーカーじみた真似をされかねないですよという、冗談とも本気ともつかない忠告を受けた次第である。

ついでに、リストには史料関係もいろいろと載せておいたのだが、これもまずいらしい。
ウチの大学、というか本家は、日本史上のあれやこれやに関わっており、白い歴史も黒い歴史も有している。
図書館とは別に、史料編纂室というのがあって、そこでは保管された史料からいわゆる正史を編纂しているのだが、その一部は図書館にもあるわけである。
こういうところで編纂された「正史」は、要するに白い歴史である。黒い部分は表に出ない。
図らずも白か黒かも判じかねる史料を公表しようとしたわけであり、これはかなりのリスクを伴うというのが、同僚とその師匠の懸念するところであった。

一応、僕の意識は歴史屋さんであり、史料に黒も白もあるかというのが正直なところである。というか、白い史料は放っておいても表に出るはずなので、むしろ黒い史料こそガンガン公表すべきであると思っている。
とはいえ、独善からそこまで踏み込んでしまうと、被るリスクが大変なものとなりかねない。実際に火の粉を浴びるのは、正規の職員である上司や課長あたりになるのだろうが、万一、身分の保証なぞ皆無の僕にまで及んだ場合、速攻で首が飛ぶことになる。

また、非公開(ではないのだが、みんなそう思っている)の資料を公開すると、一部の教員が心証を悪くしかねないとも言われた。資料の公開性・共有性が研究の大前提であると思っている僕からすると噴飯ものだが、「俺の資料を勝手に公開するな」的な先生様は、存外に存在する。そういう人に限って、ロクに論文も書かない……かどうかは知らないが、少なくともそう忠告してくれた同僚は、自身の経験としてひどい目にあったことがあり、僕からするといささか過剰なほど、この手のリスクを警戒している。

結論として、大学の先生の集まる委員会にリストを提出し、その裁可を受けるという案をひねり出した。これなら、面倒が起きた場合には先生方が引き受けるという建前というかエクスキューズを作ることができる。
上司は、寝た子を起こすことになるのではないかと懸念しているが、まぁ判断するのは課長である。
その課長は来週頭まで出張しているので、それからの話になるだろう。


などと、例によってnoriともりりんに話したのだが、「クトゥルーの世界だな」とか言って笑っていた。
僕は、冒頭あたりで原因不明の死を遂げる図書館職員というわけである。
死ぬ時には携帯に向かって意味不明の言葉を叫べるよう、用意を整えておかねばなるまい。

2010年11月11日木曜日

霜月十一日

気になった記事二点。

カラー対応E-Inkを実戦投入するとの記事が出た。
おそらく、近いうちにKindleにも搭載されることになるだろう。
現行のKindle3では、基本的に白黒である。電圧によって白と黒のどちらかを表示するというE-Inkの原理からしてカラーは無理と思っていたのだが、色付きのフィルターを通すことでそれを可能にしたとのこと。
これにより、大きな変化がもたらされそうな気がする。
僕は基本的に文庫や新書などの文字情報を電子化するためにKindleを用いているのだが、コミックを読むにあたっても、これで実用的になる。4096色というから、まず問題なかろう。
また、古い本で黄変したページなんかも、これでいちいち調整する手間が省けるというものである。
まぁ、その分重くなりそうだが、プレゼンによると2割程度処理速度が上がっているそうだから、相殺されるのではなかろうか。
市場に投入され、レヴューが出るまでしばらくかかりそうだが、今から楽しみである。


例の衝突ビデオ流出事件について、毎日新聞論説副委員長の与良正男が尖閣ビデオが示すことというコラムを書いた。
内容はともかくとして、

職員が「ネットが最も手っ取り早く、効果的だ」と判断したのだけは間違いないはずだ。そして、これは内部告発の有効手段として今後、拡大していくだろう。それが今回のビデオ流出が示す、もう一つの側面だ。

という一節が目を引いた。
今回の騒動で、ごく初期のころからニコニコや2chなどで言われていたことは、新聞やテレビなど、従来型メディアではなく、ユーチューブという動画サイトが利用されたことである。つまり、従来型メディアでは取り上げられない可能性があるため、つべに上げたというわけである。
こうした世界は昔から反権力・反体制の傾向が強く、その延長上として従来型メディアも槍玉に挙げられることが多かったのだが、その是非はともかくとして、従来型メディアによる報道の中で、なぜ従来型メディアではなくてユーチューブだったのかということを取り上げたものは、これが初見である。大して熱心に記事をチェックしているわけでもないので、見落としているだけの可能性も高いが、まぁそれは措くとして。

今回のような政治的に大きな影響を及ぼす告発については、今後も同様の傾向が続くのではないかと思う。もう少しうまくやれば、足跡を残さずにやれると思う人間がいてもおかしくないし、ウィキリークスのような告発サイトを使う人間も出てくるだろう。
いずれにせよ、従来型メディアに対する不信感の表れと考えると、興味深いことである。

2010年11月8日月曜日

霜月八日

先週金曜日は、いわゆる学祭のため、仕事はお休みである。
有休をもらえない身では、平日の休みというのは貴重である。まぁ、金が入らないことには変わりないが。

というわけで、人文研へ赴いた。
目的は『清塩法志』のコピー。先日から進めている四庫全書所収の地方志に記載された塩政史料と比較するためである。
以前にも書いたが、四庫全書の史料は、おおむね康煕末年から雍正年間頃、17世紀末から18世紀初め頃の情報を記載している。で、『清塩法志』は19世紀後半以降、清末の情報を記載している。
この両者の行塩数を比較し、大きな変化が見られないなら、清朝は清代中期以降の人口増加に伴う塩需要の増大に積極的な手を打たず、その分を私塩に委ねていたということになる。

そのことにどういう意味があるのかというと、清の財政構造は、需要に対して柔軟に供給を増やせるようにはなっていなかったということが言えるわけである。少なくとも財政の三割から五割程度を占める塩政においては。
安定期なら問題ないが、財政需要が増えてきたとき、それに対応できずに王朝が滅亡したのではないかというのが、立証しようとしている仮説である。
そしてそういう硬直した財政構造は、明と清という近世中国の王朝が共通して持つ性質ではないのかというのが、その先の話である。
まぁ、結論ありきで研究を進めているわけではないし、近世中国の財政が塩政だけで構成されているわけでもないので、先は長い。


まー、週末から今日にかけて、そのコピーで何か仕事をしたわけではないので、ダメな感じだねぇ。
ちなみに酒に溺れながら何をしていたのかというと、M&BとICと……加えて、裁断した図書をScansnapで読み込み、色々と。
Kindleは白黒しか読まないので、カラーやグレースケールだと表示できない。白紙部分の閾値を上げてグレーを落とし、文字部分のガウス値を上げて補正すれば上手く行きそうな気もするが、古い本だと白紙が黄変しているのでY値を落とすよう補正せねばなるまいのだろうが、Photoshopを持っていないのでそんなこと出来ないし(GIMPでできるかもしれないが)、基本的に文字が読めたらそれで良いので、白黒で良かろうと思う。

この結論にたどり着くまで、ずいぶん試行錯誤した。一般に600dpiが自炊業界の標準解像度だが、S1500の白黒だと1200dpiというものまで試せる。
で、試してみたのだが、あまり差はなかった。容量がでかくなった分、頁めくりが遅くなったので、かえって使い勝手が悪い。電子インクを使うKindleはレスポンスが遅いという宿命があるため、頁めくりの遅さはかなり都合が悪い。
結局、スーパーファインモードを使い、表紙部分(および巻頭に挿絵類があるならそこも)のみカラー(300dpi)で撮り、本文は白黒(600dpi)ということにした。量の少ないカラー頁ぐらいは600dpiでやっても良かったかもしれない。

で、そうして出来たPDFファイルにChainLPを当てて余白部分を切り落とす。これをやると頁のサイズがまちまちになるのだが、余白の分だけ頁が小さくなったことで、相対的にズームされて読みやすくなる。
もう少し細かく設定すれば均等な寸法でトリミングできるのだろうが、面倒なのでそこまで調べていない。

職場でリポジトリ作業を担当していることもあり、こういう作業と仕事とが頭の中で連動するようになってくる。主務担当の同僚も同じ事を言っていた。
まぁ、無駄にはならない経験だろう。もうしばらく色々と試してみたいところである。

2010年11月3日水曜日

霜月三日

Scansnap S1500が届きにけり。

正直、これを買うのは結構迷っていた。発売から一年半ぐらい経っているので、昨今の自炊ブームの盛り上がりからするに、新製品が出てもおかしくない故。
とはいえ、出るかでないかわからない新製品を待つよりも、時間を買った方がマシであるとの判断を下した。

基本的に、僕がこれを使うのは、小説か新書あたりのサイズの図書をスキャンするときである。
つまるところkindleで読めるサイズというのが大前提なので、新書よりも大きなサイズだと都合が悪い。kindle DXやiPadを導入するなら話は別だが、当分は縁のない話である。
本当を言うと、日本語の歴史系論文で一番良く使われているA5サイズの図書を読めるDXサイズは、欲しいんだけどねぇ。それがあればウチにある論文のコピーの半分以上を粛清できるし。
現時点では色々と問題があるので、そこまでは踏み込めないとの判断を下しているので、まぁ二三年先の話になるだろうな。

すでに数冊の本を大学の電動式裁断機でぶった切っており、準備は万全である。
早速、スキャンにかける。
早い。これまで使っていたのだが一世代前のS500なんだから当然だが。それにしても早いのは快感である。すくなくともその早さに慣れるまでは。

学術雑誌だと、背表紙面に使っているノリが本紙の結構中側にまで浸みており、裁断機にかけても頁がバラバラになっていないことがある。
この点、さすがに商業用の文庫や新書だとかなりぎりぎりのラインで裁断しても問題なかったのだが、やはりあまり攻めすぎると頁が切り離せて居らず、エラーを引き起こすことになった。
ついでに今頃気付いたのだが、この手の本は薄い紙を使っている。やはり学術雑誌用の紙よりは良いものを使っているらしい。おかげでジャムりやすいような気がして落ち着かない。
文庫の場合、文字の位置も、結構綴じ代近くにまで配置されているため、裁断位置にあまり余裕を持たせすぎると、文字を裁断しかねない。難しいところだ。
ついでに、二枚同時に巻き込んでしまうトラブルは、一応は起きていないようだが、安心は出来ない。
しかし、これを確認するためには全文を読むしかないわけで(総頁から割り出せるかと思ったが、頁表記のない部分が多いため、あまり現実的ではない)、スキャニング後は裁断された図書を処分してしまう以上、どうにもならないような気がする。

なお、まだトリミングやなんやで結構処理する必要のあることは多いのだが、それは明日にでも仕事場で行うことにしよう。トリミングはAcrobatのあるこちらやるしかないが、リネームその他の作業はどこでも出来る。
ついでにこの次裁断すべき本も持って行っておこう。暇なときにはどんどんぶった切っておかないと、予想よりもスキャンに要する時間が短いので、追いつかれてしまう。
が、一応大学でやる作業なので、ラノベとかは見られると気まずかろうなぁ。というか、あまり下手を打つとまずいことになるかも知れない。ラノベ程度ならまだしも、コミックとかだと下手を打ちすぎるとまずかろう。
まぁ、ほどほどに、かつ上手くやるということで。

にしても、ファファード&グレイ・マウザーやコナンといった、往年の洋物ファンタジーを裁断していたのだが、こいつらはいわゆる「ラノベ」に入るんだろうかねぇ。