2012年2月5日日曜日

Managing books.

#1 Scanner and OCR
いわゆる本の自炊生活の話。どっかでしたかもしれないししてないかもしれない。

前の病院の上司から安く譲ってもらったScansnap S1300が意外と使い勝手がよく、どうしようもない書類なんかをスキャンしている。

まぁ実際はそれすらめんどくさいんだけど。

ただ、書類がどんどん溜まっていく一方なのでどっかでいるだろうけど、紙である必要がないものについては(ページ数が少ないものは優先して)PDFベースにしている。

ところが、Scansnapの付属のOCRは結構貧弱で誤認識が多い。

できた書類の実際の使い方はPDFを開く→検索をかける→該当する箇所を読む、という流れなのでキーワードくらいはきちんと認識して欲しい、という程度。

というわけで読取革命を買ってみた。

感想:まぁまぁよい。ただ、オートでレイアウトを選択にすると枠がずれる(まだ使い始めて間も無いので改善する方法があるのだろう、多分)。

#2 What book is best for PDF?
さすがに外科病理学とかAckerman Surgical Pathologyを電子化しようとは思わない(Ackermanはonlineアクセスがあるけど)。

でも漫画や文庫本など比較的小さい本ならいいかもと思った。ほとんどがパソコンやiPad(or equivalent)で読むのでその画面より大きい本は拡大、縮小を繰り返さないといけないので読みにくい。

ただ、あくまで読み通す前提での話で、調べるためだったらあまり関係ないのもしれないけど。

#3 Data is like entropy
まあデータというのはエントロピーと一緒で?捨てなけりゃ常に増大する。

このブログのどこかで書いたかもしれない、大学卒業時に数十GB(取り込んだファイルを除けば数GB)だとして、今は軽く数百GBになっている。Virtual slidesを取り込みだしてから幾何的に増え続けている(あれどうしようかとちょっと考え中)。

このまま行くと多分死ぬまでには数百TB?位になるだろう。でもそれも1枚の(多分次世代)ディスクで記録できるのだろう。

となると、遺骨を残しておくよりもその人の活動記録(生まれた時から葬式まで)が全部入ったディスク1枚を残しておいてもし回顧することがあれば面白い。「ほら、おじいちゃんの若いころよ」なんて。

でも変な画像があったら「見なかったことに」とか言って捨てられるかも。

0 件のコメント: