generated at
書き起こす書籍のパターン

ここでは、一般公開しても問題のない(著作権切れの)書籍を前提にします

1. とうの昔に著作権が切れて、国立国会図書館などで一般公開されている書籍。『ドン・キホーテ』島村・片山訳の書き起こしで使用している本はこのタイプ。見開き一頁ずつ画像データ化できるので、OCRを使って書き起こすことができる。ただ昔の本のため旧字旧仮名のことも多い。青空文庫旧字、旧仮名で書かれた作品を、現代表記にあらためる際の作業指針などの方針を用意している。

2. 著作権は切れているが、国立国会図書館などでスキャンデータが一般公開されていない書籍。理由はさまざま。現物を手に入れて適当な方法で作業するか、個人向けデジタル化資料送信サービスにあれば、それをを参照しつつ手打ちになる。

3. 著作権は切れているが、スキャンデータは一般公開されておらず、書籍も絶版となり手に入れるのが難しい書籍。古書として手に入れるか、図書館に赴いて探す。