generated at
資料整形 (active読書)
以下の作業のこと
図表の切り出し
scrapbox書籍にしたページに貼り付けた画像から、図表だけを切り出す
元のPDFがある場合は、PDFに埋め込まれた画像を抽出するして取り出す
文章をテキストデータ、図表を画像データに分ける
文章の整形
段落ごとに空行を挿入する
↓の作業で段落の改行が区別できなくなるので、事前に分けておく
最終的な編集で段落分けがよくわからなくなることもある
改行を直す
空行で区切った塊ごとにやる
数式を\TeXに書き起こす
基本手書きtakker
Mathpix Snipを使える人はそっちのほうがいいと思う
OCRした数式をLLMで補正する方法もある
精度はまあまあ

#2023-12-15 07:58:20
#2022-11-17 05:57:36
#2022-09-28 09:04:49
#2022-09-27 10:33:57