Skip to content
reader.me
デバイス上で処理

OCR PDF — テキスト抽出

スキャンされたPDFから検索可能なテキストを抽出します。Tesseractでローカル実行されます。

処理: application/pdf

処理 ≤ 50.0 MB

About this tool

スキャンされたPDFから検索可能なテキストを抽出します。Tesseractでローカル実行されます。

All processing happens in your browser. Your PDF never uploads to our servers. No account required, no usage limits.

よくある質問

このOCRツールは無料ですか?

はい、使用制限もアカウントもなく完全に無料です。

PDFはサーバーにアップロードされますか?

いいえ。TesseractはWebAssemblyでブラウザ内で実行されます — PDFがデバイスから出ることはありません。

初回利用にはインターネット接続が必要ですか?

はい。言語を初めて選択する際、Tesseract CDNから約12 MBの学習データをダウンロードします。その後、OCRは完全オフラインで動作します。

どの言語に対応していますか?

英語、スペイン語、フランス語、ドイツ語、イタリア語、ポルトガル語、オランダ語、韓国語、日本語。多言語文書には「+」で2つ組み合わせてください(例: eng+jpn)。

出力形式は何ですか?

ページごとに抽出されたテキストを含むプレーンな.txtファイル。検索可能なテキストレイヤー付きのPDF/Aエクスポートは今後のアップデートで提供されます。