Skip to content
reader.me

OCR PDF — テキスト抽出

変換

スキャンされたPDFから検索可能なテキストを抽出します。Tesseractでローカル実行されます。

PDFをここにドロップ

処理 ≤ 50.0 MB

このツールについて

スキャンされたPDFから検索可能なテキストを抽出します。Tesseractでローカル実行されます。

設計による プライバシー

すべての処理はブラウザ内で行われます。PDFはサーバーにアップロードされません。アカウント不要、使用制限なし。

使い方

  1. 1PDFを選ぶ — デバイスから出ません
  2. 2必要に応じてツールを設定
  3. 3結果をダウンロードに保存

よくある質問

このOCRツールは無料ですか?

はい、使用制限もアカウントもなく完全に無料です。

PDFはサーバーにアップロードされますか?

いいえ。TesseractはWebAssemblyでブラウザ内で実行されます — PDFがデバイスから出ることはありません。

初回利用にはインターネット接続が必要ですか?

はい。言語を初めて選択する際、Tesseract CDNから約12 MBの学習データをダウンロードします。その後、OCRは完全オフラインで動作します。

どの言語に対応していますか?

英語、スペイン語、フランス語、ドイツ語、イタリア語、ポルトガル語、オランダ語、韓国語、日本語。多言語文書には「+」で2つ組み合わせてください(例: eng+jpn)。

出力形式は何ですか?

ページごとに抽出されたテキストを含むプレーンな.txtファイル。検索可能なテキストレイヤー付きのPDF/Aエクスポートは今後のアップデートで提供されます。