OCR PDF — テキスト抽出
スキャンされたPDFから検索可能なテキストを抽出します。Tesseractでローカル実行されます。
処理: application/pdf
処理 ≤ 50.0 MB
About this tool
スキャンされたPDFから検索可能なテキストを抽出します。Tesseractでローカル実行されます。
All processing happens in your browser. Your PDF never uploads to our servers. No account required, no usage limits.
よくある質問
このOCRツールは無料ですか?
はい、使用制限もアカウントもなく完全に無料です。
PDFはサーバーにアップロードされますか?
いいえ。TesseractはWebAssemblyでブラウザ内で実行されます — PDFがデバイスから出ることはありません。
初回利用にはインターネット接続が必要ですか?
はい。言語を初めて選択する際、Tesseract CDNから約12 MBの学習データをダウンロードします。その後、OCRは完全オフラインで動作します。
どの言語に対応していますか?
英語、スペイン語、フランス語、ドイツ語、イタリア語、ポルトガル語、オランダ語、韓国語、日本語。多言語文書には「+」で2つ組み合わせてください(例: eng+jpn)。
出力形式は何ですか?
ページごとに抽出されたテキストを含むプレーンな.txtファイル。検索可能なテキストレイヤー付きのPDF/Aエクスポートは今後のアップデートで提供されます。