Question 1

このOCRツールは無料ですか?

Accepted Answer

はい、使用制限もアカウントもなく完全に無料です。

Question 2

PDFはサーバーにアップロードされますか?

Accepted Answer

いいえ。TesseractはWebAssemblyでブラウザ内で実行されます — PDFがデバイスから出ることはありません。

Question 3

初回利用にはインターネット接続が必要ですか?

Accepted Answer

はい。言語を初めて選択する際、Tesseract CDNから約12 MBの学習データをダウンロードします。その後、OCRは完全オフラインで動作します。

Question 4

どの言語に対応していますか?

Accepted Answer

英語、スペイン語、フランス語、ドイツ語、イタリア語、ポルトガル語、オランダ語、韓国語、日本語。多言語文書には「+」で2つ組み合わせてください(例: eng+jpn)。

Question 5

出力形式は何ですか?

Accepted Answer

ページごとに抽出されたテキストを含むプレーンな.txtファイル。検索可能なテキストレイヤー付きのPDF/Aエクスポートは今後のアップデートで提供されます。

OCR PDF — テキスト抽出

このツールについて