Skip to content
reader.me

OCR PDF — 提取文本

从扫描的 PDF 中提取可搜索文本。使用 Tesseract 在本地运行。

处理: application/pdf

处理 ≤ 50.0 MB

About this tool

从扫描的 PDF 中提取可搜索文本。使用 Tesseract 在本地运行。

All processing happens in your browser. Your PDF never uploads to our servers. No account required, no usage limits.

常见问题

此 OCR 工具免费吗?

是的,完全免费,无使用限制,无需账户。

我的 PDF 会上传到服务器吗?

不会。Tesseract 通过 WebAssembly 在您的浏览器中运行 — 您的 PDF 永远不会离开您的设备。

首次使用需要互联网连接吗?

需要。首次选择语言时,我们从 Tesseract CDN 下载约 12 MB 的训练数据。之后,OCR 完全离线工作。

支持哪些语言?

英语、西班牙语、法语、德语、意大利语、葡萄牙语、荷兰语、韩语和日语。多语言文档可用 "+" 组合两个(例如 eng+spa)。

输出是什么格式?

可搜索的 PDF(原始布局 + 不可见文本层)或纯 .txt。