OCR PDF — 提取文本
从扫描的 PDF 中提取可搜索文本。使用 Tesseract 在本地运行。
处理: application/pdf
处理 ≤ 50.0 MB
About this tool
从扫描的 PDF 中提取可搜索文本。使用 Tesseract 在本地运行。
All processing happens in your browser. Your PDF never uploads to our servers. No account required, no usage limits.
常见问题
此 OCR 工具免费吗?
是的,完全免费,无使用限制,无需账户。
我的 PDF 会上传到服务器吗?
不会。Tesseract 通过 WebAssembly 在您的浏览器中运行 — 您的 PDF 永远不会离开您的设备。
首次使用需要互联网连接吗?
需要。首次选择语言时,我们从 Tesseract CDN 下载约 12 MB 的训练数据。之后,OCR 完全离线工作。
支持哪些语言?
英语、西班牙语、法语、德语、意大利语、葡萄牙语、荷兰语、韩语和日语。多语言文档可用 "+" 组合两个(例如 eng+spa)。
输出是什么格式?
可搜索的 PDF(原始布局 + 不可见文本层)或纯 .txt。