Skip to content
reader.me

OCR PDF — 提取文本

转换

从扫描的 PDF 中提取可搜索文本。使用 Tesseract 在本地运行。

将 PDF 拖到此处

处理 ≤ 50.0 MB

关于此工具

从扫描的 PDF 中提取可搜索文本。使用 Tesseract 在本地运行。

架构层面的隐私保护

所有处理都在您的浏览器中进行。您的 PDF 永远不会上传到我们的服务器。无需账户,无使用限制。

工作原理

  1. 1选择 PDF — 永远不离开你的设备
  2. 2按需配置工具
  3. 3结果保存到下载

常见问题

此 OCR 工具免费吗?

是的,完全免费,无使用限制,无需账户。

我的 PDF 会上传到服务器吗?

不会。Tesseract 通过 WebAssembly 在您的浏览器中运行 — 您的 PDF 永远不会离开您的设备。

首次使用需要互联网连接吗?

需要。首次选择语言时,我们从 Tesseract CDN 下载约 12 MB 的训练数据。之后,OCR 完全离线工作。

支持哪些语言?

英语、西班牙语、法语、德语、意大利语、葡萄牙语、荷兰语、韩语和日语。多语言文档可用 "+" 组合两个(例如 eng+spa)。

输出是什么格式?

可搜索的 PDF(原始布局 + 不可见文本层)或纯 .txt。