Giới thiệu công cụ
Trích xuất văn bản có thể tìm kiếm từ PDF được quét. Chạy cục bộ với Tesseract.
Trích xuất văn bản có thể tìm kiếm từ PDF được quét. Chạy cục bộ với Tesseract.
Thả PDF vào đây
Xử lý ≤ 50.0 MB
Trích xuất văn bản có thể tìm kiếm từ PDF được quét. Chạy cục bộ với Tesseract.
Mọi xử lý đều diễn ra trong trình duyệt. PDF không bao giờ được tải lên máy chủ. Không cần tài khoản, không giới hạn sử dụng.
Có, hoàn toàn miễn phí không giới hạn sử dụng, không cần tài khoản.
Không. Tesseract chạy trong trình duyệt của bạn qua WebAssembly — PDF của bạn không bao giờ rời khỏi thiết bị của bạn.
Có. Lần đầu tiên bạn chọn ngôn ngữ, chúng tôi tải xuống ~12 MB dữ liệu được đào tạo từ CDN Tesseract. Sau đó, OCR hoạt động hoàn toàn ngoại tuyến.
Anh, Tây Ban Nha, Pháp, Đức, Ý, Bồ Đào Nha, Hà Lan, Hàn và Nhật. Trộn hai với "+" (ví dụ eng+spa) cho tài liệu đa ngôn ngữ.
Tệp .txt thuần túy với văn bản được trích xuất theo trang. Xuất PDF/A với lớp văn bản có thể tìm kiếm sẽ có trong bản cập nhật tương lai.