Question 1

Công cụ OCR này có miễn phí không?

Accepted Answer

Có, hoàn toàn miễn phí không giới hạn sử dụng, không cần tài khoản.

Question 2

PDF của tôi có được tải lên máy chủ không?

Accepted Answer

Không. Tesseract chạy trong trình duyệt của bạn qua WebAssembly — PDF của bạn không bao giờ rời khỏi thiết bị của bạn.

Question 3

Lần sử dụng đầu tiên có cần kết nối Internet không?

Accepted Answer

Có. Lần đầu tiên bạn chọn ngôn ngữ, chúng tôi tải xuống ~12 MB dữ liệu được đào tạo từ CDN Tesseract. Sau đó, OCR hoạt động hoàn toàn ngoại tuyến.

Question 4

Ngôn ngữ nào được hỗ trợ?

Accepted Answer

Anh, Tây Ban Nha, Pháp, Đức, Ý, Bồ Đào Nha, Hà Lan, Hàn và Nhật. Trộn hai với "+" (ví dụ eng+spa) cho tài liệu đa ngôn ngữ.

Question 5

Định dạng đầu ra là gì?

Accepted Answer

Tệp .txt thuần túy với văn bản được trích xuất theo trang. Xuất PDF/A với lớp văn bản có thể tìm kiếm sẽ có trong bản cập nhật tương lai.

OCR PDF — trích xuất văn bản

Giới thiệu công cụ