OCR

OCR（Optical Character Recognition，光學字元辨識）會把文字的圖片，變成真正可選取的字元。一頁掃描檔或一張文件照片，對電腦來說只是一格格的像素：裡面沒有文字，只有一張剛好看起來像文字的圖片。OCR 會分析字母的形狀，重建底下那串字元。

結果通常會被寫回成一層看不見的文字，正好疊在原始圖片之上，因此頁面看起來仍像掃描檔，但現在可以搜尋、複製與建立索引了。現代引擎能處理多種語言、多欄與表格，而準確度高度取決於來源解析度：一張乾淨的 300 DPI 掃描檔，辨識效果遠勝過一張模糊的手機快照。Tesseract 這個開源引擎，正是大多數瀏覽器工具所依託的基礎。

由於 OCR 常常用在敏感文件上，例如發票、合約、身分證件，因此它在哪裡執行是個真切的隱私問題。reader.me 以瀏覽器內的 WebAssembly 進行辨識，因此頁面圖片與它產生的文字都留在你的裝置上，永遠不會被送往任何地方交給伺服器去讀取。

相關工具

← 返回詞彙表