OCR
OCR(Optical Character Recognition,光學字元辨識)會把文字的圖片,變成真正可選取的字元。一頁掃描檔或一張文件照片,對電腦來說只是一格格的像素:裡面沒有文字,只有一張剛好看起來像文字的圖片。OCR 會分析字母的形狀,重建底下那串字元。
結果通常會被寫回成一層看不見的文字,正好疊在原始圖片之上,因此頁面看起來仍像掃描檔,但現在可以搜尋、複製與建立索引了。現代引擎能處理多種語言、多欄與表格,而準確度高度取決於來源解析度:一張乾淨的 300 DPI 掃描檔,辨識效果遠勝過一張模糊的手機快照。Tesseract 這個開源引擎,正是大多數瀏覽器工具所依託的基礎。
由於 OCR 常常用在敏感文件上,例如發票、合約、身分證件,因此它在哪裡執行是個真切的隱私問題。reader.me 以瀏覽器內的 WebAssembly 進行辨識,因此頁面圖片與它產生的文字都留在你的裝置上,永遠不會被送往任何地方交給伺服器去讀取。