OCR

OCR (Optical Character Recognition, reconocimiento óptico de caracteres) es la tecnología que convierte la imagen de un texto en texto real, seleccionable y buscable. Cuando escaneas un papel o haces una foto a un documento, lo que obtienes es una imagen: el ordenador ve píxeles, no letras. El OCR analiza esos píxeles y deduce qué caracteres representan.

Técnicamente, el proceso pasa por varias fases: enderezar y limpiar la imagen, detectar las zonas de texto, segmentar líneas y caracteres, y finalmente clasificar cada símbolo. Los motores modernos, como Tesseract, usan redes neuronales entrenadas por idioma, así que elegir bien el idioma del documento mejora mucho la precisión. El resultado se suele incrustar como una capa de texto invisible encima de la imagen original.

El OCR de reader.me corre íntegramente en tu navegador con WebAssembly: la imagen se reconoce en tu dispositivo y nada se envía a un servidor. Para documentos escaneados que llevan datos personales, hacer el reconocimiento en local es la única forma de no perder el control sobre ellos.

Herramientas relacionadas

Más términos

AcroForm XFA Metadata Compression Embedded fonts Text layer

← Ver todo el glosario