Com la IA llegeix els teus PDF (i per què el text extraïble importa)

La IA i els cercadors necessiten text real en un PDF, no una foto d'un. Aquesta és la diferència i com preparar els teus fitxers perquè els llegeixin bé.

AG Antonia González · 27 de juny del 2026 · 6 min de lectura

Enganxes un PDF en una eina d’IA i li demanes un resum. De vegades et retorna una resposta afinada. Altres vegades et retorna un disbarat, o un sec “no puc llegir aquest fitxer”. La mateixa eina, el mateix prompt. La diferència gairebé mai no és a la IA. És al PDF.

Un PDF no sempre és el que sembla

Obre dos PDF a la pantalla i poden veure’s idèntics. Per dins poden estar fets de dues maneres molt diferents.

Un té capa de text. Es va exportar des d’un editor de documents, un navegador, una app de factures, alguna cosa digital. Les lletres estan guardades com a caràcters. El fitxer sap que la paraula “total” és a baix a la dreta. La pots seleccionar, copiar, cercar.

L’altre és una foto d’una pàgina. Algú va escanejar un paper o li va fer una foto amb el mòbil i va guardar aquella imatge dins d’un PDF. Els teus ulls la llegeixen sense problema. Per al programari és una quadrícula de píxels amb forma de lletres, sense cap lletra a dins. Res per seleccionar. Res per cercar.

Prova ràpida: arrossega el cursor sobre una paraula. Si es ressalta, el text és real. Si et surt un requadre sobre tota la pàgina com si haguessis agafat una imatge, tens un escaneig.

Què veu la IA de debò

Aquí hi ha el que se li escapa a gairebé tothom. La majoria dels models de llenguatge llegeixen un PDF extraient-ne la capa de text. És la via barata, ràpida i precisa, i és la que funciona per defecte en moltes eines. Si la capa de text hi és, el model rep paraules netes i et dóna una bona resposta.

Si no hi ha capa de text, per aquella via el model no rep res. Una foto d’un contracte li lliura zero caràcters. Algunes eines aleshores tiren de visió sobre la imatge, cosa que pot funcionar, però és més lenta, costa més i endevina amb els escanejos bruts. Moltes altres es salten aquest pla B i et diuen sense més que el fitxer és buit.

Així que la qualitat de la resposta d’una IA sobre el teu PDF sol dependre d’una sola cosa: si hi havia text real per llegir, o si el model va haver d’aclucar els ulls davant d’una foto.

Els cercadors fan el mateix

Això no és només cosa de la IA. Quan un cercador indexa un PDF de la teva web, llegeix la capa de text. Un fullet escanejat sense capa de text li resulta gairebé invisible. La pàgina pot no posicionar per res perquè no hi ha res per indexar. Un PDF amb text seleccionable, títols i un ordre de lectura assenyat s’indexa com cal i pot aparèixer quan algú cerca el que hi ha a dins.

Els lectors de pantalla tiren d’aquesta mateixa capa. Una persona cega amb programari de suport escolta el text que el PDF exposa. Una imatge pura no n’exposa cap, així que llegeix silenci. El text real, amb estructura, és el que fa que el document funcioni per a qui fa servir un lector de pantalla i per a una màquina que el llegeix a gran escala. El mateix arranjament, dos públics.

Què vol dir “ben fet”

Un PDF que es llegeix bé per IA, per cercadors i per lectors de pantalla sol tenir tres coses.

Text real i seleccionable. Els fitxers nascuts en digital ja el porten. Els escanejos no, fins que ho arregles.

Estructura. Títols marcats com a títols, un ordre de lectura lògic, taules que de debò són taules. Això és el que deixa un model i un lector de pantalla seguir el document en lloc d’ensopegar amb un mur de paraules soltes.

Estabilitat en el temps. Un fitxer PDF/A incrusta les seves fonts i deixa anar les dependències externes, així que el text continua sent extraïble d’aquí a anys, en programari que encara no existeix. Bo per a arxivament i per a qualsevol cosa que vulguis que una màquina pugui continuar llegint més endavant.

Com arreglar un PDF perquè la IA el llegeixi

Si el teu fitxer va néixer en digital i ja pots seleccionar el text, fet. Es llegirà bé. La feina només comença quan el text està atrapat dins d’una imatge.

Per a un document escanejat, passa-li OCR. El reconeixement òptic de caràcters mira la foto, troba les formes de les lletres i escriu el text real de tornada dins del PDF, ficat darrere de la imatge on no el veus. La pàgina es veu igual. L’angle tort i la taca de cafè es queden. Però ara hi ha una capa de text a sota, així que la IA el pot llegir, el cercador el pot indexar i un lector de pantalla el pot pronunciar. Ho pots fer amb l’OCR de PDF.

Si l’única cosa que necessites és treure les paraules d’un PDF per enganxar-les en un model, un correu o una app de notes, extreu el text directament amb l’eina d’extreure text del PDF. T’emportes el contingut com a text pla, llest per donar-lo al que sigui que ho necessiti.

Totes dues coses funcionen dins del teu navegador a reader.me. El PDF mai no es puja. Aquí això pesa més del normal, perquè els documents que un més vol que una IA llegeixi són els privats. Contractes, cartes mèdiques, extractes, qualsevol cosa amb un nom i un número a sobre. Enviar-los al servidor d’un altre per fer-los llegibles per màquina és un tracte estrany. A reader.me te l’estalvies. La pàgina fa la feina i el fitxer es queda al teu equip.

La versió curta

La IA i els cercadors no veuen el teu PDF com el veus tu. Llegeixen la seva capa de text. Si aquella capa existeix, en treus bones respostes i indexació correcta. Si no existeix, en treus endevinalles o silenci. Els fitxers nascuts en digital ja la tenen. Els escanejos necessiten OCR. En qualsevol cas l’arranjament triga un minut, i a reader.me passa sense que el teu fitxer surti mai de les teves mans.

Explora per categoria

Organitzar Convertir Editar Seguretat