Uno dei casi più ricorrenti nel Office computing è quello di convertire dei file da PDF a testo modificabile mediante OCR.
Esistono moltissimi programmi di OCR (Optical Character Recognition) per desktop PC/Mac, ma non sempre sono forniti con le stampanti.
Nel corso degli anni, molti siti hanno messo a disposizione dei programmi, per lo più gratuiti, che consentono di fare questo tipo di operazione (molto usato in ambito legale)
Da PDF a singoli JPG ad OCR
Una strada che ho trovato interessante è usare questi siti:
1 - Scompattare il file PDF in più file JPG, usando
scaricare la cartella con tutti i file jpg estratti dal file PDF
2 - a questo punto si deve convertire da immagine a testo usando un OCR (optical character recognition, un po' quello che la nostra mente quando legge un testo scritto)
Carica i file dall'ultimo al primo così da avere la sequenza esatta ) basta controllare nella finestra sotto la sequenza
dopodiché cliccare su Converti
Attenzione potrebbe dirti che il server è in sovraccarico, ti fa ritornare alla pagina di inserimento e poi ripremi Converti
poi segui per scaricare
Ovviamente per quanto sia perfetto il file la conversione è sempre imprecisa nel testo, va comunque letto ed eventualmente modificato
Commenti