OCR in linea
Converti documenti acquisiti e Immagini in modificabile Word, PDF, Excel e TXT (Text) formati di output
Come riconoscere il testo?
Carica file
Seleziona la lingua e il formato di output
Converti e scarica
Riconoscimento ottico dei caratteri
La tecnologia denominata 'Optical Character Recognition' o OCR permette di convertire in modo elettronico o meccanico le immagini di testo digitato, scritto a mano o stampato, trasformandolo in testo codificato leggibile da una macchina. Questo può avvenire sia a partire da un documento scannerizzato, sia da una foto di un documento, sia da un'immagine di una scena (come ad esempio il testo presente su cartelli o manifesti pubblicitari in una foto di un paesaggio) oppure dal testo dei sottotitoli sovrapposti a un'immagine (come quelli di una trasmissione televisiva).
L'OCR, acronimo di Optical Character Recognition, è ampiamente utilizzato come metodo per inserire dati da documenti cartacei - come passaporti, fatture, estratti conto, ricevute, biglietti da visita, e-mail, stampe di dati statici o qualsiasi altro tipo di documentazione - in formato digitale. Questo permette di digitalizzare il testo stampato in modo che possa essere gestito elettronicamente, cercato, memorizzato in modo più compatto, visualizzato online e utilizzato in processi automatizzati come il cognitive computing, la traduzione automatica, l'estrazione del testo in forma orale (text-to-speech) e il data mining. L'OCR è un campo di ricerca che riguarda il riconoscimento di pattern, l'intelligenza artificiale e la visione artificiale.
In passato, le prime versioni di questi sistemi dovevano essere addestrate con le immagini di ogni singolo carattere e lavoravano su un solo font alla volta. Ora, invece, sono disponibili sistemi avanzati che consentono un elevato grado di precisione di riconoscimento per la maggior parte dei font, grazie anche al supporto di vari formati di file di immagine digitale in input. Inoltre, alcuni sistemi sono in grado di riprodurre l'output formattato in modo molto simile alla pagina originale, comprese immagini, colonne e altri elementi non testuali.