Seminario a cura di Federico Boschetti (Istituto di Linguistica Computazionale del Cnr)
Aula A 27, Area della Ricerca del Cnr di Pisa (Via Moruzzi 1, Pisa), ore 20
L’immagine digitale di una pagina stampata o di una pagina scritta a mano può essere letta da un essere umano, può essere ingrandita, rimpicciolita, deformata, etc. Ma le parole che contiene non possono essere copiate e incollate, trovate da un motore di ricerca, disposte in ordine alfabetico se non vengono prima estratte dall’immagine tramite tecniche di riconoscimento dei caratteri (Optical Character Recognition: OCR) o di riconoscimento della scrittura manuale (Handwritten Text Recognition: HTR). In questo seminario vedrete queste tecniche in azione.