Vai al contenuto
FileTinker

OCR arabo

Usa questo OCR arabo gratis per estrarre testo modificabile da un'immagine o da un PDF scansionato: il riconoscimento funziona interamente nel tuo browser, quindi il tuo file non viene mai caricato.

Il motore OCR viene scaricato al primo utilizzo (pochi MB) e poi memorizzato nella cache.

Altre preimpostazioni

Passa a un'altra preimpostazione: ognuna apre la propria pagina pronta all'uso:

Come usare il OCR arabo

  1. Trascina un'immagine o un PDF scansionato: la lingua è già preselezionata per te.
  2. Attendi mentre il testo viene riconosciuto (il modello linguistico viene scaricato una volta sola e poi memorizzato nella cache).
  3. Copia o scarica il testo riconosciuto.

Informazioni su OCR arabo

Il riconoscimento ottico dei caratteri (OCR) trasforma le lettere di una foto o di una scansione in testo reale e modificabile. Questo OCR arabo usa un modello linguistico addestrato per quella scrittura, così i caratteri specifici della lingua e del sistema di scrittura vengono riconosciuti con una precisione molto maggiore rispetto a un modello solo in inglese.

Tutto avviene nel tuo browser: l'immagine o il PDF viene decodificato e riconosciuto localmente e non viene mai caricato. Il modello linguistico viene scaricato da una CDN al primo utilizzo e memorizzato nella cache, così gli usi successivi partono all'istante. Per i migliori risultati, usa un'immagine nitida, ben illuminata e dritta.

L'arabo si scrive da destra a sinistra in una scrittura corsiva e collegata in cui la maggior parte delle lettere assume una forma diversa a seconda che si trovi all'inizio, al centro o alla fine di una parola, oppure isolata — quindi il modello deve riconoscere la forma contestuale di ogni lettera invece di un singolo glifo fisso. I segni diacritici opzionali (marche di vocali brevi e tashkeel) aggiungono un altro livello sopra e sotto la riga. L'OCR arabo è il modo pratico per estrarre testo da libri scansionati, documenti ufficiali, segnaletica e screenshot in arabo, persiano o scritture in stile urdu e trasformarlo in testo modificabile, ricercabile e copiabile.

Domande frequenti

Quale lingua riconosce?

Questa pagina preseleziona il modello di una lingua, ma puoi passare a qualsiasi lingua supportata — tra cui inglese, cinese, giapponese, coreano e molte lingue europee — con il selettore sopra l'area di rilascio.

L'immagine viene caricata?

No. L'immagine o il PDF viene riconosciuto interamente nel tuo browser, quindi non lascia mai il tuo dispositivo: sicuro per i documenti privati.

Può leggere i PDF scansionati?

Sì. I PDF scansionati vengono rasterizzati pagina per pagina e ogni pagina viene riconosciuta, poi il testo viene unito insieme.

Perché il primo utilizzo è più lento?

Il motore di riconoscimento e il modello linguistico vengono scaricati da una CDN la prima volta che li usi (pochi MB), poi vengono memorizzati nella cache, così gli usi successivi partono subito.

Mantiene l'ordine da destra a sinistra e i segni diacritici?

Il testo riconosciuto viene restituito nel corretto ordine da destra a sinistra, e le marche di vocali brevi/tashkeel vengono rilevate quando sono stampate in modo chiaro — anche se i diacritici tenui o aggiunti a mano sono facili da perdere, quindi controlla con attenzione il testo vocalizzato.