OCR arabe

Utilisez cet OCR arabe gratuit pour extraire un texte modifiable d'une image ou d'un PDF numérisé — la reconnaissance fonctionne entièrement dans votre navigateur, votre fichier n'est donc jamais envoyé.

Langue

Déposez une image ou un PDF ici, ou cliquez pour parcourirImages (JPG, PNG, WebP…) et PDF numérisés

Le moteur OCR se télécharge lors de la première utilisation (quelques MB), puis il est mis en cache.

Plus de préréglages

Passez à un autre préréglage — chacun ouvre sa propre page prête à l'emploi :

Comment utiliser l'OCR arabe

Déposez une image ou un PDF numérisé — la langue est présélectionnée pour vous.
Patientez pendant la reconnaissance du texte (le modèle de langue se télécharge une fois, puis est mis en cache).
Copiez ou téléchargez le texte reconnu.

À propos de l'OCR arabe

La reconnaissance optique de caractères (OCR) transforme les lettres d'une photo ou d'un scan en un texte réel et modifiable. Cet OCR arabe utilise un modèle de langue entraîné pour cette écriture, de sorte que les caractères propres à la langue et à l'écriture sont reconnus bien plus précisément qu'avec un modèle uniquement anglais.

Tout se passe dans votre navigateur — l'image ou le PDF est décodé et reconnu localement et n'est jamais envoyé. Le modèle de langue est récupéré depuis un CDN lors de la première utilisation puis mis en cache, de sorte que les exécutions suivantes démarrent instantanément. Pour de meilleurs résultats, utilisez une image nette, bien éclairée et droite.

L'arabe s'écrit de droite à gauche dans une écriture liée et cursive où la plupart des lettres prennent une forme différente selon qu'elles se trouvent au début, au milieu ou à la fin d'un mot, ou seules — le modèle doit donc reconnaître la forme contextuelle de chaque lettre plutôt qu'un glyphe unique et figé. Des signes diacritiques facultatifs (voyelles brèves et marques de tashkîl) ajoutent une couche supplémentaire au-dessus et au-dessous de la ligne. L'OCR arabe est le moyen pratique d'extraire du texte de livres numérisés, de documents officiels, de signalétique et de captures d'écran en écriture arabe, persane ou de style ourdou, et de le transformer en texte modifiable, recherchable et copiable.

Questions fréquentes

Quelle langue est reconnue ?

Cette page présélectionne le modèle d'une langue, mais vous pouvez passer à n'importe quelle langue prise en charge — y compris l'anglais, le chinois, le japonais, le coréen et de nombreuses langues européennes — à l'aide du sélecteur situé au-dessus de la zone de dépôt.

L'image est-elle envoyée ?

Non. L'image ou le PDF est reconnu entièrement dans votre navigateur, il ne quitte donc jamais votre appareil — idéal pour les documents confidentiels.

Peut-il lire des PDF numérisés ?

Oui. Les PDF numérisés sont convertis en images page par page et chaque page est reconnue, puis le texte est assemblé.

Pourquoi la première exécution est-elle plus lente ?

Le moteur de reconnaissance et le modèle de langue se téléchargent depuis un CDN la première fois que vous les utilisez (quelques MB), puis ils sont mis en cache, de sorte que les exécutions suivantes démarrent aussitôt.

Conserve-t-il l'ordre de droite à gauche et les signes diacritiques ?

Le texte reconnu est restitué dans un ordre correct de droite à gauche, et les marques de voyelles brèves/tashkîl sont captées lorsqu'elles sont clairement imprimées — toutefois les diacritiques pâles ou ajoutés à la main sont faciles à manquer, vérifiez donc de près le texte vocalisé.