Aller au contenu
FileTinker

OCR coréen

Utilisez cet OCR coréen gratuit pour extraire un texte modifiable d'une image ou d'un PDF numérisé — la reconnaissance fonctionne entièrement dans votre navigateur, votre fichier n'est donc jamais envoyé.

Le moteur OCR se télécharge lors de la première utilisation (quelques MB), puis il est mis en cache.

Plus de préréglages

Passez à un autre préréglage — chacun ouvre sa propre page prête à l'emploi :

Comment utiliser l'OCR coréen

  1. Déposez une image ou un PDF numérisé — la langue est présélectionnée pour vous.
  2. Patientez pendant la reconnaissance du texte (le modèle de langue se télécharge une fois, puis est mis en cache).
  3. Copiez ou téléchargez le texte reconnu.

À propos de l'OCR coréen

La reconnaissance optique de caractères (OCR) transforme les lettres d'une photo ou d'un scan en un texte réel et modifiable. Cet OCR coréen utilise un modèle de langue entraîné pour cette écriture, de sorte que les caractères propres à la langue et à l'écriture sont reconnus bien plus précisément qu'avec un modèle uniquement anglais.

Tout se passe dans votre navigateur — l'image ou le PDF est décodé et reconnu localement et n'est jamais envoyé. Le modèle de langue est récupéré depuis un CDN lors de la première utilisation puis mis en cache, de sorte que les exécutions suivantes démarrent instantanément. Pour de meilleurs résultats, utilisez une image nette, bien éclairée et droite.

Le texte coréen ne s'écrit pas lettre par lettre : les jamos individuels (consonnes et voyelles) sont empilés en blocs syllabiques carrés comme 한 et 글, et cet OCR lit chaque bloc composé comme un seul caractère plutôt que d'essayer de le décomposer en ses parties. Cela compte pour numériser des livres coréens, de la signalétique, du hwagongmun et des captures d'écran, et le même modèle reconnaît aussi les hanjas (caractères chinois) encore parsemés dans l'écriture coréenne ancienne et formelle.

Questions fréquentes

Quelle langue est reconnue ?

Cette page présélectionne le modèle d'une langue, mais vous pouvez passer à n'importe quelle langue prise en charge — y compris l'anglais, le chinois, le japonais, le coréen et de nombreuses langues européennes — à l'aide du sélecteur situé au-dessus de la zone de dépôt.

L'image est-elle envoyée ?

Non. L'image ou le PDF est reconnu entièrement dans votre navigateur, il ne quitte donc jamais votre appareil — idéal pour les documents confidentiels.

Peut-il lire des PDF numérisés ?

Oui. Les PDF numérisés sont convertis en images page par page et chaque page est reconnue, puis le texte est assemblé.

Pourquoi la première exécution est-elle plus lente ?

Le moteur de reconnaissance et le modèle de langue se téléchargent depuis un CDN la première fois que vous les utilisez (quelques MB), puis ils sont mis en cache, de sorte que les exécutions suivantes démarrent aussitôt.

Conserve-t-il les syllabes coréennes assemblées ou les scinde-t-il en jamos séparés ?

Il produit des blocs syllabiques entiers et pré-composés (ainsi 한 reste un seul caractère), ce qui est exactement ce dont vous avez besoin pour copier dans des documents ou effectuer une recherche — il ne les décompose pas en jamos initiaux/médians/finaux isolés.