Image vers texte (OCR)

Importez une image ou un PDF numérisé et FileTinker lit le texte grâce à l'OCR sur votre appareil. Choisissez votre langue, puis copiez ou téléchargez le résultat. Le moteur de reconnaissance se télécharge une seule fois et fonctionne dans votre navigateur — votre fichier n'est jamais envoyé.

Langue

Déposez une image ou un PDF ici, ou cliquez pour parcourirImages (JPG, PNG, WebP…) et PDF numérisés

Le moteur OCR se télécharge lors de la première utilisation (quelques MB), puis il est mis en cache.

Extraire le texte par type de fichier

Accédez directement à votre type de fichier — chacun ouvre sa propre page, prête à l'emploi :

OCR par langue

Ouvrez l'outil avec une langue présélectionnée — chacune dispose de sa propre page :

Comment extraire le texte d'une image

Choisissez votre langue, puis importez une image ou un PDF numérisé.
Patientez pendant que le moteur OCR lit le texte (la première utilisation télécharge le modèle).
Copiez le texte reconnu ou téléchargez-le sous forme de fichier .txt.

À propos de l'OCR (reconnaissance optique de caractères)

L'OCR transforme des images de texte — photos, captures d'écran, documents numérisés — en texte modifiable et consultable. FileTinker utilise Tesseract compilé en WebAssembly, de sorte que la reconnaissance s'effectue sur votre propre appareil plutôt que sur un serveur. Il fonctionne mieux avec du texte net, bien éclairé et à fort contraste ; les polices stylisées et l'écriture manuscrite sont plus difficiles à lire.

Comme tout fonctionne dans votre navigateur, vos documents restent privés — pratique pour les reçus, les pièces d'identité, les contrats et les notes que vous préférez ne pas envoyer. Le moteur et les données linguistiques sont récupérés une seule fois depuis un CDN puis mis en cache, ce qui accélère les utilisations suivantes.

Questions fréquentes

Comment fonctionne l'OCR ?

FileTinker exécute Tesseract, un moteur OCR open source, sous forme de WebAssembly dans votre navigateur. Le moteur et le modèle linguistique se téléchargent depuis un CDN lors de la première utilisation, puis sont mis en cache ; votre image ou PDF est reconnu localement et n'est jamais envoyé.

Quelles langues sont prises en charge ?

L'anglais, le chinois traditionnel et le chinois simplifié, ainsi qu'un mode combiné anglais + chinois. Choisissez la langue qui correspond à votre document avant l'import pour une précision optimale.

Peut-il lire des PDF numérisés ?

Oui. Chaque page d'un PDF est convertie en image puis reconnue à son tour, et le texte est ensuite combiné. Des numérisations nettes et en haute résolution donnent les meilleurs résultats.

Mon fichier est-il envoyé ?

Non. Seuls le moteur OCR et le modèle linguistique sont téléchargés ; votre image ou PDF est traité entièrement dans votre navigateur et ne quitte jamais votre appareil.