Deutsch-OCR
Nutzen Sie diese kostenlose Deutsch-OCR, um bearbeitbaren Text aus einem Bild oder gescannten PDF zu gewinnen — die Erkennung läuft vollständig in Ihrem Browser, daher wird Ihre Datei niemals hochgeladen.
Die OCR-Engine wird bei der ersten Nutzung heruntergeladen (einige MB) und danach zwischengespeichert.
Weitere Voreinstellungen
Zu einer anderen Voreinstellung wechseln — jede öffnet ihre eigene Seite, startklar:
So verwenden Sie die Deutsch-OCR
- Ziehen Sie ein Bild oder gescanntes PDF hinein — die Sprache ist bereits für Sie vorausgewählt.
- Warten Sie, während der Text erkannt wird (das Sprachmodell wird einmalig heruntergeladen und anschließend zwischengespeichert).
- Kopieren Sie den erkannten Text oder laden Sie ihn herunter.
Über Deutsch-OCR
Die optische Zeichenerkennung (OCR) wandelt die Buchstaben in einem Foto oder Scan in echten, bearbeitbaren Text um. Diese Deutsch-OCR verwendet ein für diese Schrift trainiertes Sprachmodell, sodass sprach- und schriftspezifische Zeichen weitaus genauer erkannt werden als mit einem rein englischen Modell.
Alles geschieht in Ihrem Browser — das Bild oder PDF wird lokal dekodiert und erkannt und niemals hochgeladen. Das Sprachmodell wird bei der ersten Nutzung von einem CDN abgerufen und zwischengespeichert, sodass spätere Durchläufe sofort starten. Für die besten Ergebnisse verwenden Sie ein scharfes, gut beleuchtetes und gerades Bild.
Deutscher Text stützt sich auf die Umlaute ä, ö, ü und das Eszett (ß) und enthält lange zusammengesetzte Wörter wie „Lebensversicherungsgesellschaft" — genau jene Zeichen, die ein generisches Modell gerne zu a, o, u, ss verflacht oder über Leerzeichen aufbricht. Dieses Erkennungsmodell ist darauf abgestimmt, diese Zeichen und Zusammensetzungen intakt zu halten, und eignet sich daher für das Erfassen deutscher Rechnungen, amtlicher Behördenschreiben, Verträge, Buchseiten und gut lesbaren Drucks ohne Fraktur, bei dem ein einziger fehlender Umlaut das Wort verändern kann.
Häufige Fragen
Welche Sprache wird hier erkannt?
Diese Seite wählt das Modell einer Sprache vorab aus, aber Sie können mit der Auswahl über dem Ablagebereich zu jeder unterstützten Sprache wechseln — darunter Englisch, Chinesisch, Japanisch, Koreanisch und viele europäische Sprachen.
Wird das Bild hochgeladen?
Nein. Das Bild oder PDF wird vollständig in Ihrem Browser erkannt und verlässt somit niemals Ihr Gerät — sicher für vertrauliche Dokumente.
Kann es gescannte PDFs lesen?
Ja. Gescannte PDFs werden Seite für Seite gerastert, jede Seite wird einzeln erkannt und der Text anschließend zusammengefügt.
Warum ist der erste Durchlauf langsamer?
Die Erkennungs-Engine und das Sprachmodell werden bei der ersten Nutzung von einem CDN heruntergeladen (einige MB) und danach zwischengespeichert, sodass spätere Durchläufe sofort starten.
Behält sie die Umlaute und das ß bei oder wandelt sie diese in ae/oe/ue/ss um?
Sie bewahrt ä, ö, ü und ß als die tatsächlichen Zeichen, statt sie zu ae/oe/ue/ss zu transliterieren, sodass der erkannte Text der ursprünglichen Schreibweise entspricht — bei einem sehr schwachen oder niedrig aufgelösten Scan kann allerdings dennoch ein Punkt verloren gehen, prüfen Sie die Umlaute daher auf unscharfen Seiten.