Arabisch-OCR

Nutzen Sie diese kostenlose Arabisch-OCR, um bearbeitbaren Text aus einem Bild oder gescannten PDF zu gewinnen — die Erkennung läuft vollständig in Ihrem Browser, daher wird Ihre Datei niemals hochgeladen.

Sprache

Bild oder PDF hierher ziehen oder zum Durchsuchen klickenBilder (JPG, PNG, WebP …) und gescannte PDFs

Die OCR-Engine wird bei der ersten Nutzung heruntergeladen (einige MB) und danach zwischengespeichert.

Weitere Voreinstellungen

Zu einer anderen Voreinstellung wechseln — jede öffnet ihre eigene Seite, startklar:

So verwenden Sie die Arabisch-OCR

Ziehen Sie ein Bild oder gescanntes PDF hinein — die Sprache ist bereits für Sie vorausgewählt.
Warten Sie, während der Text erkannt wird (das Sprachmodell wird einmalig heruntergeladen und anschließend zwischengespeichert).
Kopieren Sie den erkannten Text oder laden Sie ihn herunter.

Über Arabisch-OCR

Die optische Zeichenerkennung (OCR) wandelt die Buchstaben in einem Foto oder Scan in echten, bearbeitbaren Text um. Diese Arabisch-OCR verwendet ein für diese Schrift trainiertes Sprachmodell, sodass sprach- und schriftspezifische Zeichen weitaus genauer erkannt werden als mit einem rein englischen Modell.

Alles geschieht in Ihrem Browser — das Bild oder PDF wird lokal dekodiert und erkannt und niemals hochgeladen. Das Sprachmodell wird bei der ersten Nutzung von einem CDN abgerufen und zwischengespeichert, sodass spätere Durchläufe sofort starten. Für die besten Ergebnisse verwenden Sie ein scharfes, gut beleuchtetes und gerades Bild.

Arabisch wird von rechts nach links in einer verbundenen, kursiven Schrift geschrieben, in der die meisten Buchstaben je nach Position am Anfang, in der Mitte oder am Ende eines Wortes — oder allein stehend — eine andere Form annehmen. Das Modell muss daher die kontextabhängige Form jedes Buchstabens erkennen statt eines einzigen festen Schriftzeichens. Optionale diakritische Zeichen (Kurzvokal- und Taschkil-Zeichen) fügen ober- und unterhalb der Zeile eine weitere Ebene hinzu. Die Arabisch-OCR ist der praktische Weg, um Text aus gescannten Büchern, amtlichen Dokumenten, Beschilderungen und Screenshots in arabischer, persischer oder Urdu-ähnlicher Schrift zu gewinnen und in bearbeitbaren, durchsuchbaren und kopierbaren Text zu verwandeln.

Häufige Fragen

Welche Sprache wird hier erkannt?

Diese Seite wählt das Modell einer Sprache vorab aus, aber Sie können mit der Auswahl über dem Ablagebereich zu jeder unterstützten Sprache wechseln — darunter Englisch, Chinesisch, Japanisch, Koreanisch und viele europäische Sprachen.

Wird das Bild hochgeladen?

Nein. Das Bild oder PDF wird vollständig in Ihrem Browser erkannt und verlässt somit niemals Ihr Gerät — sicher für vertrauliche Dokumente.

Kann es gescannte PDFs lesen?

Ja. Gescannte PDFs werden Seite für Seite gerastert, jede Seite wird einzeln erkannt und der Text anschließend zusammengefügt.

Warum ist der erste Durchlauf langsamer?

Die Erkennungs-Engine und das Sprachmodell werden bei der ersten Nutzung von einem CDN heruntergeladen (einige MB) und danach zwischengespeichert, sodass spätere Durchläufe sofort starten.

Behält sie die Leserichtung von rechts nach links und die diakritischen Zeichen bei?

Der erkannte Text wird in korrekter Leserichtung von rechts nach links zurückgegeben, und Kurzvokal- bzw. Taschkil-Zeichen werden erfasst, wenn sie deutlich gedruckt sind — schwache oder handschriftlich hinzugefügte diakritische Zeichen werden allerdings leicht übersehen, prüfen Sie vokalisierten Text daher genau.