Lewati ke konten
FileTinker

OCR Arab

Gunakan OCR Arab gratis ini untuk mengambil teks yang dapat diedit dari sebuah gambar atau PDF hasil pindai — pengenalan berjalan sepenuhnya di browser Anda, sehingga file Anda tidak pernah diunggah.

Mesin OCR diunduh saat pertama kali digunakan (beberapa MB) lalu disimpan di cache.

Preset lainnya

Beralih ke preset lain — masing-masing membuka halamannya sendiri yang siap digunakan:

Cara menggunakan OCR Arab

  1. Letakkan sebuah gambar atau PDF hasil pindai — bahasanya sudah dipilih untuk Anda.
  2. Tunggu sementara teks dikenali (model bahasa diunduh sekali, lalu di-cache).
  3. Salin atau unduh teks yang dikenali.

Tentang OCR Arab

Pengenalan karakter optik (OCR) mengubah huruf-huruf dalam sebuah foto atau pindaian menjadi teks yang nyata dan dapat diedit. OCR Arab ini menggunakan model bahasa yang dilatih untuk aksara tersebut, sehingga karakter khusus bahasa dan aksara dikenali jauh lebih akurat dibandingkan dengan model bahasa Inggris saja.

Semuanya terjadi di browser Anda — gambar atau PDF didekode dan dikenali secara lokal serta tidak pernah diunggah. Model bahasa diambil dari CDN saat pertama kali digunakan lalu di-cache, sehingga proses berikutnya mulai seketika. Untuk hasil terbaik, gunakan gambar yang tajam, terang, dan lurus.

Bahasa Arab ditulis dari kanan ke kiri dalam aksara sambung yang kursif, di mana sebagian besar huruf memiliki bentuk berbeda tergantung apakah berada di awal, tengah, atau akhir kata, atau berdiri sendiri — sehingga model harus mengenali bentuk kontekstual setiap huruf alih-alih satu glif tetap. Diakritik opsional (tanda vokal pendek dan tashkeel) menambahkan lapisan lain di atas dan di bawah baris. OCR Arab adalah cara praktis untuk mengambil teks dari buku pindaian, dokumen resmi, rambu, dan tangkapan layar dalam aksara Arab, Persia, atau gaya Urdu serta mengubahnya menjadi teks yang dapat diedit, dicari, dan disalin-tempel.

Pertanyaan umum

Bahasa apa yang dikenali oleh alat ini?

Halaman ini memilih model satu bahasa terlebih dahulu, tetapi Anda dapat beralih ke bahasa apa pun yang didukung — termasuk Inggris, Tionghoa, Jepang, Korea, dan banyak bahasa Eropa — dengan pemilih di atas area letak file.

Apakah gambar diunggah?

Tidak. Gambar atau PDF dikenali sepenuhnya di browser Anda, sehingga tidak pernah meninggalkan perangkat Anda — aman untuk dokumen pribadi.

Bisakah alat ini membaca PDF hasil pindai?

Ya. PDF hasil pindai diraster halaman demi halaman dan setiap halaman dikenali, lalu teksnya digabungkan.

Mengapa proses pertama lebih lambat?

Mesin pengenalan dan model bahasa diunduh dari CDN saat pertama kali Anda menggunakannya (beberapa MB), lalu di-cache, sehingga proses berikutnya mulai seketika.

Apakah alat ini akan menjaga urutan kanan-ke-kiri dan tanda diakritik?

Teks yang dikenali dikembalikan dalam urutan kanan-ke-kiri yang tepat, dan tanda vokal pendek/tashkeel ditangkap saat tercetak dengan jelas — meski diakritik yang samar atau ditambahkan dengan tangan mudah terlewat, jadi periksa teks bertanda vokal dengan cermat.