Lewati ke konten
FileTinker

OCR Rusia

Gunakan OCR Rusia gratis ini untuk mengambil teks yang dapat diedit dari sebuah gambar atau PDF hasil pindai — pengenalan berjalan sepenuhnya di browser Anda, sehingga file Anda tidak pernah diunggah.

Mesin OCR diunduh saat pertama kali digunakan (beberapa MB) lalu disimpan di cache.

Preset lainnya

Beralih ke preset lain — masing-masing membuka halamannya sendiri yang siap digunakan:

Cara menggunakan OCR Rusia

  1. Letakkan sebuah gambar atau PDF hasil pindai — bahasanya sudah dipilih untuk Anda.
  2. Tunggu sementara teks dikenali (model bahasa diunduh sekali, lalu di-cache).
  3. Salin atau unduh teks yang dikenali.

Tentang OCR Rusia

Pengenalan karakter optik (OCR) mengubah huruf-huruf dalam sebuah foto atau pindaian menjadi teks yang nyata dan dapat diedit. OCR Rusia ini menggunakan model bahasa yang dilatih untuk aksara tersebut, sehingga karakter khusus bahasa dan aksara dikenali jauh lebih akurat dibandingkan dengan model bahasa Inggris saja.

Semuanya terjadi di browser Anda — gambar atau PDF didekode dan dikenali secara lokal serta tidak pernah diunggah. Model bahasa diambil dari CDN saat pertama kali digunakan lalu di-cache, sehingga proses berikutnya mulai seketika. Untuk hasil terbaik, gunakan gambar yang tajam, terang, dan lurus.

Bahasa Rusia ditulis dalam alfabet Sirilik, di mana beberapa huruf (А, В, С, Е, Р) terlihat identik dengan huruf Latin tetapi mewakili bunyi yang sama sekali berbeda — model bahasa Inggris saja terus-menerus salah membacanya. Model yang dilatih dengan aksara Sirilik menyelesaikan kemiripan ini dengan benar, sehingga menjadi pilihan tepat untuk dokumen pindaian, halaman buku, rambu, tangkapan layar, dan teks cetak bebas tulisan tangan dalam bahasa Rusia atau bahasa lain beraksara Sirilik.

Pertanyaan umum

Bahasa apa yang dikenali oleh alat ini?

Halaman ini memilih model satu bahasa terlebih dahulu, tetapi Anda dapat beralih ke bahasa apa pun yang didukung — termasuk Inggris, Tionghoa, Jepang, Korea, dan banyak bahasa Eropa — dengan pemilih di atas area letak file.

Apakah gambar diunggah?

Tidak. Gambar atau PDF dikenali sepenuhnya di browser Anda, sehingga tidak pernah meninggalkan perangkat Anda — aman untuk dokumen pribadi.

Bisakah alat ini membaca PDF hasil pindai?

Ya. PDF hasil pindai diraster halaman demi halaman dan setiap halaman dikenali, lalu teksnya digabungkan.

Mengapa proses pertama lebih lambat?

Mesin pengenalan dan model bahasa diunduh dari CDN saat pertama kali Anda menggunakannya (beberapa MB), lalu di-cache, sehingga proses berikutnya mulai seketika.

Mengapa model OCR Rusia menangani huruf seperti А, В, С, Е, dan Р dengan lebih baik?

Huruf-huruf Sirilik itu terlihat identik secara visual dengan huruf Latin A, B, C, E, dan P, sehingga model bahasa Inggris sering menggantinya dengan karakter yang salah; model yang dilatih dengan Sirilik membacanya dalam konteks Rusianya dan menangkapnya dengan benar.