跳到主要內容
FileTinker

俄文 OCR

使用這個免費的俄文 OCR,從圖片或掃描的 PDF 中取出可編輯的文字——辨識完全在你的瀏覽器中執行,因此你的檔案絕不會被上傳。

OCR 引擎會在第一次使用時下載(數 MB),之後會被快取。

更多預設

前往其他預設 — 每個都有獨立頁面,並已將工具設定好:

如何使用俄文 OCR

  1. 放入圖片或掃描的 PDF——語言已為你預先選好。
  2. 等待文字辨識完成(語言模型會下載一次,之後便會被快取)。
  3. 複製或下載辨識出的文字。

關於俄文 OCR

光學字元辨識(OCR)會把照片或掃描檔中的字母轉成真正可編輯的文字。本俄文 OCR使用針對該語言文字訓練的語言模型,因此該語言與書寫系統特有的字元,辨識起來會比只用英文模型準確得多。

一切都在你的瀏覽器中進行——圖片或 PDF 會在本機解碼與辨識,絕不會被上傳。語言模型會在第一次使用時從 CDN 取得並快取,因此之後的辨識會立即開始。為求最佳效果,請使用清晰、光線充足且端正的影像。

俄文使用西里爾字母,其中有幾個字母(А、В、С、Е、Р)外觀和拉丁字母一模一樣,但發音完全不同,只懂英文的模型幾乎一定會認錯。專為西里爾字母訓練的模型能正確分辨這些長得很像的字母,因此非常適合用來辨識掃描的俄文文件、書頁、招牌、截圖,以及俄文或其他西里爾字母語言的印刷文字。

常見問題

這會辨識哪一種語言?

本頁會預先選好一種語言的模型,但你可以用放置區上方的選單,切換到任何支援的語言——包括英文、中文、日文、韓文與多種歐洲語言。

圖片會被上傳嗎?

不會。圖片或 PDF 完全在你的瀏覽器中辨識,因此絕不會離開你的裝置——可安心處理私密文件。

它能讀取掃描的 PDF 嗎?

可以。掃描的 PDF 會逐頁轉成影像並分別辨識,再把文字合併起來。

為什麼第一次比較慢?

辨識引擎與語言模型會在你第一次使用時從 CDN 下載(數 MB),之後便會被快取,因此後續的辨識會立即開始。

為什麼俄文 OCR 模型能更準確地處理 А、В、С、Е、Р 這些字母?

這些西里爾字母外觀和拉丁字母 A、B、C、E、P 完全一樣,英文模型常常會代換成錯誤的字元;而以西里爾字母訓練的模型會依俄文的上下文判讀,因此能正確辨識。