德文 OCR
使用這個免費的德文 OCR,從圖片或掃描的 PDF 中取出可編輯的文字——辨識完全在你的瀏覽器中執行,因此你的檔案絕不會被上傳。
OCR 引擎會在第一次使用時下載(數 MB),之後會被快取。
更多預設
前往其他預設 — 每個都有獨立頁面,並已將工具設定好:
如何使用德文 OCR
- 放入圖片或掃描的 PDF——語言已為你預先選好。
- 等待文字辨識完成(語言模型會下載一次,之後便會被快取)。
- 複製或下載辨識出的文字。
關於德文 OCR
光學字元辨識(OCR)會把照片或掃描檔中的字母轉成真正可編輯的文字。本德文 OCR使用針對該語言文字訓練的語言模型,因此該語言與書寫系統特有的字元,辨識起來會比只用英文模型準確得多。
一切都在你的瀏覽器中進行——圖片或 PDF 會在本機解碼與辨識,絕不會被上傳。語言模型會在第一次使用時從 CDN 取得並快取,因此之後的辨識會立即開始。為求最佳效果,請使用清晰、光線充足且端正的影像。
德文文字大量使用變音符號 ä、ö、ü 與 ß(eszett),而且常出現像「Lebensversicherungsgesellschaft」這類超長的複合字——這些正是一般模型容易誤判成 a、o、u、ss 或在中間斷開的字元。本辨識器經過調校,會盡量完整保留這些符號與字詞接合,因此很適合掃描德文發票、政府機關(Behörden)公文、合約、書頁等內容,畢竟漏掉一個變音符號就可能讓整個字的意思改變。
常見問題
這會辨識哪一種語言?
本頁會預先選好一種語言的模型,但你可以用放置區上方的選單,切換到任何支援的語言——包括英文、中文、日文、韓文與多種歐洲語言。
圖片會被上傳嗎?
不會。圖片或 PDF 完全在你的瀏覽器中辨識,因此絕不會離開你的裝置——可安心處理私密文件。
它能讀取掃描的 PDF 嗎?
可以。掃描的 PDF 會逐頁轉成影像並分別辨識,再把文字合併起來。
為什麼第一次比較慢?
辨識引擎與語言模型會在你第一次使用時從 CDN 下載(數 MB),之後便會被快取,因此後續的辨識會立即開始。
它會保留 ä、ö、ü 和 ß,還是會轉寫成 ae/oe/ue/ss?
它會把 ä、ö、ü 和 ß 保留為原本的字元,而不是轉寫成 ae/oe/ue/ss,因此辨識結果會與原文拼寫一致;不過若掃描檔過於模糊或解析度太低,仍可能漏掉變音點,建議在畫質較差的頁面上多留意變音符號。