跳到主要內容
FileTinker

圖片轉文字(OCR)

上傳一張圖片或掃描的 PDF,FileTinker 會以裝置端 OCR 讀取其中的文字。選擇你的語言,再複製或下載結果。辨識引擎只下載一次並在你的瀏覽器中執行——你的檔案絕不上傳。

OCR 引擎會在第一次使用時下載(數 MB),之後會被快取。

依檔案類型擷取文字

直接前往你的檔案類型 — 每個都有獨立頁面,並已將工具設定好:

依語言辨識

以預先選好的特定語言開啟工具——每個都有獨立頁面:

如何從圖片擷取文字

  1. 選擇你的語言,再上傳圖片或掃描的 PDF。
  2. 等待 OCR 引擎讀取文字(第一次執行會下載模型)。
  3. 複製辨識出的文字,或下載成 .txt 檔。

關於 OCR(光學字元辨識)

OCR 會把文字的圖像——相片、螢幕截圖、掃描文件——轉成可編輯、可搜尋的文字。FileTinker 使用編譯成 WebAssembly 的 Tesseract,因此辨識在你自己的裝置上進行,而非伺服器。它在清晰、光線充足、高對比的文字上效果最佳;藝術字型與手寫則較困難。

由於一切都在你的瀏覽器中執行,你的文件保持私密——很適合處理收據、證件、合約與你不想上傳的筆記。引擎與語言資料只會從 CDN 取得一次並快取,因此之後的執行會更快開始。

常見問題

OCR 如何運作?

FileTinker 以 WebAssembly 在你的瀏覽器中執行開源 OCR 引擎 Tesseract。引擎與語言模型會在第一次使用時從 CDN 下載並快取;你的圖片或 PDF 在本機辨識,絕不上傳。

支援哪些語言?

英文、繁體中文與簡體中文,以及英文+中文的混合模式。上傳前請選擇與你文件相符的語言,以獲得最佳準確度。

可以讀取掃描的 PDF 嗎?

可以。PDF 的每一頁都會先轉成圖片再依序辨識,然後合併文字。清晰、高解析度的掃描效果最好。

我的檔案會被上傳嗎?

不會。只會下載 OCR 引擎與語言模型;你的圖片或 PDF 完全在你的瀏覽器中處理,絕不會離開你的裝置。