圖片轉文字(OCR)
上傳一張圖片或掃描的 PDF,FileTinker 會以裝置端 OCR 讀取其中的文字。選擇你的語言,再複製或下載結果。辨識引擎只下載一次並在你的瀏覽器中執行——你的檔案絕不上傳。
OCR 引擎會在第一次使用時下載(數 MB),之後會被快取。
依檔案類型擷取文字
直接前往你的檔案類型 — 每個都有獨立頁面,並已將工具設定好:
依語言辨識
以預先選好的特定語言開啟工具——每個都有獨立頁面:
如何從圖片擷取文字
- 選擇你的語言,再上傳圖片或掃描的 PDF。
- 等待 OCR 引擎讀取文字(第一次執行會下載模型)。
- 複製辨識出的文字,或下載成 .txt 檔。
關於 OCR(光學字元辨識)
OCR 會把文字的圖像——相片、螢幕截圖、掃描文件——轉成可編輯、可搜尋的文字。FileTinker 使用編譯成 WebAssembly 的 Tesseract,因此辨識在你自己的裝置上進行,而非伺服器。它在清晰、光線充足、高對比的文字上效果最佳;藝術字型與手寫則較困難。
由於一切都在你的瀏覽器中執行,你的文件保持私密——很適合處理收據、證件、合約與你不想上傳的筆記。引擎與語言資料只會從 CDN 取得一次並快取,因此之後的執行會更快開始。
常見問題
OCR 如何運作?
FileTinker 以 WebAssembly 在你的瀏覽器中執行開源 OCR 引擎 Tesseract。引擎與語言模型會在第一次使用時從 CDN 下載並快取;你的圖片或 PDF 在本機辨識,絕不上傳。
支援哪些語言?
英文、繁體中文與簡體中文,以及英文+中文的混合模式。上傳前請選擇與你文件相符的語言,以獲得最佳準確度。
可以讀取掃描的 PDF 嗎?
可以。PDF 的每一頁都會先轉成圖片再依序辨識,然後合併文字。清晰、高解析度的掃描效果最好。
我的檔案會被上傳嗎?
不會。只會下載 OCR 引擎與語言模型;你的圖片或 PDF 完全在你的瀏覽器中處理,絕不會離開你的裝置。