Imagem para texto (OCR)

Envie uma imagem ou um PDF digitalizado e o FileTinker lê o texto com OCR direto no dispositivo. Escolha o idioma e depois copie ou baixe o resultado. O mecanismo de reconhecimento é baixado uma vez e funciona no seu navegador — seu arquivo nunca é enviado.

Idioma

Solte uma imagem ou PDF aqui ou clique para procurarImagens (JPG, PNG, WebP…) e PDFs digitalizados

O mecanismo de OCR é baixado no primeiro uso (alguns MB) e fica armazenado em cache depois.

Extrair texto por tipo de arquivo

Vá direto para o seu tipo de arquivo — cada um abre a própria página pronta para usar:

OCR por idioma

Abra a ferramenta com um idioma específico já selecionado — cada um tem a sua própria página:

Como extrair texto de uma imagem

Escolha o idioma e depois envie uma imagem ou PDF digitalizado.
Aguarde enquanto o mecanismo de OCR lê o texto (a primeira execução baixa o modelo).
Copie o texto reconhecido ou baixe-o como um arquivo .txt.

Sobre o OCR (reconhecimento óptico de caracteres)

O OCR transforma imagens de texto — fotos, capturas de tela, documentos digitalizados — em texto editável e pesquisável. O FileTinker usa o Tesseract compilado para WebAssembly, então o reconhecimento acontece no seu próprio dispositivo, e não em um servidor. Funciona melhor com texto nítido, bem iluminado e de alto contraste; fontes estilizadas e escrita à mão são mais difíceis.

Como tudo funciona no seu navegador, seus documentos permanecem privados — útil para recibos, documentos de identidade, contratos e anotações que você prefere não enviar. O mecanismo e os dados de idioma são buscados uma vez em um CDN e ficam em cache, então as execuções seguintes começam mais rápido.

Perguntas frequentes

Como o OCR funciona?

O FileTinker executa o Tesseract, um mecanismo de OCR de código aberto, como WebAssembly no seu navegador. O mecanismo e o modelo de idioma são baixados de um CDN na primeira vez e ficam em cache; sua imagem ou PDF é reconhecido localmente e nunca é enviado.

Quais idiomas têm suporte?

Inglês, chinês tradicional e chinês simplificado, além de um modo combinado de inglês + chinês. Escolha o idioma que corresponde ao seu documento antes de enviar para obter a melhor precisão.

Ele consegue ler PDFs digitalizados?

Sim. Cada página de um PDF é convertida em imagem e reconhecida individualmente, e depois o texto é combinado. Digitalizações nítidas e de alta resolução dão os melhores resultados.

Meu arquivo é enviado?

Não. Apenas o mecanismo de OCR e o modelo de idioma são baixados; sua imagem ou PDF é processado totalmente no seu navegador e nunca sai do seu dispositivo.