Pular para o conteúdo
FileTinker

OCR de Português

Use este OCR de Português grátis para extrair texto editável de uma imagem ou PDF digitalizado — o reconhecimento funciona totalmente no seu navegador, então seu arquivo nunca é enviado.

O mecanismo de OCR é baixado no primeiro uso (alguns MB) e fica armazenado em cache depois.

Mais predefinições

Vá para outra predefinição — cada uma abre na própria página, pronta para usar:

Como usar o OCR de Português

  1. Arraste e solte uma imagem ou PDF digitalizado — o idioma já vem pré-selecionado para você.
  2. Aguarde enquanto o texto é reconhecido (o modelo de idioma é baixado uma vez e depois fica em cache).
  3. Copie ou baixe o texto reconhecido.

Sobre o OCR de Português

O reconhecimento óptico de caracteres (OCR) transforma as letras de uma foto ou digitalização em texto real e editável. Este OCR de Português usa um modelo de idioma treinado para essa escrita, então os caracteres específicos do idioma e da escrita são reconhecidos com muito mais precisão do que com um modelo apenas em inglês.

Tudo acontece no seu navegador — a imagem ou o PDF é decodificado e reconhecido localmente e nunca é enviado. O modelo de idioma é obtido de um CDN no primeiro uso e fica em cache, então as execuções seguintes começam na hora. Para obter os melhores resultados, use uma imagem nítida, bem iluminada e reta.

O OCR de Português é ajustado para texto latino que carrega os tis nasais ã e õ, a cedilha ç e os acentos agudo e circunflexo (á â é ê í ó ô ú) — marcas que mudam o significado de uma palavra, então acertá-las importa. O mesmo modelo lida tanto com o português europeu quanto com o brasileiro, tornando-o a escolha certa para livros digitalizados, notas fiscais, formulários do governo e rótulos de produtos de Portugal, do Brasil e da África lusófona. Recorra a ele sempre que um leitor apenas em inglês insistir em descartar ou estragar essas letras acentuadas.

Perguntas frequentes

Qual idioma este OCR reconhece?

Esta página pré-seleciona o modelo de um idioma, mas você pode mudar para qualquer idioma suportado — incluindo inglês, chinês, japonês, coreano e muitos idiomas europeus — usando o seletor acima da área de envio.

A imagem é enviada?

Não. A imagem ou o PDF é reconhecido totalmente no seu navegador, então nunca sai do seu dispositivo — seguro para documentos privados.

Ele consegue ler PDFs digitalizados?

Sim. Os PDFs digitalizados são rasterizados página por página e cada página é reconhecida, depois o texto é unido.

Por que a primeira execução é mais lenta?

O motor de reconhecimento e o modelo de idioma são baixados de um CDN na primeira vez que você os usa (alguns MB), depois ficam em cache, então as execuções seguintes começam na hora.

Ele mantém os tis e os acentos (ã, õ, ç, é) em vez de descartá-los?

Sim — como o modelo é treinado em português, ele espera ã, õ, ç e as vogais acentuadas e os preserva, enquanto um leitor apenas em inglês muitas vezes os descarta ou adivinha a letra base errada, o que pode mudar a palavra por completo.