Pular para o conteúdo
FileTinker

OCR de Alemão

Use este OCR de Alemão grátis para extrair texto editável de uma imagem ou PDF digitalizado — o reconhecimento funciona totalmente no seu navegador, então seu arquivo nunca é enviado.

O mecanismo de OCR é baixado no primeiro uso (alguns MB) e fica armazenado em cache depois.

Mais predefinições

Vá para outra predefinição — cada uma abre na própria página, pronta para usar:

Como usar o OCR de Alemão

  1. Arraste e solte uma imagem ou PDF digitalizado — o idioma já vem pré-selecionado para você.
  2. Aguarde enquanto o texto é reconhecido (o modelo de idioma é baixado uma vez e depois fica em cache).
  3. Copie ou baixe o texto reconhecido.

Sobre o OCR de Alemão

O reconhecimento óptico de caracteres (OCR) transforma as letras de uma foto ou digitalização em texto real e editável. Este OCR de Alemão usa um modelo de idioma treinado para essa escrita, então os caracteres específicos do idioma e da escrita são reconhecidos com muito mais precisão do que com um modelo apenas em inglês.

Tudo acontece no seu navegador — a imagem ou o PDF é decodificado e reconhecido localmente e nunca é enviado. O modelo de idioma é obtido de um CDN no primeiro uso e fica em cache, então as execuções seguintes começam na hora. Para obter os melhores resultados, use uma imagem nítida, bem iluminada e reta.

O texto em alemão depende dos tremas ä, ö, ü e do eszett (ß), e usa palavras compostas longas como "Lebensversicherungsgesellschaft" — exatamente os caracteres que um modelo genérico tende a achatar em a, o, u, ss ou quebrar em espaços. Este reconhecedor é ajustado para manter essas marcas e junções intactas, então é ideal para digitalizar faturas alemãs, cartas oficiais de Behörden, contratos, páginas de livros e impressões livres de Fraktur, onde um único trema perdido pode mudar a palavra.

Perguntas frequentes

Qual idioma este OCR reconhece?

Esta página pré-seleciona o modelo de um idioma, mas você pode mudar para qualquer idioma suportado — incluindo inglês, chinês, japonês, coreano e muitos idiomas europeus — usando o seletor acima da área de envio.

A imagem é enviada?

Não. A imagem ou o PDF é reconhecido totalmente no seu navegador, então nunca sai do seu dispositivo — seguro para documentos privados.

Ele consegue ler PDFs digitalizados?

Sim. Os PDFs digitalizados são rasterizados página por página e cada página é reconhecida, depois o texto é unido.

Por que a primeira execução é mais lenta?

O motor de reconhecimento e o modelo de idioma são baixados de um CDN na primeira vez que você os usa (alguns MB), depois ficam em cache, então as execuções seguintes começam na hora.

Ele mantém os tremas e o ß, ou os transforma em ae/oe/ue/ss?

Ele preserva ä, ö, ü e ß como os caracteres reais, em vez de transliterá-los para ae/oe/ue/ss, então o texto reconhecido corresponde à grafia original — embora uma digitalização muito fraca ou de baixa resolução ainda possa perder um ponto, então confira os tremas em páginas borradas.