OCR de Coreano

Use este OCR de Coreano grátis para extrair texto editável de uma imagem ou PDF digitalizado — o reconhecimento funciona totalmente no seu navegador, então seu arquivo nunca é enviado.

Idioma

Solte uma imagem ou PDF aqui ou clique para procurarImagens (JPG, PNG, WebP…) e PDFs digitalizados

O mecanismo de OCR é baixado no primeiro uso (alguns MB) e fica armazenado em cache depois.

Mais predefinições

Vá para outra predefinição — cada uma abre na própria página, pronta para usar:

Como usar o OCR de Coreano

Arraste e solte uma imagem ou PDF digitalizado — o idioma já vem pré-selecionado para você.
Aguarde enquanto o texto é reconhecido (o modelo de idioma é baixado uma vez e depois fica em cache).
Copie ou baixe o texto reconhecido.

Sobre o OCR de Coreano

O reconhecimento óptico de caracteres (OCR) transforma as letras de uma foto ou digitalização em texto real e editável. Este OCR de Coreano usa um modelo de idioma treinado para essa escrita, então os caracteres específicos do idioma e da escrita são reconhecidos com muito mais precisão do que com um modelo apenas em inglês.

Tudo acontece no seu navegador — a imagem ou o PDF é decodificado e reconhecido localmente e nunca é enviado. O modelo de idioma é obtido de um CDN no primeiro uso e fica em cache, então as execuções seguintes começam na hora. Para obter os melhores resultados, use uma imagem nítida, bem iluminada e reta.

O texto coreano não é escrito letra por letra: os jamo individuais (consoantes e vogais) são empilhados em blocos silábicos quadrados como 한 e 글, e este OCR lê cada bloco composto como um único caractere, em vez de tentar decompô-lo em suas partes. Isso importa ao digitalizar livros, placas, hwagongmun e capturas de tela em coreano, e o mesmo modelo também capta o hanja (caracteres chineses) ainda espalhado pela escrita coreana mais antiga e formal.

Perguntas frequentes

Qual idioma este OCR reconhece?

Esta página pré-seleciona o modelo de um idioma, mas você pode mudar para qualquer idioma suportado — incluindo inglês, chinês, japonês, coreano e muitos idiomas europeus — usando o seletor acima da área de envio.

A imagem é enviada?

Não. A imagem ou o PDF é reconhecido totalmente no seu navegador, então nunca sai do seu dispositivo — seguro para documentos privados.

Ele consegue ler PDFs digitalizados?

Sim. Os PDFs digitalizados são rasterizados página por página e cada página é reconhecida, depois o texto é unido.

Por que a primeira execução é mais lenta?

O motor de reconhecimento e o modelo de idioma são baixados de um CDN na primeira vez que você os usa (alguns MB), depois ficam em cache, então as execuções seguintes começam na hora.

Ele mantém as sílabas coreanas juntas ou as divide em jamo separados?

Ele gera blocos silábicos inteiros e pré-compostos (então 한 permanece como um único caractere), que é o que você quer para copiar em documentos ou pesquisas — ele não os decompõe em jamo iniciais/mediais/finais soltos.