OCR de Árabe

Use este OCR de Árabe grátis para extrair texto editável de uma imagem ou PDF digitalizado — o reconhecimento funciona totalmente no seu navegador, então seu arquivo nunca é enviado.

Idioma

Solte uma imagem ou PDF aqui ou clique para procurarImagens (JPG, PNG, WebP…) e PDFs digitalizados

O mecanismo de OCR é baixado no primeiro uso (alguns MB) e fica armazenado em cache depois.

Mais predefinições

Vá para outra predefinição — cada uma abre na própria página, pronta para usar:

Como usar o OCR de Árabe

Arraste e solte uma imagem ou PDF digitalizado — o idioma já vem pré-selecionado para você.
Aguarde enquanto o texto é reconhecido (o modelo de idioma é baixado uma vez e depois fica em cache).
Copie ou baixe o texto reconhecido.

Sobre o OCR de Árabe

O reconhecimento óptico de caracteres (OCR) transforma as letras de uma foto ou digitalização em texto real e editável. Este OCR de Árabe usa um modelo de idioma treinado para essa escrita, então os caracteres específicos do idioma e da escrita são reconhecidos com muito mais precisão do que com um modelo apenas em inglês.

Tudo acontece no seu navegador — a imagem ou o PDF é decodificado e reconhecido localmente e nunca é enviado. O modelo de idioma é obtido de um CDN no primeiro uso e fica em cache, então as execuções seguintes começam na hora. Para obter os melhores resultados, use uma imagem nítida, bem iluminada e reta.

O árabe é escrito da direita para a esquerda em uma escrita conectada e cursiva, onde a maioria das letras assume uma forma diferente dependendo de estar no início, no meio ou no fim de uma palavra, ou isolada — então o modelo precisa reconhecer a forma contextual de cada letra, em vez de um único glifo fixo. Os diacríticos opcionais (marcas de vogais curtas e tashkeel) acrescentam outra camada acima e abaixo da linha. O OCR de Árabe é a forma prática de extrair texto de livros digitalizados, documentos oficiais, placas e capturas de tela em escritas no estilo árabe, persa ou urdu e transformá-lo em texto editável, pesquisável e copiável.

Perguntas frequentes

Qual idioma este OCR reconhece?

Esta página pré-seleciona o modelo de um idioma, mas você pode mudar para qualquer idioma suportado — incluindo inglês, chinês, japonês, coreano e muitos idiomas europeus — usando o seletor acima da área de envio.

A imagem é enviada?

Não. A imagem ou o PDF é reconhecido totalmente no seu navegador, então nunca sai do seu dispositivo — seguro para documentos privados.

Ele consegue ler PDFs digitalizados?

Sim. Os PDFs digitalizados são rasterizados página por página e cada página é reconhecida, depois o texto é unido.

Por que a primeira execução é mais lenta?

O motor de reconhecimento e o modelo de idioma são baixados de um CDN na primeira vez que você os usa (alguns MB), depois ficam em cache, então as execuções seguintes começam na hora.

Ele mantém a ordem da direita para a esquerda e as marcas diacríticas?

O texto reconhecido é retornado na ordem correta da direita para a esquerda, e as marcas de vogais curtas/tashkeel são captadas quando estão impressas com clareza — embora os diacríticos fracos ou adicionados à mão sejam fáceis de perder, então confira o texto vocalizado de perto.