OCR de Árabe
Use este OCR de Árabe grátis para extrair texto editável de uma imagem ou PDF digitalizado — o reconhecimento funciona totalmente no seu navegador, então seu arquivo nunca é enviado.
O mecanismo de OCR é baixado no primeiro uso (alguns MB) e fica armazenado em cache depois.
Mais predefinições
Vá para outra predefinição — cada uma abre na própria página, pronta para usar:
Como usar o OCR de Árabe
- Arraste e solte uma imagem ou PDF digitalizado — o idioma já vem pré-selecionado para você.
- Aguarde enquanto o texto é reconhecido (o modelo de idioma é baixado uma vez e depois fica em cache).
- Copie ou baixe o texto reconhecido.
Sobre o OCR de Árabe
O reconhecimento óptico de caracteres (OCR) transforma as letras de uma foto ou digitalização em texto real e editável. Este OCR de Árabe usa um modelo de idioma treinado para essa escrita, então os caracteres específicos do idioma e da escrita são reconhecidos com muito mais precisão do que com um modelo apenas em inglês.
Tudo acontece no seu navegador — a imagem ou o PDF é decodificado e reconhecido localmente e nunca é enviado. O modelo de idioma é obtido de um CDN no primeiro uso e fica em cache, então as execuções seguintes começam na hora. Para obter os melhores resultados, use uma imagem nítida, bem iluminada e reta.
O árabe é escrito da direita para a esquerda em uma escrita conectada e cursiva, onde a maioria das letras assume uma forma diferente dependendo de estar no início, no meio ou no fim de uma palavra, ou isolada — então o modelo precisa reconhecer a forma contextual de cada letra, em vez de um único glifo fixo. Os diacríticos opcionais (marcas de vogais curtas e tashkeel) acrescentam outra camada acima e abaixo da linha. O OCR de Árabe é a forma prática de extrair texto de livros digitalizados, documentos oficiais, placas e capturas de tela em escritas no estilo árabe, persa ou urdu e transformá-lo em texto editável, pesquisável e copiável.
Perguntas frequentes
Qual idioma este OCR reconhece?
Esta página pré-seleciona o modelo de um idioma, mas você pode mudar para qualquer idioma suportado — incluindo inglês, chinês, japonês, coreano e muitos idiomas europeus — usando o seletor acima da área de envio.
A imagem é enviada?
Não. A imagem ou o PDF é reconhecido totalmente no seu navegador, então nunca sai do seu dispositivo — seguro para documentos privados.
Ele consegue ler PDFs digitalizados?
Sim. Os PDFs digitalizados são rasterizados página por página e cada página é reconhecida, depois o texto é unido.
Por que a primeira execução é mais lenta?
O motor de reconhecimento e o modelo de idioma são baixados de um CDN na primeira vez que você os usa (alguns MB), depois ficam em cache, então as execuções seguintes começam na hora.
Ele mantém a ordem da direita para a esquerda e as marcas diacríticas?
O texto reconhecido é retornado na ordem correta da direita para a esquerda, e as marcas de vogais curtas/tashkeel são captadas quando estão impressas com clareza — embora os diacríticos fracos ou adicionados à mão sejam fáceis de perder, então confira o texto vocalizado de perto.