Funciona com texto manuscrito?

Funciona, mas com precisão menor (geralmente 60-80%). Quanto mais limpa a letra, melhor. Letra cursiva fica mais difícil que letra de forma. Considere sempre revisar o resultado.

O OCR pode processar PDF com várias línguas?

O modelo entende uma língua por vez. Se seu PDF é misto, divida em pedaços por idioma e processe separadamente. Outra opção é usar idioma "principal" e revisar manualmente o resto.

Tem limite de páginas?

No plano grátis tem limite de operações por mês, mas dentro de cada operação você pode processar PDFs longos. Pra documentos com 100+ páginas, considere o plano pago pra processamento mais rápido.

O texto extraído é privado?

Sim. O processamento acontece em nossos servidores (não em terceiros), os arquivos são apagados em poucos minutos depois do download, e nada vai pra IA de treinamento. Política completa em /privacidade.

O OCR consegue ler tabelas e mantém o layout?

Texto puro (.txt) perde o layout. PDF pesquisável mantém o visual original. Pra exportar tabela em formato editável (Excel, Google Sheets), o melhor é usar a ferramenta PDF→Excel depois do OCR.

Funciona em fotos de documento (não escaneados)?

Funciona, mas a qualidade depende muito da foto. Iluminação irregular, sombras e perspectiva inclinada degradam o resultado. Apps como o "scanner" do Google Drive ou CamScanner pré-processam a foto antes — use eles primeiro.

Tutorial · ocr

Como extrair texto de PDF escaneado (OCR)

Recebeu um documento escaneado e não consegue copiar nada do conteúdo? OCR resolve. Aqui você converte em PDF pesquisável ou texto puro em segundos.

4 min de leituraAtualizado em 25 de abril de 2026

Você recebe um contrato escaneado e tenta selecionar uma cláusula pra colar em um email — nada acontece. O cursor passa por cima do texto sem reagir. Isso porque o "texto" do PDF é na verdade uma imagem fotografada de uma folha. Pra qualquer programa, é como se você tivesse selecionado um JPG.

OCR (Optical Character Recognition) é a tecnologia que faz a máquina "ler" essas imagens e converter pra texto de verdade. O resultado é um documento que você pode pesquisar com Ctrl+F, copiar trechos, editar no Word, indexar em busca, ou alimentar em LLM.

Como saber se um PDF é escaneado

Teste rápido em 3 segundos: abre o PDF e tenta selecionar uma palavra com o mouse. Se selecionar bonitinho (texto fica destacado em azul, palavra por palavra), o PDF tem texto real e não precisa de OCR. Se você só consegue desenhar um retângulo por cima, é imagem — precisa de OCR.

Outro sinal: tenta dar Ctrl+F e procurar uma palavra que VOCÊ SABE que tá no documento. Se não encontrar, é porque o conteúdo é imagem.

Quando OCR é a melhor solução

Contratos antigos digitalizados — pra extrair cláusulas, datas, valores
Notas fiscais escaneadas — pra alimentar planilhas de despesa
Livros e artigos científicos — pra citar trechos, traduzir
Documentos do RH — RGs, comprovantes, holerites pra cadastros
Histórico médico — pra digitalizar prontuários antigos
Pesquisas de campo — formulários preenchidos à mão (parcialmente)

Espaço publicitário

Passo a passo: extrair texto com OCR

1. Selecione o arquivo escaneado

Funciona com PDF, JPG, PNG e TIFF. Pode subir documento de várias páginas — o OCR processa tudo de uma vez e mantém a ordem.

2. Escolha o idioma do conteúdo

Suportamos português, inglês e espanhol. O OCR usa modelos diferentes pra cada idioma — escolher errado piora a precisão. Se o documento tem múltiplos idiomas (relatório bilíngue, por exemplo), processe cada parte separadamente.

3. Escolha o formato de saída

PDF pesquisável — mantém o visual original mas adiciona uma camada de texto invisível por cima. Você pode dar Ctrl+F, copiar e colar normalmente.
Texto puro (.txt) — só o conteúdo extraído, sem formatação. Bom pra alimentar planilha, importar em sistema, processar com IA.
Word (.docx) — converte com formatação básica preservada (parágrafos, alinhamento). Bom pra editar.

4. Processe e baixe

OCR é mais lento que outras conversões (cada página leva 2-10 segundos dependendo da resolução). Quando terminar, você baixa o arquivo no formato escolhido.

Como melhorar a qualidade do OCR

A precisão do OCR depende muito da qualidade da imagem original. Algumas dicas:

Escaneie em pelo menos 300 DPI — abaixo disso letras pequenas borram
Garanta que a página esteja reta — fotos tortas e perspectivas diagonais confundem o reconhecimento
Limpe sujeiras e dobras antes de escanear — manchas viram caracteres aleatórios
Prefira fundo branco e tinta preta — alto contraste = melhor leitura
Evite scan de tela — Moiré e pixelização atrapalham

Espaço publicitário

Bonus: OCR + outras ferramentas

OCR libera várias possibilidades depois:

OCR + Compress — depois do OCR, o PDF fica MUITO mais leve (texto pesa muito menos que imagem)
OCR + Word — extrai pra .docx pra editar e revisar
OCR + Excel — se o documento for tabela, OCR + conversor Excel separa em colunas
OCR + ChatGPT — joga o texto extraído na IA pra resumir, traduzir ou analisar

Perguntas frequentes

Em texto digitado, claro, com boa resolução: 98-99% de acurácia. Em manuscrito legível: 70-90%. Em rabiscos: 40-60%. Sempre revise quando precisão importar (contrato, dado contábil).

Outros guias

Mais tutoriais que talvez ajudem