Tutorial · ocr
Como extrair texto de PDF escaneado (OCR)
Recebeu um documento escaneado e não consegue copiar nada do conteúdo? OCR resolve. Aqui você converte em PDF pesquisável ou texto puro em segundos.
Você recebe um contrato escaneado e tenta selecionar uma cláusula pra colar em um email — nada acontece. O cursor passa por cima do texto sem reagir. Isso porque o "texto" do PDF é na verdade uma imagem fotografada de uma folha. Pra qualquer programa, é como se você tivesse selecionado um JPG.
OCR (Optical Character Recognition) é a tecnologia que faz a máquina "ler" essas imagens e converter pra texto de verdade. O resultado é um documento que você pode pesquisar com Ctrl+F, copiar trechos, editar no Word, indexar em busca, ou alimentar em LLM.
Como saber se um PDF é escaneado
Teste rápido em 3 segundos: abre o PDF e tenta selecionar uma palavra com o mouse. Se selecionar bonitinho (texto fica destacado em azul, palavra por palavra), o PDF tem texto real e não precisa de OCR. Se você só consegue desenhar um retângulo por cima, é imagem — precisa de OCR.
Outro sinal: tenta dar Ctrl+F e procurar uma palavra que VOCÊ SABE que tá no documento. Se não encontrar, é porque o conteúdo é imagem.
Quando OCR é a melhor solução
- Contratos antigos digitalizados — pra extrair cláusulas, datas, valores
- Notas fiscais escaneadas — pra alimentar planilhas de despesa
- Livros e artigos científicos — pra citar trechos, traduzir
- Documentos do RH — RGs, comprovantes, holerites pra cadastros
- Histórico médico — pra digitalizar prontuários antigos
- Pesquisas de campo — formulários preenchidos à mão (parcialmente)
Passo a passo: extrair texto com OCR
1. Selecione o arquivo escaneado
Funciona com PDF, JPG, PNG e TIFF. Pode subir documento de várias páginas — o OCR processa tudo de uma vez e mantém a ordem.
2. Escolha o idioma do conteúdo
Suportamos português, inglês e espanhol. O OCR usa modelos diferentes pra cada idioma — escolher errado piora a precisão. Se o documento tem múltiplos idiomas (relatório bilíngue, por exemplo), processe cada parte separadamente.
3. Escolha o formato de saída
- PDF pesquisável — mantém o visual original mas adiciona uma camada de texto invisível por cima. Você pode dar Ctrl+F, copiar e colar normalmente.
- Texto puro (.txt) — só o conteúdo extraído, sem formatação. Bom pra alimentar planilha, importar em sistema, processar com IA.
- Word (.docx) — converte com formatação básica preservada (parágrafos, alinhamento). Bom pra editar.
4. Processe e baixe
OCR é mais lento que outras conversões (cada página leva 2-10 segundos dependendo da resolução). Quando terminar, você baixa o arquivo no formato escolhido.
Como melhorar a qualidade do OCR
A precisão do OCR depende muito da qualidade da imagem original. Algumas dicas:
- Escaneie em pelo menos 300 DPI — abaixo disso letras pequenas borram
- Garanta que a página esteja reta — fotos tortas e perspectivas diagonais confundem o reconhecimento
- Limpe sujeiras e dobras antes de escanear — manchas viram caracteres aleatórios
- Prefira fundo branco e tinta preta — alto contraste = melhor leitura
- Evite scan de tela — Moiré e pixelização atrapalham
Bonus: OCR + outras ferramentas
OCR libera várias possibilidades depois:
- OCR + Compress — depois do OCR, o PDF fica MUITO mais leve (texto pesa muito menos que imagem)
- OCR + Word — extrai pra .docx pra editar e revisar
- OCR + Excel — se o documento for tabela, OCR + conversor Excel separa em colunas
- OCR + ChatGPT — joga o texto extraído na IA pra resumir, traduzir ou analisar
Perguntas frequentes
Outros guias
Mais tutoriais que talvez ajudem
Como gerar QR Code PIX grátis (passo a passo)
Sem precisar abrir o app do banco, sem cadastro, sem instalar nada. Você gera um QR Code PIX válido em qualquer banco e baixa em PNG ou SVG.
4 min de leituraComo comprimir PDF grátis sem marca d'água
Vários sites cortam o tamanho do PDF mas deixam um carimbo no documento. Aqui você comprime de verdade — qualidade boa, peso baixo, zero watermark.
4 min de leituraComo gerar link UTM para Google Ads
Sem UTM você não consegue rastrear de onde veio cada conversão. Aprende aqui a estrutura certa, com templates prontos e a ferramenta gratuita.
5 min de leitura