Pré-lançamento — todas as ferramentas ativas, grátis sem limites.

Converter PDF para Texto

Extraia o texto de cada página como um único arquivo .txt UTF-8 — no seu navegador.
Intervalos de páginas, sem envios, pronto para copiar e colar.

Solte seu PDF para extrair texto
Grátis até 50 MB. Pro até 250 MB. Processado no seu navegador.

Sobre a extração de PDF para Texto

PDF para Texto lê a camada de texto do PDF e emite um arquivo .txt UTF-8. O plano grátis lida com até 50 páginas; o Pro desbloqueia documentos maiores e conversão em lote. Diferente dos conversores que enviam o PDF para um servidor, a pdfmundo extrai texto localmente com o pdf.js da Mozilla — seu arquivo não sai da aba. PDFs com várias colunas (jornais, artigos acadêmicos em duas colunas) podem produzir texto com as colunas intercaladas; para extração que preserve o layout use PDF→Word. PDFs digitalizados sem camada de texto retornam zero texto — use OCR PDF primeiro para adicionar uma camada de texto.

Perguntas frequentes

Onde meu PDF é processado?
Inteiramente dentro da aba do navegador. Usamos o pdf.js da Mozilla para ler a camada de texto do PDF. Nada é enviado para o nosso servidor.
Por que meu PDF com várias colunas produz texto intercalado?
O pdf.js retorna os itens de texto na ordem em que aparecem no fluxo interno do PDF, que em layouts multicoluna pode intercalar as colunas pela posição vertical. Para extração que preserve a ordem de leitura por colunas, use PDF→Word — ele tem lógica dedicada de detecção de colunas.
E se meu PDF for uma imagem digitalizada sem camada de texto?
Então não há texto para extrair. Detectamos isso e oferecemos um link para nossa ferramenta OCR PDF, que adiciona uma camada de texto a PDFs só de imagem. Rode OCR primeiro, depois volte para extrair texto.
E se meu PDF tiver senha?
A ferramenta avisará. Remova a senha no seu software de PDF primeiro e depois extraia o texto.
A formatação será preservada?
Não. A saída em texto puro não tem formatação: sem negrito, itálico, tamanhos de fonte ou títulos. Para extração com formatação e layout, use PDF→Word.
Que codificação a saída usa?
UTF-8 sempre. Sem perda para qualquer PDF com caracteres Unicode, incluindo emoji, CJK, cirílico, grego, árabe, etc.
Qual o tamanho máximo?
25 MB e 50 páginas no grátis; 100 MB e praticamente sem limite de páginas no Pro.
Preciso de conta?
Não. A ferramenta é totalmente gratuita sem cadastro.

Mais ferramentas PDF

Depois do texto pronto, você pode fazer OCR num PDF digitalizado para adicionar uma camada de texto, converter preservando o layout com PDF→Word, ou extrair imagens de páginas com PDF→JPG.

Ver todas as ferramentas