PDF a Excel
Informes financieros. Conjuntos de datos. Archivos gubernamentales.
Algunas tablas no deberían salir de tu dispositivo. Extráelas en tu navegador — nada se sube.
Detectando tablas…
{tableCount} tabla(s) extraída(s)
Éxito
Tus tablas se han extraído. Descarga abajo.
{tableCount} tabla(s) extraída(s), con notas
Éxito con notas
Extracción completada. Consulta las notas abajo para detalles sobre niveles de confianza y contenido omitido.
Notas de la extracción
Confianza por tabla
La extracción de tablas de PDF es estadística. Cada tabla detectada lleva un nivel de confianza — alta (bien alineada), media (alguna ambigüedad estructural) o baja (ambigüedad significativa; revisión recomendada).
Sobre extraer tablas de PDFs
Qué extrae esta herramienta
Tablas bien alineadas, tablas sin bordes (el algoritmo usa geometría de texto, no bordes visuales) y continuaciones de tablas multi-página (cuando los anclajes de columna y firmas de encabezado coinciden entre páginas). Las tablas detectadas aparecen con niveles de confianza — alta, media o baja — para juzgar la fiabilidad de cada tabla antes del uso posterior.
Cuándo usarla
Informes financieros, conjuntos de datos de investigación, registros públicos extraídos, archivos gubernamentales, exportaciones de datos internos — cualquier cosa donde el PDF original contenga información lo suficientemente sensible para que subirla a un convertidor de terceros sea la forma incorrecta, pero suficientemente estructurada para que volver a escribir las tablas manualmente también sea la forma incorrecta.
Privacidad
Según investigación empírica, todos los competidores accesibles de PDF→Excel (Smallpdf, iLovePDF, PDFCandy, PDF24, Convertio) procesan el contenido en sus servidores o con encuadre ambiguo de "basado en navegador". Adobe Acrobat tiene la función tras una suscripción. El cuadrante de privacidad solo-en-navegador está desocupado. PDF a Excel se ejecuta enteramente en tu dispositivo vía pdfjs + SheetJS.
Señales de confianza
La extracción de tablas de PDF es estadística, no determinista. Tool 28 expone niveles de confianza por tabla (alta / media / baja) basados en alineación de columna, ratio de celdas vacías y conteo de filas. Ningún competidor accesible expone confianza — todos afirman "integridad estructural preservada" sin reconocer la pérdida inherente a la extracción por posicionamiento de texto.
Qué no manejamos y por qué
Los PDFs escaneados necesitan OCR primero — redirigimos a OCR PDF. Los PDFs encriptados necesitan que se quite la contraseña primero — hazlo en tu software de PDF. Los PDFs corruptos necesitan reparación primero — redirigimos a Reparar PDF. Las tablas de baja confianza emergen con notas explícitas.
Después de la extracción
Añade contraseña a la hoja extraída antes de compartirla con Proteger PDF — mantiene exportaciones financieras y de investigación cifradas en reposo.
Preguntas frecuentes
- ¿Qué tipos de PDFs funcionan mejor?
- PDFs de texto bien alineados (exportaciones de Excel, informes generados, datos gubernamentales). Las tablas sin bordes funcionan — el algoritmo usa geometría de texto, no bordes visuales. Las páginas multi-tabla producen una hoja por tabla. Los PDFs escaneados necesitan OCR primero vía la herramienta OCR PDF.
- ¿Por qué mi tabla puede verse mal?
- La extracción de tablas de PDF es estadística. El algoritmo agrupa elementos de texto por posición para inferir filas y columnas. Las tablas bien alineadas producen extracciones de alta confianza; tablas con celdas combinadas, contenido multi-línea o diseños inusuales pueden producir extracciones de confianza media o baja con notas visibles. Para datos críticos, revisa manualmente las tablas de baja confianza.
- ¿Puedo extraer tablas de PDFs escaneados?
- No. Tool 28 requiere PDFs con texto seleccionable. Para PDFs escaneados (solo imagen), ejecuta OCR PDF primero para añadir una capa de texto, y vuelve a PDF a Excel. No incluimos OCR en v1 — la herramienta OCR PDF existente cubre el caso sin coste marginal.
- ¿Puedo extraer tablas de PDFs protegidos con contraseña?
- No. v1 rechaza el descifrado. Quita la contraseña en tu software de PDF primero, y vuelve a PDF a Excel. No transmitimos tu contraseña a través de pdfmundo.
- ¿Mis PDFs se suben a sus servidores?
- No. Toda la extracción se ejecuta en tu navegador vía pdfjs y SheetJS. Los informes financieros, conjuntos de datos de investigación y archivos gubernamentales nunca salen de tu dispositivo. No tenemos servidores recibiendo el contenido.
- ¿Debería usar XLSX o CSV?
- XLSX preserva la estructura multi-tabla (una hoja por tabla detectada), pistas de formato de encabezado y metadatos de confianza. Usa XLSX para trabajo posterior en Excel / LibreOffice. Usa CSV cuando alimentes una tubería de datos (Pandas, R, Python) que prefiere texto plano; las salidas multi-tabla en CSV se agrupan como ZIP.