Saltar al contenido
100% privado — tus archivos no salen de tu dispositivo

Cómo convertir un PDF escaneado a texto editable (OCR, gratis)

Un PDF escaneado es solo una foto de la página — no puedes seleccionar ni buscar el texto. Así el OCR lo convierte en texto real y editable gratis, en tu navegador.

Escaneas un documento, abres el PDF, intentas copiar una frase — y no se selecciona nada. Es porque un PDF escaneado no es texto en absoluto: es una foto de una página. Para convertirlo en palabras que puedas editar, buscar y copiar necesitas OCR — y puedes hacerlo gratis, en tu navegador, sin subir el escaneo.

Qué hace realmente el OCR

El OCR (reconocimiento óptico de caracteres) mira la imagen de tu página, reconoce la forma de cada letra y número, y los reconstruye como texto real. Es la diferencia entre la foto de un recibo y un recibo del que puedes copiar y pegar las cifras.

Por eso tantas conversiones de «PDF a Word» o «PDF a Excel» vuelven vacías: el origen era un escaneo y, sin OCR, no había texto que extraer.

Cómo hacer OCR a un PDF escaneado

  1. Abre la herramienta OCR PDF.
  2. Añade tu PDF escaneado.
  3. Elige el idioma del documento (español, inglés, francés, alemán y 8 más) — es el mayor factor de precisión.
  4. Pulsa Ejecutar OCR y descarga el texto reconocido.

La primera ejecución descarga el motor de reconocimiento (unos 4 MB, luego cacheado) y el trabajo ocurre en tu propia CPU. Unas páginas tardan segundos; un documento largo tarda un poco más.

Consigue la mejor precisión

La calidad del OCR depende sobre todo de la entrada. Para resultados limpios:

  • Escanea a 300 dpi. Por debajo de ~200 dpi, las letras se emborronan y la precisión baja.
  • Mantén las páginas rectas. Los escaneos torcidos confunden al motor — endereza antes del OCR si puedes.
  • Elige el idioma correcto. Un documento en español leído como inglés destrozará las tildes y las palabras comunes.
  • El texto impreso gana a la escritura a mano. El OCR es excelente con fuentes impresas; la escritura a mano es irregular.

Después del OCR: llévalo a Word o Excel

Una vez tienes el texto, el siguiente paso depende de lo que necesites:

  • ¿Solo las palabras? El OCR te da un .txt limpio que puedes pegar donde quieras.
  • ¿Un documento para editar? Pasa el resultado por PDF a Word para un .docx editable.
  • ¿Una tabla de números (como una factura o extracto escaneado)? Usa PDF a Excel para llevarlo a una hoja de cálculo.
  • ¿Ya es un PDF con texto real (no un escaneo)? No necesitas OCR — PDF a Texto lo extrae directamente.

La diferencia de privacidad

Los documentos escaneados suelen ser lo más sensible que la gente digitaliza: DNI, contratos, cartas del banco, informes médicos. La mayoría de webs de OCR suben esos escaneos a sus servidores para procesarlos — justo lo que no hay que hacer con el escaneo de un pasaporte.

La herramienta OCR PDF es distinta por diseño: el reconocimiento corre en tu navegador mediante WebAssembly. Las páginas nunca se suben; solo se descarga el motor open source Tesseract a tu máquina. Tu escaneo, tu dispositivo, tu texto.