breve
OCRmyPDF es una herramienta de código abierto diseñada para añadir una capa de texto OCR (Reconocimiento Óptico de Caracteres) a archivos PDF escaneados para que se puedan realizar búsquedas en ellos o copiar y pegar. Es compatible con varios idiomas y puede optimizar el tamaño del archivo PDF y mantener la resolución de la imagen original. El proyecto ha recibido más de 26,8 mil estrellas en GitHub y es muy popular entre los desarrolladores.

función clave
- Capa de texto OCRConvertir PDF escaneados en formato PDF/A para facilitar la búsqueda o copia de texto.
- Soporte multilingüe: compatible con más de 100 idiomas, los usuarios pueden
-l
para especificar el idioma (por ejemplo-l eng+fra
(Se admiten los idiomas inglés y francés). - Optimización de imágenesOptimización de imágenes PDF durante el OCR : La optimización de imágenes PDF durante el OCR suele producir archivos PDF más pequeños que los originales.
- Corrección de páginaSoporte para la rotación automática de páginas inclinadas (
--rotate-pages
) y corregir páginas dobladas (--deskew
). - procesamiento multinúcleo: Acelera el procesamiento de OCR utilizando CPU multinúcleo para mejorar la eficacia.
- PrivacidadGarantía de que los datos privados de los usuarios no se vean comprometidos.
- archivo por lotesCapacidad para procesar eficazmente archivos PDF de gran tamaño que contengan miles de páginas.
Adecuado para personas
- oficinista: Necesidad de convertir documentos en papel escaneados en documentos electrónicos editables.
- Biblioteca o archivoLa necesidad de digitalizar un gran número de documentos históricos.
- desarrolladoresDesea integrar la funcionalidad OCR en sus propias aplicaciones.
- usuario habitualUsuarios particulares que necesitan tratar ocasionalmente documentos PDF escaneados.
Instalación
OCRmyPDF es compatible con diversos sistemas operativos, como Linux, Windows, macOS y FreeBSD. A continuación se indican los métodos de instalación más comunes:
- Debian/Ubuntu::
apt install ocrmypdf
- macOS (Homebrew)::
brew install ocrmypdf
- Subsistema Windows para Linux::
apt install ocrmypdf
- Docker: Existen réplicas para arquitecturas x64 y ARM.
Encontrará más opciones de instalación en官方文档.
resúmenes
OCRmyPDF es una herramienta potente y fácil de usar que convierte archivos PDF escaneados en documentos electrónicos que permiten realizar búsquedas. Puede ser utilizada tanto por usuarios particulares como por empresas para mejorar la eficiencia del procesamiento de documentos. Si tiene que trabajar a menudo con archivos PDF escaneados, merece la pena probar OCRmyPDF.
Enlace a la web oficial
📢 Descargo de responsabilidad | Recordatorio de uso de la herramienta
1️⃣ El contenido de este artículo se basa en la información conocida en el momento de su publicación. La tecnología y las herramientas de IA se actualizan con frecuencia; consulte las últimas instrucciones oficiales.
2️⃣ Las herramientas recomendadas han sido sometidas a un control básico pero no a una validación de seguridad en profundidad, por lo que le recomendamos que evalúe usted mismo la idoneidad y el riesgo.
3️⃣ Cuando utilices herramientas de IA de terceros, presta atención a la protección de la privacidad de los datos y evita cargar información sensible.
4️⃣ Este sitio web no se hace responsable de los daños directos/indirectos debidos al mal uso de la herramienta, fallos técnicos o desviaciones del contenido.
5️⃣ Algunas herramientas pueden implicar una suscripción de pago, por favor tome una decisión racional, este sitio no contiene ningún consejo de inversión.