Extractor de emails de documentos PDF/TXT
Extractor de Correos Electrónicos
Este script en Python permite extraer direcciones de correo electrónico desde documentos en formato PDF y TXT. Es útil para auditorías de seguridad, análisis forenses o recopilación de datos en proyectos de pentesting.
🧩 Descripción
El script escanea archivos PDF y TXT en busca de patrones que coincidan con direcciones de correo electrónico válidas. Utiliza expresiones regulares para identificar y extraer los correos electrónicos encontrados en el contenido de los documentos.
⚙️ Requisitos
-
Python 3.x
-
Bibliotecas necesarias:
re
(para expresiones regulares)PyPDF2
(para leer archivos PDF)
🛠️ Instalación
-
Clona el repositorio:
git clone https://github.com/MarcosCarmonaGarcia/Extractor_emails.git cd Extractor_emails
-
Instala las dependencias necesarias:
pip install -r requirements.txt
📄 Uso
Ejecuta el script pasando como argumento el archivo o directorio que deseas analizar:
python3 extractor_emails.py archivo.pdf
El script procesará el archivo y mostrará en consola las direcciones de correo electrónico encontradas.
🔐 Aplicaciones
- Auditorías de seguridad para identificar correos electrónicos expuestos.
- Análisis forenses de documentos.
- Recopilación de datos para pruebas de penetración.
📄 Licencia
Este proyecto está bajo la Licencia MIT.