Análisis de la Eficacia de Machine Learning para la Identificación de Phishing y Spam
BENEFICIARIO
La comunidad de seguridad aplicada
INTEGRANTES
- Juan Sebastián Vargas Guiza
- Carlos Andrés Becerra Madera
AÑO
2019
PALABRAS CLAVE
Machine Learning, Phishing, Spam
CONTEXTO
Evaluar la efectividad de la utilización de técnicas de ML en la identificación de ciberataques enfocados en Phishing y Spam.
PROPUESTA
Evaluar la efectividad de la utilización de técnicas de machine learning (ML) en la identificación de Phishing y Spam.
Para ello se propone:
- Analizar el estado del arte en la detección de Phishing y Spam basado en algoritmos de ML.
- Seleccionar tres estrategias de detección de Phishing y Spam utilizando una misma base de entrenamiento.
- Categorizar, comparar y concluir sobre los resultados y lecciones aprendidas derivado de los modelos de ML propuestos, especificando a su vez una métrica de efectividad.
RESULTADOS
Con base en el estado del arte se implementaron pruebas locales para seleccionar los algoritmos de clasificación con mayor precisión (accuracy) y las características (features) más representativas. (Se usaron algoritmos basados en aprendizaje supervisado).
Se desarrolló un prototipo para navegadores que usa el algoritmo y características seleccionadas para identificar phishing y se evaluó su comportamiento con páginas reales.