Inicio » Departamento de Telecomunicaciones » Defensa Tesis Maestría : “Deep learning for the analysis of network traffic measurements”

Defensa Tesis Maestría : “Deep learning for the analysis of network traffic measurements”

Jueves 28 de marzo 09:30hs, Salón Azul (piso 5, salón 502) – Facultad de Ingeniería, Julio Herrera y Reissig 565

Tenemos el agrado de invitarlos a la defensa de tesis de maestría de Gonzalo Marín :  “Deep learning for the analysis of network traffic measurements”

Tutor  : Pedro Casas (AIT, Viena, Austria) y Germán Capdehourat

Tribunal :  Pablo Belzarena (IIE), Alberto Castro Casales (InCo), Pablo Sprechmann (Google DeepMind, Londres, Inglaterra) y Pere Barlet-Ros (UPC BarcelonaTech, Barcelona, España)

Saludos,

Germán Capdehourat

Resumen :

En los últimos años, la aplicación de modelos de aprendizaje automático (Machine Learning) al análisis de mediciones de tráfico de red ha aumentado considerablemente. En este dominio, generalmente son utilizados modelos de aprendizaje automático tradicionales, donde es necesario definir, diseñar y construir un conjunto de características, de forma de ajustar los datos de entrada que luego se utilizarán para entrenar los modelos. Existen principalmente dos problemas asociados con este enfoque: en primer lugar, se requiere de conocimiento experto en el dominio para seleccionar un conjunto de características representativo para el problema de estudio; en segundo lugar, usualmente es necesario definir un conjunto de características diferente para abordar cada problema específico (por ejemplo, ciberseguridad, detección de anomalías, clasificación de tráfico, estimación de calidad de experiencia -QoE-, etc.). Por otro lado, la utilización de modelos de aprendizaje profundo (Deep Learning) al análisis de mediciones de tráfico de red aún no ha sido del todo explorado. Estos modelos han tenido gran éxito y popularidad, principalmente en el procesamiento de señales, con aplicaciones en: visión artificial, procesamiento de lenguaje natural, traducción automática y más recientemente en juegos. El objetivo principal de este trabajo de tesis es explorar el poder de los modelos de aprendizaje profundo aplicado al análisis de mediciones de tráfico de red. Con este fin, se aborda el problema específico de detección y clasificación de malware. Como principal ventaja con respecto al estado del arte, se considera la evaluación de diferentes representaciones para la entrada: a nivel de paquetes y a nivel de flujos. A su vez, se exploran diferentes arquitecturas de aprendizaje profundo, utilizando redes neuronales convolucionales y redes neuronales recurrentes de tipo LSTM como capas principales. Además, tres conjuntos de datos son elaborados a partir de capturas de tráfico de red, las cuales son luego utilizadas para construir las representaciones de entrada y para entrenar y validar los modelos. Finalmente, el desempeño de los modelos de aprendizaje profundo es comparado con el de un modelo de aprendizaje automático muy utilizado en la práctica, como el random forest. En el problema de detección de malware, se obtuvo una exactitud del 77,6% y 98,5% utilizando paquetes y flujos, respectivamente. En el caso de clasificación de malware, se obtuvo una exactitud promedio del 76,5%. En todas las evaluaciones, los modelos de aprendizaje profundo propuestos superaron la exactitud obtenida por los random forest. Estos resultados sugieren que es posible utilizar herramientas de aprendizaje profundo para complementar y mejorar el análisis de mediciones de tráfico de red sin necesidad de utilizar conocimiento experto para la construcción de conjuntos de características, dando lugar a un amplio espectro de aplicaciones para la utilización del aprendizaje profundo en redes de telecomunicaciones.