NLBSE (Natural Language-Based Software Engineering) es una competición enfocada en el desarrollo de soluciones basadas en procesamiento de lenguaje natural para problemas en ingeniería de software. Los participantes crean herramientas y modelos que mejoran la clasificación, análisis y gestión de problemas en proyectos de software, utilizando técnicas avanzadas como embeddings contextuales y métodos de aprendizaje automático para resolver desafíos complejos en entornos de desarrollo de software.
En el primer semestre del año 2024 la Universidad de los Andes destacó en la conferencia ICSE celebrada en Lisboa, Portugal, gracias a la participación de Daniel Gómez y su equipo en la competencia NLBSE 2024. El trabajo titulado “Lessons from the NLBSE 2024 Competition: Towards Building Efficient Models for GitHub Issue Classification” presentó una solución innovadora para clasificar issues de GitHub en tres categorías: bugs, mejoras y preguntas.
El equipo, conformado por cinco estudiantes de ingeniería de sistemas y computación (disc)—Daniel Gómez, Luccas Rojas, Juan Pinzón, David Ortiz y Juan Arboleda—junto a los profesores Rubén Manrique y Mario Linares, desarrolló una herramienta única llamada CFFitST. Esta solución emplea un avanzado método de entrenamiento adaptativo de embeddings contextuales, optimizando el uso de datos en problemas de few-shot.
Durante el proceso de desarrollo, los participantes pusieron en práctica conocimientos adquiridos en la clase de Procesamiento de Lenguaje Natural durante el segundo semestre de 2023. Gracias a la guía y apoyo constante de sus profesores, lograron superar los desafíos técnicos y alcanzar un F1-score superior en comparación con la solución ganadora del año anterior, logrando así el segundo puesto en la competencia.