DAMASCO
Big Data Mining Using Social Content

Speaker 1

ORGANIZACIÓN

Investigación - Uniandes

INTEGRANTES

Profesora líder del proyecto: Claudia Jiménez

Muchos estudiantes han participado en el proyecto a través de sus proyectos de grado, en doctorado, maestría o pregrado. A continuación se relacionan algunos de ellos. Sus documentos de grado pueden ser consultados  en línea en la Biblioteca Uniandes.

  • Carlos Carvajal
  • Christian Ariza
  • Julio Mario Sosa
  • Camilo Restrepo
  • Valentina Grajales
  • Daniel Sarmiento

SEMESTRE

2019

PALABRAS CLAVE

Big Data Analysis, Context Analysis, Semantic Enrichment, Recommender Systems

OBJETIVO GLOBAL

Big Data (Datos Enormes) es el término para referirse al contexto de integración de información móvil, web, social, en la nube y contextualizada. Esta es información semiestructurada o no estructurada, profundamente heterogénea, proveniente de fuentes diversas usualmente autónomas, creciente de forma exponencial y no manipulable de forma efectiva con herramientas tradicionales de gestión de bases de datos.

La tecnología que la maneja deja de ser transaccional y se crean nuevas tecnologías que permiten su modelaje, almacenamiento, procesamiento, indexación y consulta de datos en gran escala. A nivel de almacenamiento, dicha tecnología se denomina NoSQL de manera general. Se acompaña del uso de infraestructuras de cómputo y almacenamiento en contextos de alta escalabilidad y procesamiento paralelo, estudiados en los contextos de Grid y Cloud Computing. Así mismo, integra técnicas de análisis de contenidos (texto, imágenes, video, documentos, páginas Web, …).

El proyecto busca la comprensión de la tecnología, evaluación de herramientas, planteamiento metodológico de modelaje de las arquitecturas subyacentes y estudio de técnicas de procesamiento bajo criterios de calidad de servicio propias a la gestión de Big Data y de contenidos.

Para el logro de estos objetivos se utilizan técnologías y técnicas altamente escalables, aprendizaje automático (Machine Learning), aprendizaje profundo (Deep Learning), sistemas de recomendación (Recommender Systems) y análisis de lenguaje natural (Natural Language Processing, Text Analytics), entre otros.

OBJETIVOS ESPECíFICOS

Los objetivos específicos son:

  • Estudiar y divulgar de la tecnología asociada con Big Data
  • Desarrollar técnicas de análisis de contenidos y generación de valor a través de la gestión de información semiestructurada y no estructurada
  • Aplicacar técnicas de Text Mining, Web Mining, Content Mining para el descubrimiento, recopilación y análisis de información
  • Aplicacar técnicas de aprendizaje automático (Machine Learning, Deep Learning) para la clasificación y comprensión de Big Data.
  • Desarrollar soluciones y modelos de analística basadas en análisis de contenidos
  • Desarrollar sistemas de recomendación basados en Big Data.


Enmarca proyectos de grado, tesis de maestría y doctorado, tomando en consideración el estado de avance del proyecto, el nivel de formación del estudiante, sus intereses y habilidades.

RESULTADOS TÉCNICOS

El proyecto ha enmarcado múltiples proyectos de grado, tesis de maestría y de doctorado. Los resultados más importantes se sitúan en los siguientes dominios:

  • Análisis de publicaciones en redes sociales para realizar enriquecimiento contextual automático.
  • Análisis de publicaciones de noticias para realizar enriquecimiento contextual automático.
  • Análisis de información Web para el enriquecimiento semántico y consulta efectiva para público no experto.
  • Framework para la arquitectura de soluciones de Big Data en el ecosistema Hadoop, a partir de los atributos de calidad esperados en una solución altamente escalable.

En la Revista Contacto se encuentra un artículo que permite conocer de forma rápida el alcance de este proyecto:

Corrupción en Contexto - Especial Inteligencia Artificial - (pág 19 de la revista, pág 10 del pdf)

También encuentra múltiples publicaciones sobre este tema acá -> Publicaciones C. Jiménez


Contáctenos

Dirección

Edificio Mario Laserna Cra 1Este No 19A - 40 | Oficina ML-772 | Bogotá (Colombia)

Teléfono

[571] 3394949 Ext: 2860, 2862