Ismael Ramos Pérez, doctorando del programa en Ingeniería y Tecnologías Industrial, Informática y Civil, defiende el miércoles, 11 de septiembre su tesis doctoral titulada “Técnicas de preprocesamiento en datos anchos (Wide Data)”. Esta tesis ha sido dirigida por Jesús Manuel Maudes Raedo y Álvar Arnaiz González.
La defensa tendrá lugar el miércoles, 11 de septiembre en la Sala de Juntas 2 de la Escuela Politécnica Superior (Campus Río Vena) de la Universidad de Burgos y se retransmitirá por Microsoft TEAMS a las 11:00 h.
En el estudio de datos, especialmente en biología y genética, a menudo trabajamos con conjuntos de información que tienen muchas variables pero pocos ejemplos. Esto puede hacer que sea difícil obtener buenos resultados, ya que puede llevar a errores y prejuicios. Para solucionar estos problemas, es muy importante preparar bien los datos.
Esta tesis investiga diferentes maneras de preparar los datos, como elegir las variables más relevantes y equilibrar las diferentes categorías de información. También se analizan métodos que utilizan un poco de información adicional. A través de tres artículos, se comparan varias formas de preparar los datos y se propone una nueva forma de clasificar estos métodos.
Los resultados muestran que combinar bien estas técnicas de preparación puede ayudar a crear análisis más sólidos y útiles. Esta investigación ofrece una guía práctica para enfrentar los desafíos que presentan los conjuntos de datos anchos.