Descifrando la Resistencia Bacteriana: Aplicación de Machine Learning en el Análisis de Toxinas de Anfibios
highlight_off

Se propone un proyecto de investigación con el propósito de modelar predictivamente el efecto antimicrobiano de toxinas extraídas de anfibios mediante machine learning, el cual se centraría en varios aspectos clave:
- Recolección de Datos: Se recolectarían diferentes toxinas de anfibios conocidos por sus propiedades antimicrobianas. Estos datos incluirían la estructura química de las toxinas, su composición y cualquier dato histórico sobre su efectividad contra diversos patógenos.
- Preprocesamiento de Datos: Los datos recolectados serían limpiados, organizados y preprocesados para ser aptos para el análisis. Esto podría incluir la normalización de los datos, el manejo de valores perdidos y la transformación de las características necesarias para el modelado.
- Selección de Características: Se identificarían las características relevantes de las toxinas (por ejemplo, propiedades físico-químicas, peso molecular, etc.) que podrían influir en su efectividad antimicrobiana.
- Entrenamiento del Modelo: Utilizando técnicas de machine learning, como redes neuronales, bosques aleatorios, o máquinas de soporte vectorial, se entrenarían uno o varios modelos predictivos con el objetivo de predecir la efectividad antimicrobiana de nuevas toxinas.
- Validación y Evaluación: Los modelos desarrollados serían validados y evaluados mediante métricas como precisión, sensibilidad, especificidad y curvas ROC, utilizando un conjunto de datos de prueba que no se haya utilizado durante el entrenamiento.
- Implementación y Optimización: Después de la validación, el modelo sería optimizado y eventualmente implementado en una plataforma que permita la evaluación rápida de toxinas nuevas o modificadas.
- Resultados y Aplicaciones: Los resultados de este proyecto podrían potencialmente llevar al descubrimiento de nuevas toxinas con capacidades antimicrobianas efectivas, que luego podrían ser desarrolladas para aplicaciones médicas, como nuevos antibióticos o tratamientos antimicrobianos.
El proceso más común para el desarrollo y validación de modelos de aprendizaje automático generalmente se divide en varias etapas clave. Primero, se lleva a cabo la recolección y preparación de los datos, donde se recopilan datos relevantes y se limpian para eliminar posibles errores o valores atípicos. Luego, se realiza el análisis exploratorio de datos (EDA) para entender las características y relaciones subyacentes. Posteriormente, se seleccionan y extraen características importantes que serán usadas para entrenar el modelo. En la etapa de construcción del modelo, se eligen los algoritmos adecuados y se entrenan con conjuntos de datos de entrenamiento. Después, el modelo desarrollado se valida utilizando un conjunto de datos de validación para evaluar su desempeño y realizar ajustes necesarios. Finalmente, se implementa el modelo y se monitorea su rendimiento en datos reales, asegurando que mantenga su precisión y relevancia a lo largo del tiempo. Es por ello que el desarrollo de este proyecto implicará responsabilidades tales como:
Asistir a reuniones periódicas donde pueda revisarse el avance del proyecto y se identifiquen los siguientes pasos.
Leer articulos científicos relacionados con el proyecto, y prepar resumenes que se compartan en el seminario del grupo.
Desarrollar el código requerido para realizar experimentos y pruebas de acuerdo con los protocolos establecidos, documentando detalladamente todos los procedimientos, parámetros y resultados obtenidos.
Colaborar en la recolección, limpieza y preprocesamiento de datos, garantizando la calidad e integridad de los conjuntos de datos utilizados en el proyecto.
Mantener un registro detallado de todas las actividades realizadas, incluyendo bitácoras de laboratorio, logs de experimentos y documentación técnica.
Desarrollar habilidades técnicas específicas necesarias para el proyecto, incluyendo lenguajes de programación, software especializado o técnicas experimentales.
Buscar activamente retroalimentación de los investigadores sénior y mentores, implementando las sugerencias para mejorar el desempeño y la calidad del trabajo.
4
Gildardo Sánchez Ante
gildardo.sanchez@tec.mx
Modelado predictivo
machine learning
Biologia
bacterias
warning
error_outline
Conocimientos de Machine Learning
40 %
Habilidades de programación
40 %
Escritura técnica
20 %





:
circle
circle
circle
circle
circle