Next Gen Sci TDA · Gemelos Agrícolas: Distancia-360
highlight_off

Este proyecto ejecuta el cálculo masivo de distancias para todas las parejas de municipios usando la métrica acordada. Se diseñan algoritmos por bloques y/o paralelización para optimizar memoria y tiempo; se exploran estructuras sparse, formatos HDF5 y/o índices de búsqueda aproximada (ANN) para consultas rápidas. Los entregables son: (i) la matriz de distancias persistente (
distancias.h5
) o un índice ANN equivalente, (ii) un grafo k-NN nacional con pesos de similitud, y (iii) scripts reproducibles con perfiles de rendimiento. Se incluyen pruebas de escalabilidad y validaciones de integridad (simetría, no negatividad, diagonales nulas). Impacto: habilitar análisis de proximidad, clustering y recomendación de “análogos” a gran escala, asegurando tiempos de respuesta aptos para tableros interactivos y futuras ampliaciones (nuevas variables o ventanas temporales) sin rehacer todo el pipeline.· Calcular distancias desde cada municipio eficiente al universo; construir grafo k-NN y clústeres.
· Validar “análogos” con evidencia externa (producción histórica, cercanía climática) y análisis de riesgo.
· Entregables: lista priorizada de análogos por municipio eficiente, mapas y dashboard interactivo.
· Criterios de éxito: precisión/recuperación frente a casos conocidos, UX clara y tiempos de respuesta ágiles.
36
Jonathan Montalvo Urquizo
jmontalvo@tec.mx
Ciencia de Datos
IA
Topología
Investigación
warning
error_outline





:
circle
circle
circle
circle
circle