Mukesh Kumar y Christopher J. Duffy
Exploración del papel de la partición de dominios en la eficiencia de las simulaciones de modelos hidrológicos distribuidos en paralelo
Los modelos hidrológicos distribuidos espacialmente de cuencas hidrográficas y fluviales requieren una gran cantidad de datos y cálculos debido a la naturaleza combinada de la hidrodinámica , las fuerzas complejas y los campos de parámetros heterogéneos. La aplicación de estos modelos en resoluciones temporales y espaciales finas y en dominios de problemas grandes se ve facilitada por el cálculo paralelo en clústeres de múltiples procesadores. En particular, la eficiencia computacional de las simulaciones paralelas está determinada de manera crucial por la eficiencia con la que se dividen y distribuyen los datos en un entorno multiprocesador y cómo se comparte la información entre procesadores. Si bien existen numerosos algoritmos de partición de datos que se han estudiado ampliamente en la literatura de ciencias de la computación, aún no se ha presentado una elucidación detallada del papel de la estructura del modelo hidrológico en la partición de datos. Además, no se conoce el papel relativo del equilibrio de carga computacional y la comunicación entre procesadores en la eficiencia computacional paralela de un modelo hidrológico . Considerando el esquema de discretización de dominio no estructurado utilizado en el modelo hidrológico PIHM como ejemplo, el documento presenta primero una metodología genérica para incorporar factores hidrológicos en algoritmos de partición de dominio óptimos. Las particiones se utilizan luego para explorar el papel aislado del equilibrio de carga computacional y la comunicación entre procesadores en la eficiencia paralela. Los resultados confirman que las simulaciones paralelas en particiones que minimizan la comunicación entre procesadores y dividen la carga computacional equitativamente son las más eficientes. Más importante aún, se observa que el equilibrio de carga entre procesadores es un control más sensible en la eficiencia paralela que la minimización de la comunicación entre procesadores. Análisis adicionales de la eficiencia y escalabilidad del código paralelo para diferentes configuraciones de particionamiento revelan una correspondencia directa entre la eficiencia paralela y métricas teóricas como la relación de equilibrio de carga y la relación comunicación a cómputo. Los resultados indican que las métricas teóricas se pueden utilizar para la selección de las mejores particiones antes de realizar simulaciones paralelas computacionalmente intensivas. El estudio sirve como una evaluación de prueba de concepto del impacto de la computación y la comunicación en la eficiencia de los modelos hidrológicos distribuidos paralelizados en múltiples resoluciones.