Diferencia entre revisiones de «Sumario»

De NLHPC
 
Línea 17: Línea 17:


== Software instalado en el Clúster ==
== Software instalado en el Clúster ==
Leftraru cuenta con una amplia gama de software.
Guacolda-Leftraru Epu cuenta con una amplia gama de software.


Para saber el software que está instalado en nuestro clúster, vaya al siguiente link: [https://wiki.nlhpc.cl/Lmod Lmod]
Para saber el software que está instalado en nuestro clúster, vaya al siguiente link: [https://wiki.nlhpc.cl/Lmod Lmod]

Revisión actual - 16:36 19 abr 2024

Información para nuevos usuarios

Esta es la wiki para nuestra comunidad de usuarios del NLHPC. Aquí encontrará información útil para:

  • Ingresar al clúster
  • Descripción del hardware
  • Lanzar tareas en el gestor de recursos Slurm
  • Preguntas Frecuentes
  • Para más información puede visitar Aquí

Recursos computacionales del Clúster

Nuestro clúster cuenta actualmente con 7 particiones: general, largemem, V100, mi100, mi210, main y debug.

Las caracterísiticas de estas particiones pueden encontrarse en Recursos Computacionales NLHPC

Creación de cuentas

El proceso de creación de cuentas es relativamente fácil. Para poder crear una cuenta debe seguir las instrucciones del siguiente enlace y luego postular a una cuenta rellenando información en un formulario online.

Software instalado en el Clúster

Guacolda-Leftraru Epu cuenta con una amplia gama de software.

Para saber el software que está instalado en nuestro clúster, vaya al siguiente link: Lmod

Tenga en cuenta que el NLHPC no entrega licencias de software, por lo que es responsabilidad de cada usuario o grupo de usuarios el adquirir estas licencias.

Accediendo al Clúster

Nuestro clúster utiliza Linux como sistema operativo el que permite el acceso a nuestros usuarios mediante el protocolo SSH para conectase remotamente. Puede conectarse a su cuenta accediendo a la siguiente dirección:

leftraru.nlhpc.cl 

Puede encontrar mayor información en Tutorial de acceso a Leftraru via SSH. Para facilitar la copia de archivos hacia y desde el clúster, vea el Tutorial de acceso a archivos

MFA o autenticación multifactor

MFA o autenticación multifactor agrega una capa de protección al proceso de inicio de sesión. En el caso del NLHPC, se ha decidido integrar MFA adicionalmente al uso de contraseñas y llaves. El proceso de creación de MFA se ejecutará automáticamente cuando inicie sesión y es necesario que tenga a la mano su celular con la aplicación Google Authenticator o Authy instalada. Cuando inicie sesión, se mostrará un código qr que deberá escanear en alguna de estas aplicaciones. También se mostrarán un “secret key” que le permitirá recuperar el acceso en el caso de extravío de su celular. La próxima vez que inicie sesión en su cuenta se pedirá tanto la contraseña de acceso como el código generado por la aplicación multifactor.

Slurm, sistema de gestión de recursos

En el NLHPC utilizamos Slurm como gestor de recursos. Slurm provee de un framework para encolar trabajos, asignación de nodos de cómputo, reserva de tiempo de CPU, ejecución y gestión de trabajos dentro de clúster. Nuestros nodos de cómputo se encuentran agrupados en particiones, dentro de las cuales los usuarios pueden ejecutar sus trabajos dependiendo de sus necesidades.

Para ver más información acerca de cómo trabajar con Slurm en el clúster, por favor visite el tutorial de ejecución de tareas dentro de Leftaru.

Lustre, sistema de archivos distribuido

Lustre es un conocido sistema de archivos distribuido de alta disponibilidad que permite usar una red de computadores para construir un espacio de almacenamiento amplio, escalable y mantenible en el que se pueden definir cuotas de utilización por usuario.

Lustre es open source, pero debido a su envergadura y dificultad para constituirlo, se ha optado por contratar una solución privada (a la empresa DDN) que incluye tanto infraestructura como configuraciones optimizadas de tal manera de contar con una opción de almacenamiento acorde a las necesidades del NLHPC.

Limitaciones y excepciones de Lustre: A pesar de tener muchas características sobresalientes, y en pos de aumentar el rendimiento de la lectura y escritura de archivos, Lustre no permite bloquear un archivo (file locking en inglés). Esto implica que muchos de los motores de bases de datos más conocidos (MySQL, Postgres, etc.) e incluso algunas aplicaciones que hacen uso de esta característica no funcionen o se caigan en su ejecución. Se recomienda realizar esa parte del trabajo en la partición /mnt/flock/usuario.

Tutoriales

Tutorial de acceso a Leftraru via SSH

Ejecución de tareas dentro de Leftaru

Presentación uso del clúster del NLHPC

Escalamiento de Aplicaciones

Monitoreo De Tareas

Documentación de temas relacionados con el software del clúster