Sumario

De NLHPC

Información para nuevos usuarios

Esta es la wiki de usuarios de Leftraru, el clúster HPC del NLHPC. Aquí encontrará información útil para:

  • Ingresar al clúster
  • Descripción del hardware
  • Lanzar tareas en el gestor de recursos Slurm
  • Preguntas Frecuentes
  • Para más información puede visitar Aquí

Recursos computacionales de leftraru

Leftraru cuenta actualmente con 5 particiones: general, largemem, V100, slims y debug.

Las caracterísiticas de estas particiones pueden encontrarse en Recursos Computacionales NLHPC

Creación de cuentas

El proceso de creación de cuentas es relativamente fácil. Para poder crear una cuenta debe seguir las instrucciones del siguiente enlace y luego postular a una cuenta rellenando información en un formulario online.

Software instalado en el Clúster

Leftraru cuenta con una amplia gama de software.

Para saber el software que está instalado en nuestro clúster, vaya al siguiente link: Lmod

Tenga en cuenta que el NLHPC no entrega licencias de software, por lo que es responsabilidad de cada usuario o grupo de usuarios el adquirir estas licencias.

Accediendo a Leftraru

Leftraru está basado en la distribución Centos Linux. Uiliza el protocolo SSH para conectase remotamente. Puede conectarse a Leftraru en la siguiente dirección:

leftraru.nlhpc.cl 

Puede encontrar mayor información en Tutorial de acceso a Leftraru via SSH. Para facilitar la copia de archivos en Leftraru, vea el Tutorial de acceso a archivos

MFA o autenticación multifactor

MFA o autenticación multifactor agrega una capa de protección al proceso de inicio de sesión. En el caso del NLHPC, se ha decidido integrar MFA adicionalmente al uso de contraseñas y llaves. El proceso de creación de MFA se ejecutará automáticamente cuando inicie sesión y es necesario que tenga a la mano su celular con la aplicación Google Authenticator o Authy instalada. Cuando inicie sesión, se mostrará un código qr que deberá escanear en alguna de estas aplicaciones. También se mostrarán un “secret key” que le permitirá recuperar el acceso en el caso de extravío de su celular. La próxima vez que inicie sesión en su cuenta se pedirá tanto la contraseña de acceso como el código generado por la aplicación multifactor.

Slurm, sistema de gestión de recursos

Leftraru utiliza Slurm como gestor de recursos. Slurm provee de un framework para encolar trabajos, asignación de nodos de cómputo, reserva de tiempo de CPU, ejecución y gestión de trabajos dentro de clúster. Nuestros nodos de cómputo se encuentran agrupados en particiones, dentro de las cuales los usuarios pueden ejecutar sus trabajos dependiendo de sus necesidades.

Para ver más información acerca de cómo trabajar con Slurm en el clúster, por favor visite el tutorial de ejecución de tareas dentro de Leftaru.

Lustre, sistema de archivos distribuido

Lustre es un conocido sistema de archivos distribuido de alta disponibilidad que permite usar una red de computadores para construir un espacio de almacenamiento amplio, escalable y mantenible en el que se pueden definir cuotas de utilización por usuario.

Lustre es open source, pero debido a su envergadura y dificultad para constituirlo, se ha optado por contratar una solución privada (a la empresa DDN) que incluye tanto infraestructura como configuraciones optimizadas de tal manera de contar con una opción de almacenamiento acorde a las necesidades del NLHPC.

Limitaciones y excepciones de Lustre: A pesar de tener muchas características sobresalientes, y en pos de aumentar el rendimiento de la lectura y escritura de archivos, Lustre no permite bloquear un archivo (file locking en inglés). Esto implica que muchos de los motores de bases de datos más conocidos (MySQL, Postgres, etc.) e incluso algunas aplicaciones que hacen uso de esta característica no funcionen o se caigan en su ejecución. Se recomienda realizar esa parte del trabajo en la partición /mnt/flock/usuario.

Tutoriales

Tutorial de acceso a Leftraru via SSH

Ejecución de tareas dentro de Leftaru

Presentación uso Leftraru

Escalamiento de Aplicaciones

Monitoreo De Tareas

Documentación de temas relacionados con el software del clúster