A infraestrutura para computação de alto desempenho do LIMC (Laboratório Integrado de Modelagem Computacional) é composta por um cluster de computadores, no-breaks de grande autonomia e aparelhos de ar-condicionado de grande porte, todos adquiridos com recursos MCT/FINEP/CT-INFRA PROINFRA 01/2007 e MCT/FINEP/CT-INFRA 01/2008.
Tratam-se de equipamentos multiusuário, atendendo a discentes de graduação (Graduações em Engenharia Computacional, Ciência da Computação, Sistemas de Informação, Engenharia Elétrica), mestrado e doutorado de distintos cursos (Pós-Graduações em Modelagem Computacional e Ciência da Computação), bem como professores de diversos departamentos da UFJF (Ciência da Computação-DCC, Mecânica Aplicada e Computacional-MAC, Matemática-MAT, Estatística-EST, Engenharia de Produção e Mecânica-EPD) e de outras instituições (Universidade Federal de São João Del-Rey-UFSJ, Universidade Federal de Ouro Preto-UFOP, CEFET-MG Leopoldina, IFET Sudeste Cataguases). Trata-se, portanto, de um equipamento de grande relevância não só para a UFJF, como também para outras instituições públicas de ensino e pesquisa da região.
O equipamento atende, a cada semestre letivo, cerca de 30 docentes; 80 alunos de graduação em três disciplinas distintas; 31 alunos de Mestrado e 49 de Doutorado. Em média, o equipamento executa a mais de 800 tarefas computacionais por dia.
O cluster é composto por um total de 54 nós. Destes, um nó é denominado front-end, disponibilizando, dentre outras funções, espaço de armazenamento. Os demais 53 nós são denominados escravos, tendo o papel principal de realizar processamento. Os nós possuem CPUs com quantidade de núcleos distintas (variando de 8 a 64). Alguns destes nós de processamento possuem GPUs (placas aceleradoras), utilizadas em pesquisas em que um grande volume de dados precisa ser processado.
Este equipamento está registrado na Plataforma Nacional de Infraestrutura de Pesquisa (PNIPE) do MCTI:
Criação de Conta e Agenda de Uso do Cluster
Não é necessário agendar um dia ou horário para o uso do cluster, pois é empregado um sistema automatizado para a execução das tarefas computacionais. Contudo, faz-se necessária a abertura de uma conta para o usuário. Para tal, o coordenador do projeto deve procurar a coordenação do PPG (email), apresentando um breve projeto onde conste título, um breve resumo, uma justificativa para o uso do cluster, nome do(s) aluno(s) que irão acessar o cluster e período em que os mesmos cursaram as disciplinas Programação Paralela (DCC125) ou Computação em Ambientes Distribuídos (219004) oferecidas pelo Departamento de Ciência da Computação e pelo Programa de Pós-Graduação em Modelagem Computacional, respectivamente.
O sistema OGE (Oracle Grid Engine) é utilizado para o agendamento das tarefas. O sistema aceita, escalona, despacha e gerencia automaticamente a execução de tarefas, permitindo que os usuários interessados em usar o cluster especifiquem as características de hardware necessárias para a execução de suas tarefas, com o sistema OGE casando-as com a disponibilidade das máquinas. O sistema colocará o pedido do usuário em uma fila de execução, atendendo aos pedidos de modo a maximizar o uso dos recursos computacionais. Deste modo, o cluster está disponível para aceitar tarefas 24 horas por dia, 7 dias por semana. As tarefas serão executadas quando os recursos solicitados estiverem disponíveis e pedidos anteriores para uso dos mesmos recursos tiverem finalizado. Os recursos solicitados são alocados de modo exclusivo aos usuários sem tempo pré-determinado para que finalizem a sua execução.
É possivel, em caráter de excepcional (deadlines para defesa ou entrega de artigos), agendar via OGE recursos para execução urgente. Entre em contato com a coordenação para saber como proceder.
A figura abaixo ilustra o histórico de jobs finalizados no cluster desde o mês de Abril de 2018.