Nuovo Cluster HPC-GPU

 Il Cluster GPU è parte integrante del cluster HPC di ReCaS-Bari e vede la propria potenzialità maggiormente espressa per applicazioni che utilizzano GPU. Mette a disposizione 1755 core, 13.7 TB di RAM, 55 TB di spazio disco e 38 GPU ad altissime prestazioni (18 Nvidia A100 e 20 Nvidia V100). Ogni nodo ha accesso al file system distribuito di ReCaS-Bari, con circa 3800 TB in singola replica e altri 180 TB, dove è garantita una maggiore sicurezza dei dati attraverso la doppia replica. La banda di comunicazione nodo-storage è di 10 Gbps.
Le applicazioni sono eseguite esclusivamente tramite Docker container, tecnologia che conferisce semplicità di configurazione ed esecuzione, affidabilià, flessibilità e sicurezza.
L'utente può richiedere l'istanziazione di servizi interattivi, come IDE utilizzabili da remoto (Jupyter Notebook e RStudio), e la sottomissione di workflow rappresentati con Directed Acyclic Graphs (DAG).
Ove possibile, i servizi saranno istanziati con IP privato, in modo da non essere raggiungibili dall'esterno e quindi meno vulnerabili agli attacchi informatici: in questo caso l'utente potrà accedere alle proprie risorse attraverso una VPN. Per poter utilizzare i servizi offerti dal Cluster GPU è necessario che l'utente faccia una apposita richiesta.

Presentazioni:
2° Congresso della Sezione INFN e del Dipartimento di Fisica di Bari, 03-04 Feb 2022

Manutenzione straordinaria UPS 4 novembre 2019

In data odierna, 4 novembre 2019, sarà effettuata una  manutenzione straordinaria sugli UPS per la sostituzione di alcuni ventilatori usurati.
Non dovrebbe avere effetti sul funzionamento del centro ReCaS-Bari.
 

Interruzione di energia elettrica oggi nel Campus

A causa di interventi sulla linee di distribuzione dell'energia elettrica nel campus, oggi ci saranno due interruzioni di breve durata della fornitura di energia elettrica nel Campus.

Data la breve durata prevista, dovrebbero essere sufficienti Gli UPS a mantenere in operazione ReCaS.anche nel casi il gruppo elettrogeno non dovesse entrare in funzione.

Interruzione dei servizi ReCaS-Bari

Nella giornata di lunedì 08/04 si è verificata una interruzione nell'alimentazione elettrica di ReCaS-Bari e, di conseguenza, l'interruzione dei servizi erogati.
Alcuni servizi sono stati ripristinati già nella giornata di lunedì 08/04, altri invece hanno richiesto più tempo.
Dopo un intenso lavoro, tutti i servizi sono ora (11/4) nuovamente attivi.
Si chiede agli utenti di verificare il funzionamento dei servizi da loro usati (macchine virtuali, cluster HPC/HTC, storage personale, servizi SaaS) e di segnalarci eventuali problemi.
Ci scusiamo per il disagio.

Intervento di manutenzione ordinaria sul sistema di UPS, 2 febbraio 2018

Si segnala che nell’ambito dell'intervento di manutenzione periodico sul sistema degli UPS (che garantiscono la continuità della alimentazione elettrica), che sarà effettuato domani 02/02/2018 dalla ditta Vertiv, uno dei due apparati sarà operato, per alcune ore, in modalità by-pass.
Come nei casi precedenti, non ci aspettiamo ripercussioni sul normale funzionamento del data center.

Visita periodica di manutenzione del sistema di supervisione di ReCaS-Bari

Mercoledì 22 novembre 2017 sarà effettuata la visita periodica di manutenzione ordinaria del sistema di supervisione di ReCaS-Bari.
In occasione della visita sarà anche operato  lo scambio dei trasformatori a servizio del Data Center. 
Al contrario dell'ultima volta, in questo caso ci aspettiamo che  la visita non abbia ripercussioni sulle normali operazioni.
 

Raddoppiata la banda della connessione di ReCaS-Bari alla rete del GARR

L'intervento tecnico sul router di frontiera del data center ReCaS-Bari, programmato per il 12 settembre 2017 scorso, effettuato con la collaborazione del GARR, provider della rete della ricerca, è stato completato con successo.
L'intervento è servito per  abilitare il Border Gateway Protocol (BGP), un moderno protocollo di instradamento (routing) che permette di collegare fra loro più router appartenenti a diversi sistemi autonomi.
Con l'adozione del BGP, ReCaS-Bari potrà attuare il  routing dinamico in autonomia, senza dipendere completamente dal GARR, ma scegliendo il routing in base dello "use case": sarà possibile  separare i trasferimenti di dati che riguardano gli esperimenti in presa dati al CERN di Ginevra dagli altri tipi di trasferimenti, con un guadagno netto  nella flessibilità ed elasticità del sistema.  
Contestualmente, è stata raddoppiata la velocità del collegamento con tutta la rete GARR, su cui adesso i dati viaggiano a 20 Gbit/s. 
L'intervento è stato completamente trasparente per gli utenti, che non hanno avvertito alcun effetto sulle proprie risorse.
Si raccomanda  comunque di vigilare  nei prossimi giorni sui vostri trasferimenti di dati e di segnalarci qualunque sospetto di malfunzionamento.
il raddoppio  della banda realizzato lo scorso 12 settembre rappresenta  un primo passo per arrivare ad una velocità di connessione di ReCaS-Bari a 100 Gbit/s.