Farm di Calcolo

La farm di calcolo è composta da due macchine interattive, farm01.to.infn.it (64bit) e farm02.to.infn.it (32bit), ed una di batch, farm03.to.infn.it non direttamente accessibile agli utenti.

La macchine per il login interattivo sono ospitate su un HP ProLiant DL360 equipaggiato con due processori Intel(R) Xeon(R) Quad Core E5345 a 2.33GHz ed 8GB di ram. Entrambi i sistemi sono virtualizati su tecnologia Xen

Area Utenti

Per accedere al sistema gli utenti devono collegarsi tramite ssh rispettivamente su farm01.to.infn.it (sistema a 64bit) o su farm02.to.infn.it (sistema a 32bit) usando l'account delle macchine centrali.

Si ricorda che farm03.to.infn.it non è direttamente accessibile agli utenti.

E' a disposizione di tutti una area di scratch sotto /farmscratch. Questo spazio disco viene pulito ogni notte dai file più vecchi di 14 giorni.

Il Software a corredo della farm è installato nella directory /opt. Al fine di poter impostare correttamente le variabili di ambiente dei vari tools sono stati creati dei file di configurazione, elencati nella sezione Software Installato delle varie macchine, di cui fare il source nella directory /opt/profile.d:

prompt$ source </opt/profile.d/file_con_configurazione.sh>
o
prompt$ source </opt/profile.d/file_con_configurazione.csh>

Per gli utenti che necessitino di installare software specifici vi è a disposizione un ulteriore spazio disco sotto /exp. Facendone richiesta al Centro di Calcolo si verrà abilitati secondo all'utilizzo dell'area stessa.

Uso di Base del Sistema di Code

Di seguito riportiamo alcune note informative, per maggiori dettagli è possibile consultare la seguente documentazione.

Configurazione delle Code

Le code definite attualmente sono di due tipi short e long:

prompt$ qstat -q

server: farm01.to.infn.it

Queue            Memory CPU Time Walltime Node  Run Que Lm  State
---------------- ------ -------- -------- ----  --- --- --  -----
default            --      --       --      --    0   0 10   E R
short              --   02:00:00    --      --    0   0 10   E R
long               --   24:00:00    --      --    0   0 10   E R
                                               ----- -----
                                                   0     0

Per maggiori dettagli riferirsi alla seguente pagina.

Esigenze particolari potranno essere valutate.

Sottomissione di un Job

Per la sottomissione dei job ci si deve collegare unicamente su farm01.to.infn.it.

La procedura base per la sottomissione di un JOB consiste in due passi:

  • Creazione di un file di descrizione del JOB: myProgram.sh
  • Esecuzione del comando qsub con argomento il nostro file di descrizione:
prompt$ qsub myProgram.sh
48.farm01.to.infn.it

L'output indica che il JOB è stato accettato e gli è stato assegnato l'identificatore 48.farm01

Verifica della Coda

Il comando per verificare lo stato dell'esecuzione è qstat. Un esempio di output è:

prompt$ qstat
Job id                    Name             User            Time Use S Queue
------------------------- ---------------- --------------- -------- - -----
48.farm01                 myProgram.sh     <user>                 0 R short

Le colonne rappresentate hanno il seguente significato:

  • Job id: l'identificatore del Job
  • Name: il nome da noi assegnato al Job nel file di sottomissione myProgram.job
  • User: l'utente che ha sottomesso il Job
  • Time Use: Il tempo di esecuzione finora utilizzato
  • S: lo stato del job: R=running (in esecuzione), Q=queued (in attesa)
  • Queue: la coda scelta

Cancellazione di un Job

Il comando per cancellare un job dalla coda è:

prompt$ qdel JobId

dove JobId è quello visualizzato dal comando qstat.

Ambiente farm01.to.infn.it (64bit)

Configurazione

Sistema Operativo CentOS release 5.2 (Final)
Core 8
RAM 3GB

Software Installato

Software Versione source file
CLHEP - A Class Library for High Energy Physics 2.0.4.0 CLHEP.csh or CLHEP.sh
CRYSTAL06 1.0.2 cry2k6.bashrc or cry2k6.cshrc
G95 - Fortran 95 compiler 0.91 g95.csh or g95.sh
Geant4 4.9.1.p03 geant.csh or geant.sh
GNU Scientific Library 1.10-10.el5 -
Intel(R) C++ Compiler for Linux 10.1.018_intel64 iccvars.csh or iccvars.sh
Intel(R) Fortran Compiler for Linux 10.1.018_intel64 ifortvars.csh or ifortvars.sh
Intel(R) Integrated Performance Primitives for Linux 5.3.4.080 ippvarsem64t.sh
Intel(R) Math Kernel Library for Linux 10.0.5.025 mklvars64.csh or mklvars64.sh
Intel(R) Threading Building Blocks for Linux 2.1.012 tbbvars.csh or tbbvars.sh
MPICH 1.2.7p1 -
Mpiexec 0.83 -
R 2.7.2 R.csh or R.sh
ROOT 5.20.00 root.csh or root.sh
TORQUE 2.3.3 -

Ambiente farm02.to.infn.it (32bit)

Configurazione

Sistema Operativo CentOS release 4.7 (Final)
Core 8
RAM 3GB

Software Installato

Software Versione source file
CERN Advanced STORage manager 2.1.7-17 -
CERN Program Library (CERNLIB) 5.18.00 -
ROOT 5.18.00 root.csh or root.sh

Ambiente farm03.to.infn.it (64bit)

Configurazione

Sistema Operativo CentOS release 5.2 (Final)
Core 8
RAM 7GB

Software Installato

Software Versione source file
CLHEP - A Class Library for High Energy Physics 2.0.4.0 CLHEP.csh or CLHEP.sh
CRYSTAL06 1.0.2 cry2k6.bashrc or cry2k6.cshrc
G95 - Fortran 95 compiler 0.91 g95.csh or g95.sh
Geant4 4.9.1.p03 geant.csh or geant.sh
GNU Scientific Library 1.10-10.el5 -
Intel(R) C++ Compiler for Linux 10.1.018_intel64 iccvars.csh or iccvars.sh
Intel(R) Fortran Compiler for Linux 10.1.018_intel64 ifortvars.csh or ifortvars.sh
Intel(R) Integrated Performance Primitives for Linux 5.3.4.080 ippvarsem64t.sh
Intel(R) Math Kernel Library for Linux 10.0.5.025 mklvars64.csh or mklvars64.sh
Intel(R) Threading Building Blocks for Linux 2.1.012 tbbvars.csh or tbbvars.sh
MPICH 1.2.7p1 -
Mpiexec 0.83 -
R 2.7.2 R.csh or R.sh
ROOT 5.20.00 root.csh or root.sh
TORQUE 2.3.3 -