Форма поиска

 

Вычисления на гибридном кластере

Технические характеристики

 Технические характеристики кластера приведены на этой странице.

 

Очереди на кластере

Для пользовательских расчетов на кластере доступны четыре очереди:

  • gpu3 - очередь с узлами, содержащими 3 GPU;
  • gpu8 - очередь с узлами, содержащими 8 GPU;
  • hp_long - очередь включает все узлы, ограничение по времени для 1 задачи - 48 часов;
  • hp_infi - очередь включает все узлы, ограничение по времени для 1 задачи - 1000 часов/

 

Доступ к кластеру

Для получения доступа к к вычислителю необходимо подать заявку на исследование через систему Научного Парка СПбГУ. Процедура получения доступа к ПО более подродно описана в разделе "Информация для пользователей".

 

Запуск расчетов

Вначале задайте переменные окружения. Для этого выполните команду:

source /usr/local/examples/HPPBS.env

Данная команда задаст переменную PATH так, чтобы использовался пакет PBS Torque 6.0 (установленный в директорию /mnt/rhel-6/huawei/torque/6.0.0/bin/ ).

Для постановки задачи в очередь выполните команду:

qsub -q <очередь>@pbs-tp-new.hpc.cc.spbu.ru <скрипт>

Параметр <очередь> может принимать четыре значения: gpu3, gpu8, infi или long (укажите ту очередь, доступ к которой имеете).

Если не указать параметр "-q", то задача будет поставлена в очередь по умолчанию - очередь long.

Параметр <скрипт> задает тот скрипт, что будет поставлен в очередь, а затем запущен на кластере (собственно, пользовательская задача).

Так, для запуска тестового примера ~/examples/helloworld.sh на гибридном кластере (очередь gpu3) выполните:

qsub -q gpu3@pbs-tp-new.hpc.cc.spbu.ru ~/examples/helloworld.sh

Для запуска тестового примера ~/examples/helloworld.sh на гибридном кластере (очередь gpu8) выполните:

qsub -q gpu8@pbs-tp-new.hpc.cc.spbu.ru ~/examples/helloworld.sh

По окончании расчетов в директории, из которой выполнялась команда "qsub", появятся два файла с именами  <имя_задачи>.o<id_задачи> (стандартный вывод) и <имя_задачи>.e<id_задачи> (ошибки). Для указанных примеров имена файлов будут приблизительно следующими:

helloworld.sh.o5270
helloworld.sh.e5270 

В них будут содержаться стандартный вывод программы и ошибки (если есть).

Также для удобства можно указать параметр "-N" - он задает имя задачи:

qsub -N <имя> <скрипт>

Например,

qsub -q gpu8@pbs-tp-new.hpc.cc.spbu.ru -N HELLO ~/examples/helloworld.sh

Если этот параметр был указан, то стандартный вывод и ошибки будут содержать файлы с именами вида (для указанного примера):

HELLO.e5270
HELLO.o5270

Для просмотра состояния задач выполните команду:

qstat @pbs-tp-new -n

Опция "-n" позволит увидеть на каких именно узлах выполняется задача.

Для удаления задачи из очереди выполните команду:

qdel <id_задачи>

Параметр <id_задачи> можно узнать, выполнив команду "qstat" (значение в первом столбце).

Примеры:

qdel 5265.pbs-tp-new.hpc.cc.spbu.ru