Объявления о состоянии оборудования РЦ ВЦ
1. Гибридный кластер
- 20.01. 2023. На кластере доступны 20 узлов. Из них 14 узлов с 3-мя каотами GPU, 1 узел с 6-ю кориами (tesla-17), 5 узлов без карт (очередб CPU). 4 узла не доступны: tesla-04, 06, 16, 21.
- Оборудование работает в штатном режиме
- 2019 вышел из строя узел tesla-15.
- 2021 г. возникли проблемы с блоками питания tesla09-tesla12. Узлы работаютв режиме CPU.
2. Ферма виртуальных машин
- 58 блейд-серверов работают в штатном режиме.
- Из-за аварии системы охлаждения ЦОД 10.07.2021 вышел из строя блейд-сервер bc02-16.
- Блейд-сервер bc01-16 не работает из-за неисправных модулей опреативной памяти.
- В ферму виртуальных машин включены три сервера Dell R720: kepler01, kepler02, kepler03.
3. Кластер Huawei
- Node-032 выведена из кластера из-за сбоев оперативной памяти. В натоящее время выполняется тест Linpack.
- Все 30 узлов кластера node001 - node030 работают в штатном режиме.
- В кластер введен дополнительный узел node034.
4. Кластер Т-Платформ
- Из-за аварии системы охлаждения ЦОД 21.06.2021, 10.07.2021 из-за превышения температуры выше 60 град.С
вышли из строя 8 узлов кластера: node 15 18 19 34 38 40 41 49.
5. Кластер SMP
- Оборудование работает в штатном режиме.