Группа компаний РСК представила вычислительные узлы «РСК Торнадо» на основе новейших процессоров Intel Xeon Scalable 3 поколения и модулей энергонезависимой памяти Intel Optane серии 200, система хранения RSC Tornado AFS с функцией высокой доступности, решение для создания систем хранения данных RSC Storage on-Demand с поддержкой DAOS, а также специализированное решение RSC Tornado AI для создания систем искусственного интеллекта и машинного обучения.
Новое поколение решений «РСК Торнадо» предназначено для выполнения широкого спектра ресурсоемких научных и прикладных задач. Обновленная линейка интегрированных программно-определяемых и реконфигурируемых решений ориентирована на применение как в составе классических высокопроизводительных систем, так и для эффективного хранения и обработки данных, а также для создания систем искусственного интеллекта (Artificial Intelligence, AI), систем машинного и глубокого обучения (Machine Learning, Deep Learning — ML/DL).
Решение «РСК Торнадо» на основе узлов с процессорами Intel Xeon Scalable 3-го поколения обеспечивает наивысшую вычислительную плотность для архитектуры x86 в индустрии с показателем 967,45 ТФЛОПС на стойку (+37% по сравнению с предыдущим поколением), распределенную систему хранения на узлах RSC Storage on-Demand емкостью 2,45 ПБ на шкаф (+36% по сравнению с предыдущим поколением) с пропускной способностью ввода/вывода на уровне 3,67 Тб/сек (в 2 раза больше по сравнению с предыдущим поколением) и лидирующий показатель энергоэффективности со 100% жидкостным охлаждением в режиме «горячая вода» всех электронных компонент. При этом пользователи получают линейную масштабируемость от малых систем в несколько серверов до тысяч серверов в составе больших кластеров или серверных ферм. Также предоставляются дополнительные возможности для оптимизации стоимости конечных решений за счет поддержки открытых стандартов и новых серверных продуктов Intel.
Решение «РСК Торнадо» на основе старших моделей процессоров Intel Xeon Scalable 3-го поколения (до 40 ядер, TDP 270 Вт), модулей энергонезависимой памяти Intel Optane серии 200, твердотельных накопителей Intel SSD и высокоскоростной коммуникационной сети со скоростью передачи данных 200 Гбит/сек обладает передовыми показателями компактности и вычислительной плотности (до 153 узлов в одном стандартном шкафу высотой 42U), а также обеспечивает возможность стабильной работы вычислительных узлов в режиме «горячая вода» при температуре хладоносителя до +65 °С на входе в вычислительные узлы и коммутаторы. Работа в режиме «горячая вода» для данного решения позволяет применить круглогодичный режим free cooling (24×365), используя только сухие градирни, работающие при температуре окружающего воздуха до +50 °С, что, в свою очередь, позволяет полностью избавиться от чиллеров. В результате среднегодовой показатель PUE системы, отражающий уровень эффективности использования электроэнергии, составляет менее чем 1,04, что является выдающимся результатом для HPC-индустрии.
Специалисты РСК представили новую интеллектуальную систему хранения данных RSC Tornado AFS с поддержкой функции высокой доступности для создания систем хранения с большим объемом данных. Решение обеспечивает высочайшую надежность и доступность данных за счет объединения узлов RSC Tornado AFS в функциональные пары. Это позволяет, в случае выхода из строя одного из серверов пары, обеспечить функционирование его элементов хранения с помощью второго сервера. Такой подход позволяет достичь максимальной надежности хранения данных объемом до 2 Петабайт в форм-факторе 2U благодаря использованию 64-х твердотельных дисков Intel SSD P5316 с интерфейсом NVMe в форм-факторе EDSFF.L (так называемый «рулер»). Объем хранения данных в одной стойке, состоящей из 42 узлов RSC Tornado AFS, достигает 41,3 ПБ со скоростью доступа 1 ТБ/c.
В узлах хранения также используются процессоры семейства Intel Xeon Scalable, твердотельные диски Intel Optane SSD и модули энергонезависимой памяти Intel Optane DC Persistent Memory. В RSC Tornado AFS реализовано 100% жидкостное охлаждение в режиме «горячая вода» с рекордно низким показателем эффективности использования электроэнергии PUE на уровне 1,04. В многоуровневых системах хранения это решение предназначено для слоя «теплых» данных.
Решения RSC Storage on-Demand поддерживают файловые системы NFS, Lustre и DAOS для организации распределенной системы хранения. Новая распределенная объектная система хранения с открытым кодом DAOS (Distributed Asynchronous Object Storage) корпорации Intel позволяет обеспечить высочайший уровень скорости работы с данными различных типов. Такое решение ориентировано на применение в области «искусственного интеллекта» (машинного и глубокого обучения). Теперь стало возможным построение не только многоуровневых распределенных систем хранения данных на базе файловой системы Lustre в рамках архитектуры Composable Disaggregated Infrastructure и гибкое управление пулами дисков с интерфейсом NVMe, но и построение СХД на основе DAOS с распределенным внешним пулом дисков NVMe. Такой подход к реализации DAOS позволяет создавать высокопроизводительные системы хранения с гибким соотношением количества объема Intel Optane DC Persistent Memory к объему подключаемых к DAOS-серверу дисков NVMe. Это обеспечивает возможность создания гибких конфигураций «по запросу» для решения конкретной задачи пользователя. Специалисты РСК перенесли свой опыт в построении компонуемых дезагрегированных решений и на управление DAOS. Теперь стало возможным использование удобного пользовательского интерфейса платформы оркестрации «РСК БазИС» для систем на основе DAOS.
Специализированное решение RSC Tornado AI предназначено для создания систем искусственного интеллекта и машинного обучения. Оно является развитием архитектуры «РСК Торнадо» и представляет собой узел высотой 1U со 100% жидкостным охлаждением на базе двух процессоров Intel Xeon Scalable 3-го поколения и до 4-х ускорителей Nvidia A100. Вычислительная производительность одного шкафа, состоящего из 42-х узлов RSC Tornado AI, достигает 1,895 Пфлопс и 104,83/209,66 POPS (INT8/INT4). Решение RSC Tornado AI оптимизировано для работы с распределенной системой хранения RSC Storage on-Demand.
Компонуемо-распределенная архитектура «РСК Торнадо» позволяет создать наиболее эффективное решение под сложную задачу заказчика, состоящую как из частей компьютерного моделирования, так и машинного обучения. Благодаря использованию распределенной системы хранения RSC Storage on-Demand пользователь получает оптимальную конфигурацию, настроенную под тип его задачи и создаваемую за считанные секунды.