Фрагмент для ознакомления
2
ВВЕДЕНИЕ
Процессор Intel Xeon, появившийся в 2001 году, для рабочих станций, разработанный на основе микроархитектуры Intel NetBurst, обеспечивает высочайшую производительность при работе многопоточных приложений в многозадачной среде. Процессор Intel Xeon идеален для приложений, требующих большого объема вычислений с плавающей запятой и интенсивно использующих графические системы.
Данная тема интересна ввиду рассматриваемой в ней технологии параллельного исполнения задач, которая позволяет достичь высокой производительности и реализовать проекты, которые невозможно было осуществить ранее. Так же исследование может помочь разобраться в проблеме достижения высокой скорости обработки данных и наметить пути дальнейшего развития высокопроизводительных процессоров.
ГЛАВА 1 История развития процессоров Intel Xeon Phi
Xeon Phi – семейство x86 процессоров североамериканской корпорации Intel с большим количеством процессорных ядер. Данные процессоры предназначены для использования в суперкомпьютерах, серверах и высокопроизводительных рабочих станциях.
Архитектура процессоров позволяет использовать стандартные языки программирования и технологии OpenMP [1].
Xeon Phi изначально разработанные на основе экспериментальных видеоускорителей Intel, для вычислений [2] [3] [4] [5]. В отличие от других GPGPU (в частности Nvidia Tesla), в процессорах Xeon Phi используется x86-совместимое ядро, не требующее переписывания программ на специальные языки (CUDA, OpenCL) .
Первоначально представлены в 2012 году в виде карт расширения PCIe (Knights Corner, 22 нм).
Продукты второго поколения Knights Landing (14 нм) анонсированы в 2013 году [5] и появились в 2016 году и представляют собой процессор для установки в серверный сокет LGA3647 (являются центральным процессором).
В июне 2013 суперкомпьютер Tianhe-2 из NSCC-GZ (Китай) стал быстрейшим в мире [6]. Он использовал сопроцессоры Intel Xeon Phi и центральные процессоры Xeon (Ivy Bridge-EP) для достижения 33.86 петафлопсов [7].
Продукты Xeon Phi ориентированы на рынок, в котором также используются сопроцессоры Nvidia Tesla и AMD Radeon Instinct.
Микроархитектура Larrabee (разрабатывалась с 2006 года [8]) ввела применение очень широких векторных АЛУ (512-разрядные SIMD) в микропроцессоры с архитектурой x86. Также в ней применялась кольцевая шина для обеспечения когерентности кэшей и для связи с контроллером памяти. Каждое ядро Larrabee могло исполнять 4 потока. Также Larrabee имели некоторые блоки, специфичные для видеоускорителей (GPU), в частности, текстурный блок [9]. От планов производить GPU для рынка ПК, основанный на исследованиях проекта Larrabee, отказались в мае 2010 [10].
В другом исследовательском проекте Intel была реализована архитектура x86 на многоядерном процессоре – Single-chip Cloud Computer (прототипы представлены в 2009 году [11]), предназначенном для облачных вычислений. Одна микросхема имела 48 независимых ядер с индивидуальным управлением частотой и напряжением. Для связи ядер использовалась сеть с ячеистой структурой (mesh). В проекте не поддерживалась когерентность кэшей [10].
ГЛАВА 2 Современный уровень развития процессоров Intel Xeon Phi
2.1 Архитектура Intel Xeon Phi
Сопроцессор Intel Xeon Phi включает до 61 процессорных ядер, соединенных высокопроизводительной встроенной кольцевой шиной. 8 контроллеров памяти обслуживают 16 каналов GDDR5, обеспечивая суммарную производительность 5,5 GT/s (миллиардов пересылок в секунду, при ширине шины 64 байта это дает пропускную способность 352 GB/s) [8]. Отдельный компонент реализует клиентскую логику PCI Express (рис. 1.1).
Каждое ядро является полнофункциональным и поддерживает выборку и декодирование инструкций из 4 потоков команд. Для повышения эффективности работы с памятью в сопроцессоре реализован распределенный каталог тегов кэша, позволяющий использовать более эффективный протокол для поддержания когерентности кэшей всех ядер. Контроллеры памяти обеспечивают теоретическую пропускную способность 352 гигабайта в секунду [8]. Приведем основные характеристики компонент сопроцессора.
Исполнительное ядро (Core) выполняет выборку и декодирование инструкций 4 аппаратных потоков. Поддерживается выполнение 32- и 64-битного кода, совместимого с архитектурой Intel64. Ядро содержит 2 конвейера (U-конвейер и V-конвейер) и может выполнять 2 инструкции за такт. V-конвейер способен выполнять не все типы инструкций, возможность параллельного выполнения команд на U- и V-конвейерах задается набором правил. Внеочередное выполнение инструкций не поддерживается, также не реализованы команды Intel Streaming SIMD Extensions (SSE), MMX и Advanced Vector Extensions (AVX). Ядро включает по 32 Кб 8-канальных множественно-ассоциативных кэшей инструкций и данных (L1 I-Cache и L1 D-Cache) [8].
2.2 Возможности
Вычислительный сопроцессор Intel Xeon Phi - специальный ускоритель для научных расчетов, имеющий терафлопсную производительность (1 триллион операций с плавающей точкой в секунду). В отличие от аналогичных решений (NVidia CUDA и проч.), Intel Xeon Phi основан на архитектуре x86 [6].
Xeon Phi выполнен в виде платы расширения стандарта PCI Express и представляет собой многоядерный чип (60+ ядер x86) с памятью стандарта GDDR5. На основе платы могут быть созданы счетные сервера для реализации платформы HPC - High performance computer. Плата устанавливается в сервер с разъемом PCI Express x16, однако блок питания должен иметь запас по мощности, так как энергопотребление платы достигает 300 Ватт. Каждое ядро содержит кэш второго уровня объемом 512KB и имеет доступ к своей собственной оперативной памяти, объем которой варьируется от модели к модели [6].
ГЛАВА 3 Процессор Intel Xeon Phi 7250F
3.1 Общие характеристики
Компания Intel начала продажи Xeon Phi 7250F с июня 2016. Это десктопный процессор на архитектуре Knights Landing, в первую очередь рассчитанный на профессиональные системы. Он имеет 68 ядер и 272 потока и изготовлен по 14 нм техпроцессу, максимальная частота составляет 1600 МГц, множитель заблокирован.
С точки зрения совместимости это процессор для сокета Intel Socket 3647 с TDP 230 Вт. Он поддерживает память DDR4 [4].
Сведения о типе (для десктопов или ноутбуков) и архитектуре Xeon Phi 7250F (таб. 3.1).
Количественные параметры Xeon Phi 7250F: число ядер и потоков, тактовые частоты, техпроцесс, объем кэша и состояние блокировки множителя [4]. Они косвенным образом говорят о производительности процессора, но для точной оценки необходимо рассмотреть результаты тестов (таб. 3.2).
3.2 Пример использования
Российская группа компаний РСК продемонстрировала на международной суперкомпьютерной выставке ISC’16 новое поколение высокопроизводительного, масштабируемого и энергоэффективного решения «РСК Торнадо» с прямым жидкостным охлаждением на базе новейшего многоядерного процессора Intel Xeon Phi 7250F , непосредственно в день всемирного запуска этого продукта [4] [5]. Новое решение РСК обладает улучшенными показателями физической и вычислительной плотности, высоким уровнем энергоэффективности и обеспечивает стабильную работу в режиме «горячая вода» при температуре хладоносителя +63 °С на входе в вычислительные узлы.
Новое поколение кластерного решения «РСК Торнадо» основано на применении, старших моделей новейших многоядерных (до 72-х ядер) процессоров Intel Xeon Phi 7250F (суффикс F для версий процессоров с интегрированным высокоскоростным меж-узловым соединением Intel Omni-Path) [5].
На стенде РСК были продемонстрированы вычислительный узел «РСК Торнадо» на базе многоядерного процессора Intel Xeon Phi 7250F на новой серверной плате Intel S7200AP.
Кроме того, кластерное решение «РСК Торнадо» может быть реализовано и на базе серверных процессоров семейства Intel Xeon E5-2600 (включая старшую модель Intel Xeon E5-2699 v4), обеспечивая высокую вычислительную плотность – 237 ТФЛОПС в стандартном вычислительном шкафу 42U (80x80x200 см) [5].
ЗАКЛЮЧЕНИЕ
Входе проведенного исследования была и изучена история развития процессоров Intel Xeon Phi. Представлена архитектура процессоров данной серии. Проанализированы технические характеристики, возможности и сфера применения. Применение Intel Xeon Phi представлено на примере Intel Xeon Phi 7250F и суперкомпьютера «РСК Торнадо» основой которого являются процессоры Intel Xeon Phi 7250F с архитектурой Intel Many Integrated Core (Intel MIC). Архитектурой Intel MIC компания занималась очень давно, начиная с начала 2000-х годов, возможно даже дольше, поскольку видимые результаты появились не сразу. Первоначально предполагалось выпустить GPGPU продукт, однако потом планы изменились, и в результате был создан сопроцессор формата «компьютер в компьютере» со своей операционной системой, вычислительными ресурсами и системой взаимодействия с хост-платформой.
Фрагмент для ознакомления
3
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
1. Демаков Ю. П. Радиоматериалы и радиокомпоненты: учебное пособие для ВУЗов: в 2 ч. – Ижевск: Изд-во ИжГТУ, 2019. – Ч. 2: Компоненты электронных схем. – 472 с.
2. Ивченко В. Г. Конструирование и технология ЭВМ. Конспект лекций. Таганрог. Таганрогский государственный технический университет, 2021 г. – 102 с.
3. Л.Н. Преснухин, В.А. Шахнов Конструирование электронных вычислительных машин М.: Высш. шк.. 2019. – 512 с.
4. Intel Xeon Phi 7250F: технические характеристики и тесты [Электронный ресурс] – URL: https://technical.city/ru/cpu/Xeon-Phi-7250F (дата обращения: 14.12.2021).
5. Intel's Xeon Phi in 10 Petaflops supercomputer [Электронный ресурс] – URL: https://www.anandtech.com/show/6265/intels-xeon-phi-in-10-petaflops-supercomputer (дата обращения: 16.12.2021).
6. New Book Offers Insight into Coding for Intel Xeon Phi [Электронный ресурс] – URL: http://insidehpc.com/2013/03/29/new-book-offers-insight-into-coding-for-intel-xeon-phi/ (дата обращения: 15.12.2021).
7. Ryan Smith (25 May 2010), Intel Kills Larrabee GPU, Will Not Bring a Discrete Graphics Product to Marke [Электронный ресурс] – URL: https://www.anandtech.com/show/3738/intel-kills-larrabee-gpu-will-not-bring-a-discrete-graphics-product-to-market (дата обращения: 15.12.2021).
8. Анонсирован выпуск сопроцессоров Intel Xeon Phi [Электронный ресурс] – URL: https://www.ixbt.com/news/hard/index.shtml?15/92/47 (дата обращения: 16.12.2021).
9. Введение в принципы функционирования и применения современных мультиядерных архитектур (на примере Intel Xeon Phi) [Электронный ресурс] – URL: https://intuit.ru/studies/courses/10611/1095/lecture/22906 (дата обращения: 15.12.2021).
10. Обзор по оценке и оптимизации производительности Intel Xeon Phi [Электронный ресурс] – URL: https://www.researchgate.net/publication/333384596_A_Survey_on_Evaluating_and_Optimizing_Performance_of_Intel_Xeon_Phi (дата обращения: 15.12.2021).
11. Терафлопсный сопроцессор Intel Xeon Phi http://wit.ru/solution/xeon-phi/intel-xeon-phi-coprocessor.aspx (дата обращения: 02.11.2021).