Форум » Дискуссии » Boewie wichislitel'nie kompleksi (продолжение) » Ответить

Boewie wichislitel'nie kompleksi (продолжение)

milstar: http://drops.dagstuhl.de/opus/volltexte/2006/732/pdf/06141.AthanasPeter.Paper.732.pdf Although an FPGA’s clock rate rarely exceeds one-tenth that of a PC, hardware implemented digital filters can process data at ###################################################################### many times that of software implementations [4] ################################### . Additional performance gains have been described for cryptography [5], network packet filtering [6], target recognition [7] and pattern matching [8], among other ########################################################################## applications. A. Present Day Cost-Performance Comparison Owing to the prevalence of IEEE standard floating-point in a wide range of applications, several researchers have designed IEEE 754 compliant floating-point accelerator cores constructed out of the Xilinx Virtex-II Pro FPGA’s configurable logic and dedicated integer multipliers [16-18]. Dou et al published one of the highest performance benchmarks of 15.6 GFLOPS by placing 39 floating-point processing elements on a theoretical Xilinx XC2VP125 FPGA [19]. Interpolating their results for the largest production Xilinx Virtex-II Pro device, the XC2VP100, produces 12.4 GFLOPS, compared to the peak 6.4 GFLOPS achievable for a 3.2 GHz Intel Pentium processor. Assuming that the Pentium can sustain 50% of its peak, the FPGA outperforms the processor by a factor of four for matrix multiplication. One of the earlier projects demonstrated a 23x speedup on a 2-D FFT through the use of a custom 18-bit floating-point format [26]. More recent work has focused on parameterizible libraries of floating-point units that can be tailored to the task at hand [27-29]. By using a custom floating-point format sized to match the width’s of the FPGA’s internal integer multipliers, a speedup of 44 was achieved for a hydrodynamics simulation [30] using four large FPGAs. Nakasato and Hamada’s 38 GFLOPS of performance is impressive, even from a cost-performance standpoint. For the cost of their PROGRAPE-3 board, estimated at $15,000, it is likely that a 15-node processor cluster could be constructed producing 196 single precision peak GFLOPS. Even in the unlikely scenario that this cluster could sustain the same 10% of peak performance obtained by Nakasato and Hamada’s for their software implementation, the PROGRAPE-3 design would still achieve a 2x speedup. As in many FPGA to CPU comparisons, it is likely that the analysis unfairly favors the FPGA solution. Hardware implementations require specialized skills in digital design and vendor-specific tool flows. Development time and costs are significantly higher than for software. Many comparisons in literature spend significantly more time optimizing the hardware implementations than they do optimizing their software implementations. Previous research has demonstrated significant compiler inefficiency for common HPCfunctions [31]. For the DGEMM matrix multiplication function, a hand-coded version outperformed the ############################################### compiler by greater than eight times. ############################ A to- tal of 39 PEs can be integrated into the xc2vp125-7 FPGA, reaching performance of, e.g., 15.6 GFLOPS with 1600 KB local memory and 400 MB/s external memory bandwidth 1 is s 1700 nozkami i wisokoj stoimost'ju porjadka 8000 $ segodnja http://ce.et.tudelft.nl/~george/publications/Conf/FPGA05/FPGA05Dou.pd http://www.xilinx.com/publications/matrix/virtexmatrix.pd Xilinx Vertex FPGA

Ответов - 163, стр: 1 2 3 4 5 6 7 8 9 All

milstar: МУРМАНСК, 3 апреля. /Корр. ТАСС Илья Виноградов/. Подразделения Северного флота по борьбе с подводными диверсионными силами провели практические испытания беспилотного летательного аппарата "Тахион", предназначенного для ведения воздушной разведки и обнаружения малых и слабозаметных объектов на берегу, на воде и под водой. © ТАСС/Виталий Невар Беспилотники обеспечат онлайн-трансляцию пусков ЗРК С-300 на учениях ВВО "Испытания проходили в бухтах на побережье Кольского полуострова, - сообщил в пятницу начальник пресс-службы СФ капитан 1-го ранга Вадим Серга. - В первую очередь оценивалась возможность беспилотников обнаруживать боевых пловцов и средства их доставки на различных глубинах, а также маневренные базы диверсионных групп, замаскированные засады, в том числе в темное время суток с применением систем ночного видения". По словам Серги, аппарат специально разработан для применения в условиях Крайнего Севера, оснащен тепловизором и видеокамерой. "Тахион" имеет небольшие массогабаритные характеристики и может использоваться в широком диапазоне высот и температур, а также при значительной скорости ветра", - отметил он. Беспилотник создан компанией "Ижмаш - Беспилотные системы", имеет размах крыла 2 м, взлетную массу около 7 кг и максимальную высоту полета до 4000 м. Продолжительность полета составляет до двух часов со скоростью от 60 до 100 км в час, а радиус действия около 40 км. Эксплуатация аппарата допускается в диапазоне температур от -30 до +40 градусов. http://tass.ru/armiya-i-opk/1877623 Na foto Panasonic cF-31 ... swoj nado delat ##### https://www.youtube.com/watch?v=0n6mX8Q1waA

milstar: http://www.fastwel.ru/cms/f/463418.pdf Oniks08

milstar: http://www.dolomant.ru/ Начато серийное производство первых российских планшетных компьютров "ОНИКС08" в защищённом исполнении 20 января 2016 ЗАО «НПФ «Доломант» стартовало серийное производство защищённых планшетных компьютеров «ОНИКС08» собственной разработки. Новинка предназначена для применения в жёстких условиях эксплуатации, в том числе на транспорте и в полевых условиях. Защищённый планшет "ОНИКС08" разработан для применения в качестве носимого или бортового оборудования, например, системы информирования машиниста локомотива, компьютера сотрудника дорожной полиции, планшета командира взвода или АРМ в артиллерийской батарее. Прочность конструкции и достаточно мощные функциональные возможности позволят применить «ОНИКС08» во множестве других сложных областей человеческой деятельности, где будет востребована экстремальная «живучесть» переносного компьютера. «ОНИКС08» разработан от уровня схемотехники и исходных кодов системного программного обеспечения российскими инженерами, что гарантирует отсутствие аппаратных и программных «закладок» и недокументированных функций. "ОНИКС08" успешно прошёл приёмочные испытания в соответствии с ТУ, подтверждающие его безотказную работу при температурах от –30°C, ударах до 100g и устойчивости к пыли и влаге. Поддержка российских операционных систем AstraLinux и КПДА позволяет разработчикам программного обеспечения быстро перенести существующие программы на планшет и применить изделие на практике. Российское происхождение и производство гарантирует длительный срок доступности изделия, не менее 10 лет, важный для ответственных проектов с длительным периодом эксплуатации. Планшет выполнен на мощном четырёхъядерном процессоре Freescale iMX6 с частотой 1 ГГц и имеет оперативную память 4 ГБ. Этого достаточно, например, для быстрой загрузки различных карт и работы с ними. Операционная система и прикладное программное обеспечение записываются на напаянный твердотельный диск объёмом до 32 Гб, а дополнительные данные, в том числе карты местности, могут располагаться на съёмном носителе MicroSD. В конструкции "ОНИКС08" применены решения для массового производства, в частности литой корпус из магниевого сплава, что позволило достичь стоимости изделия на уровне наиболее распространённых зарубежных аналогов. Текущие производственные мощности ЗАО "НПФ «ДОЛОМАНТ» в России позволяют собирать не менее 10 000 планшетов в месяц. В рамках программы импортозамещения, запланирована разработка новой версии «ОНИКС08» на российском процессоре семейства Байкал. Для работы в кабине транспортного средства «ОНИКС08» дополнительно укомплектовывается док-станцией с встроенными блоком питания от бортовой сети, выходами антенн беспроводных сетей и интерфейсами для контроля и управления бортовым оборудованием — GbEthernet, USB2.0, RS232 и CAN2.0. Устройство работает с сетями LTE и GSM 900/1800, имеет встроенные модуль Wi-Fi, Bluetooth и навигационный приёмник GLONASS/GPS. Время автономной работы устройства на одной зарядке составляет не менее восьми часов, а в режиме ожидания — до 150 часов. ЗАО "НПФ «ДОЛОМАНТ», разработчик и производитель «ОНИКС08», готово модифицировать планшет по техническим требованиям серийных потребителей. Наиболее востребованы модификации док-станции: замена крепёжной консоли, изменение номинала входного питания, изменения типа разъёмов, вывод дополнительных интерфейсов. ЗАО «НПФ «ДОЛОМАНТ» — российская компания, ведущая разработки и производство современной электроники для жёстких условий эксплуатации.


milstar: МОСКВА, 7 июня. /ТАСС/. Холдинг "Вертолеты России" (входит в госкорпорацию "Ростех") до конца 2018 года планирует перейти на операционную систему Astra Linux, заменив таким образом до 50% продукции Microsoft. Об этом сообщили в пресс-службе холдинга. "Холдинг "Вертолеты России" стремится минимизировать зависимость от иностранного программного обеспечения и направляет финансирование на развитие отечественного инженерного потенциала с целью перехода на российские разработки в области ИТ и свободное ПО. До конца 2018 холдинг планирует снизить использование решений компании Microsoft до 50%, выполнив переход на операционную систему Astra Linux", - говорится в сообщении. В пресс-службе отметили, что сейчас специалисты холдинга работают над импортозамещением в ИТ-архитектуре управляющей компании и предприятий "Вертолетов России". В компании рассчитывают, что применение отечественного программного обеспечения (ПО) и оборудования позволит сократить затраты на закупку, лицензирование и техническую поддержку ПО Microsoft в два раза. Astra Linux - российская защищенная операционная система, позволяющая работать с информацией ограниченного распространения, включая государственную тайну до степени секретности "совершенно секретно". Подробнее на ТАСС: http://tass.ru/armiya-i-opk/3345398

milstar: Реально получить Пропагандистский эффект в широких массах 1. планшетх компьютeр "ОНИКС08" 2. Astra Linux - российская защищенная операционная система 3.Мобильный телефон Yota 4.Автомашина Тигр 5.Патрульные катера проекта 03160 «Раптор Длина 16,9 м ########################## это не капиталоемкие отрасли При наличии государственного планирования вполне реально реализовать

milstar: http://hi-tech.media/122016.html cwm dlja brls

milstar: БЦВМ на процессорном модуле с Эльбрус 4С Производительность БЦВМ (при работе с 32 разрядными числами), ГФлопс Не менее 35 Программное обеспечение операционную систему «Эльбрус», драйвера носителя мезонинов Габариты (Д x Г x В), мм не должны превышать размеров 280×230×110 Масса, кг Не более 5,5 Средняя наработка на отказ в полете, ч не менее 9000 http://www.ipmce.ru/custom/path7/path1/path2/

milstar: http://www.mcst.ru/files/5a9eb2/a10cd8/501810/000003/kim_a._k._perekatov_v._i._feldman_v._m._na_puti_k_rossiyskoy_ekzasisteme_plany_razrabotchikov.pdf http://www.mcst.ru/files/5a9eb5/c90cd8/509917/000000/molchanov_i._a._bychkov_i._n._analiz_pokazateley_platformy_elbrus_s_uchetom_perenosa_prilozheniy.pdf

milstar: New VPX3-1260 delivers “Screaming Fast” compute performance, up to 4.4 GHz, featuring just announced Intel Xeon E-2176M 6-core/12-thread (“Coffee Lake”) processor ASHBURN, Va. – April 3, 2018 – Curtiss-Wright’s Defense Solutions division today announced the aerospace and defense industry’s highest performance 3U OpenVPX single board computer (SBC), the first to be based on the just introduced Intel Xeon E-2176M (former codename “Coffee Lake”) processor. Curtiss-Wright’s VPX3-1260 SBC leads the industry in bringing the unprecedented compute power and I/O flexibility of the new 8th Gen Intel Xeon processor to the embedded market. Boasting a significant performance improvement over previous generations of Intel Core i7 and Xeon processors, the Xeon E-2176M makes the VPX3-1260 an ideal processing engine for system designers seeking the maximum amount of performance-per-Watt to support their compute intensive deployed applications. The Xeon E-2176M’s 6-core (12-thread) architecture delivers an already impressive 2.7 GHz performance that increases up to 4.4 GHz when the processor’s Turbo Mode is applied. What’s more, in addition to being available in air- and conduction-cooled configurations, this rugged board will also be available as the industry’s first Xeon E-2176M-based 3U OpenVPX SBC to feature full compliance to the VITA 48.8 Air-Flow-Through (AFT) cooling standard, ensuring optimal performance for critical applications in the harshest conditions. “Curtiss-Wright is proud to lead the rugged embedded COTS industry in bringing Intel’s latest processing architectures to the aerospace and defense markets,” said Lynn Bamford, Senior Vice President and General Manager, Defense Solutions division. “The VPX3-1260 is the industry’s first single board computer to bring the screaming fast processing power of the Intel Xeon E-2176M to the 3U OpenVPX form factor, enabling our customers to rapidly deploy the sheer power this 8th Gen Intel Xeon processor.” A State-of-the-Art All-in-One Processing Solution The VPX3-1260 was designed to take full advantage of the Xeon E-2176M’s next-generation performance features, delivering over 50% more processing power when compared with earlier Core i7 and Xeon processor designs. The SBC’s six cores are supported with up to 32 GB of dual-channel, high-speed ECC-protected DDR4 memory. With memory throughput rated at up to 38.4 GB/s, the VPX3-1260 maximizes the capabilities of the new processor while eliminating data bottlenecks. With 50% more Intel Advanced Vector Extension (AVX) engines, the SBC can accelerate math intensive applications with over 500 GFLOPS of AVX2 performance. In addition, the board supports up to 256 GB of on-board, super-fast Non-Volatile Memory Express (NVMe) Flash storage, to deliver 3-5x improvement in performance and provide up to 16x the capacity compared to standard SATA interfaces. The VPX3-1260 is ideal for use in general purpose mission computing applications that require the highest possible processing performance while consuming low power. This fully rugged module speeds and simplifies the integration of the 8th Gen Intel Xeon processor’s cutting-edge capabilities into demanding defense and aerospace deployed applications such as mission computing, image and display processing, virtualization and small multi-SBC ISR systems. https://www.curtisswrightds.com/news/press-release/cw-debuts-vpx3-1260-3u-openvpx-single-board-computer.html

milstar: http://www.ineum.ru/elbrus_804_1u корпус формата 19″/1U, материнская плата формата SWTX габариты 482×44×741 мм, вес 22 кг 1 блок питания мощностью 1400 Вт, потребление до 635 Вт ПАО "ИНЭУМ", предприятие входящее в концерн Автоматика, произвело первую серийную партию высокопроизводительных 4-процессорных серверов на базе российского процессора Эльбрус-8С. Сервер Эльбрус-804 является наиболее высокопроизводительным сервером на базе российских микропроцессоров Эльбрус. Он содержит 4 процессора Эльбрус-8С с тактовой частотой 1.2 ГГц, поддерживает установку до 256 ГБайт ОЗУ, предельная вычислительная мощность сервера составляет 460 гигафлопс двойной точности http://www.ineum.ru/ineum-nachal-serijnoe-proizvodstvo-rossijskikh-serverov-novogo-pokoleniya

milstar: https://www.nec.com/en/global/solutions/hpc/sx/A300-8.html 4u 17 teraflop

milstar: В России создан компактный суперкомпьютер с пиковой производительностью 2,2 петафлопс. Как сообщили в пятницу, 23 ноября, в пресс-службе госкорпорации "Ростех", это устройство разработано концерном "Вега" (входит в холдинг "Росэлектроника") и представляет интерес для предприятий оборонно-промышленного комплекса и космической отрасли, технополисов и научно-исследовательских институтов. Габариты вычислительного модуля – 1,9×1,35×1 м, объем хранения данных – до 2,2 петабайт, рассказали в пресс-службе "Ростеха". "Ростех" отчитался о создании мобильного суперкомпьютера 23 Ноября 2018 в 16:09 Тема: ВПК В России создан компактный суперкомпьютер с пиковой производительностью 2,2 петафлопс. Как сообщили в пятницу, 23 ноября, в пресс-службе госкорпорации "Ростех", это устройство разработано концерном "Вега" (входит в холдинг "Росэлектроника") и представляет интерес для предприятий оборонно-промышленного комплекса и космической отрасли, технополисов и научно-исследовательских институтов. Габариты вычислительного модуля – 1,9×1,35×1 м, объем хранения данных – до 2,2 петабайт, рассказали в пресс-службе "Ростеха". Ростех Ростех Gipermed.info В конструкции устройства применяется погружная система жидкостного охлаждения, которая позволяет создавать мобильные вычислительные центры на базе обычных кузовов-контейнеров вне специально оборудованных помещений. Такая схема охлаждения отличается низким уровнем шума, пыле- и влагозащищенностью, а также пожаробезопасностью, отметили в пресс-службе. "Наш суперкомпьютер может использоваться, например, для автоматического распознавания объектов при спутниковой съемке, моделирования космических летательных аппаратов и оценки состояния их бортовых систем. Разработка обладает модульным построением, оснащена уникальными системами поддержания работоспособности – это позволяет создать мобильную вычислительную систему любой мощности, любого назначения в любой точке земного шара", – сказал исполнительный директор госкорпорации "Ростех" Олег Евтушенко. "Росэлектроника" – ключевой участник радиоэлектронного рынка. Холдинг образован в 1997 году, в 2009 году вошел в состав "Ростеха". В 2017 году в холдинг интегрировали Объединенную приборостроительную корпорацию. "Росэлектроника" объединяет более 120 предприятий и научных организаций, специализирующихся на разработке и производстве радиоэлектронных компонентов и технологий, средств и систем связи, автоматизированных систем управления, робототехнических комплексов, СВЧ-радиоэлектроники, вычислительной техники и телекоммуникационного оборудования. Общая численность сотрудников – более 70 тысяч человек. Годовая совокупная выручка предприятий холдинга превышает 150 млрд рублей. Продукция холдинга поставляется более чем в 30 стран мира, в том числе в Европу, Юго-Восточную Азию, на Ближний Восток, в Африку и Латинскую Америк https://военное.рф/2018/%D0%A0%D0%BE%D1%81%D1%82%D0%B5%D1%8511/

milstar: Эльбрус-16С Микропроцессор Эльбрус-16С - получены первые инженерные образцы! Эльбрус-16CВ — 16-ядерный микропроцессор серии «Эльбрус», разрабатываемый российской компанией МЦСТ. Производительность — 750 Гфлоп/с двойной точности (64 бит) и 1,5 Тфлоп/с одинарной точности (32 бит). Завершение ОКР планируется в 2020 году, начало серийного выпуска – в 2021 году. Относится к шестому поколению российской архитектуры «Эльбрус». Предназначен, в том числе, для создания суперкомпьютеров с производительностью до 100 Пфлоп/с с использованием коммуникационной сети СМПО‐100П разработанного во ВНИИЭФ. - https://pwo.su/30738-mikroprocessora-elbrus-16s-polucheny-pervye-inzhenernye-obrazcy.html С фабрики TSMC были получены 15 инженерных образцов микросхем 1891ВМ038 (Эльбрус-16С) и подтверждена их работоспособность. Комиссия Минпромторга подписала акт приемки работ и рекомендовала приступить к четвертому этапу. Комиссия рекомендовала внести изменения и дополнения в разработку процессора: Увеличить общий объем кэш-памяти до 48 Мб для оптимизации производительности при статическом планировании и существенного сокращения конфликтов при многоядерной работе. Увеличить объем оперативной памяти на один микропроцессор до 1 Терабайта (вместо 256 Гигабайт) при доступности соответствующих планок памяти. Реализовать дополнительные аппаратно-программные средства МП, обеспечивающие виртуализацию с возможностью исполнения кодов платформы x86-64 (для более полного использования параллельных возможностей многоядерной архитектуры). Реализовать аппаратные возможности для динамической оптимизации необходимой для эффективного исполнения динамических языков и повышения скорости работы программ за счет дополнительной оптимизации при их исполнении. - https://pwo.su/30738-mikroprocessora-elbrus-16s-polucheny-pervye-inzhenernye-obrazcy.html Из крупных заказчиков 8-ядерный процессор «Эльбрус» уже использует, например, МВД, некоторые нефтегазовые компании. А одна из «дочек» РЖД – компания «Элтеза» - внедряет вычислительные комплексы на базе защищенной программно-аппаратной платформы «Эльбрус» в системы управления движением поездов. Серверы и СХД на «Эльбрусах» используются и у телеком-операторов на узлах связи. Им его поставляет партнер МЦСТ - компания «Норси-Транс». По цене отечественные процессоры пока в невыгодную сторону отличаются от импортных аналогов. В МЦСТ отмечают, что в микроэлектронной промышленности цена очень зависит от массовости выпуска продукции. Для того, чтобы произошло существенное снижение стоимости «Эльбруса», нужно на пару порядков увеличить объемы производства, говорит Василий Воробушков. А последние, в свою очередь, зависят от объемов заказа. - https://pwo.su/30738-mikroprocessora-elbrus-16s-polucheny-pervye-inzhenernye-obrazcy.html

milstar: https://www.nec.com/en/global/solutions/hpc/sx/vector_engine.html 0.016 mkm Finfet https://www.nec.com/en/global/solutions/hpc/sx/A300-8.html? 17 teraflop ,2.8kwt

milstar: https://astralinux.ru/assets/docs/assets/docs/resources/919/26_%D0%9C%D0%A6%D0%A1%D0%A2_%D0%9B%D0%B8%D0%BD%D1%83%D0%BA%D1%81_%D0%97%D0%B8%D0%BD%D1%87%D0%B5%D0%BD%D0%BA%D0%BE_fin.pdf

milstar: The Aurora chip is 33 millimeters by 15 millimeters, for a die size of 494 square millimeters, which is 39.4 percent smaller than the 815 square millimeters of the Volta chip from Nvidia. https://www.nextplatform.com/2017/11/22/deep-dive-necs-aurora-vector-engine/

milstar: Гибридные вычислительные системы NEC TSUBASA на базе новых векторных процессоров SX-Aurora представлены в диапазоне от рабочих станций до суперкомпьютеров и отличаются не только высокой производительностью, но и эффективной работой с памятью, что позволяет их использовать не только для высокопроизводительных вычислений, но и для обработки больших данных и решения задач искусственного интеллекта, где уже применяются специализированные акселераторы, включая GPU. Еще со времен первых систем Cray в суперкомпьютерах применяются векторные операции, а поддержка коротких векторов реализована уже и в ПК, что сегодня возможно благодаря применению в x86-процессорах Intel технологии AVX512, обеспечивающей работу с векторами длиной 512 бит (8 чисел с плавающей запятой двойной точности, DP). При поддержке распространенных в HPC-приложениях команд типа «умножить-и-сложить» каждое соответствующее исполнительное устройство в процессоре архитектуры Intel Skylake дает 16 DP-результатов за такт. Новые процессоры NEC SX-Aurora (SX-10+) поддерживают работу с более длинными векторами и с более расширенной функциональностью. Процессоры SX-10+, именуемые в NEC также Vector Engine (VE), имеют 8 ядер, состоящих из скалярного и векторного блока. В каждом ядре содержится по 64 векторных регистра длиной по 256 DP-элементов, имеющих по 64-разряда. Соответственно, суммарная емкость регистров в каждом ядре составляет 128 Кбайт. В эти регистры помещаются исходные данные для выполнения векторных команд и результаты. Ядра SX-10+ поддерживают выполнение векторных команд «умножить-и-сложить», для чего у них имеется по три устройства FMA (Floating Point Multiply Add) [1, 2], однако на каждом такте из векторных регистров в FMA поступает по 32 DP-элемента (е) векторов и формируется 32 DP-числа результата (рис. 1). Общая операция над 256 DP-элементами векторов завершается за 8 тактов. Таким образом, пиковая производительность ядра за такт составляет 32 x 2 x 3 = 192 FLOPS. Для сравнения, поддерживающие технологию AVX512 ядра процессоров Skylake дают за такт по 32 FLOPS, как и ядра процессоров-акселераторов KNL (Xeon Phi семейства x200 содержат до 72 ядер) [3], а в Tesla V100 используются 80 потоковых мультипроцессоров, содержащих по 32 DP-устройства (ядра), которые выдают по два результата, или 64 FLOPS за такт, для одного потокового мультипроцессора и, соответственно, 5120 FLOPS на весь V100. Рис. 1. Операция «умножить-и-сложить» над векторными регистрами https://www.osp.ru/os/2018/01/13053934/ Очень важной для обеспечения эффективной работы с векторами является поддержка пошаговой загрузки векторных регистров из памяти и соответствующей записи из них в память. Кроме того, в SX-Aurora имеются еще и более сложные команды сборки/разборки векторных регистров с непрямым доступом к памяти типа работы с элементами массивов, имеющих двухуровневую индексацию a (index (i)), в синтаксисе языка Fortran. Эти команды поддерживались и в предыдущем поколении векторных процессоров NEC SX-ACE. Другой кардинально важный для обеспечения высокой производительности компонент архитектуры VE — подсистема памяти. В VE применяется стандарт памяти с высокой пропускной способностью — High Bandwidth Memory (HBM2), трехмерная память стековой организации, интегрированная с процессором на кристалле посредством соединительной подложки (технология «silicon interposer»). Кроме NEC, созданием подложки для VE занимались также компании TSMC и Broadcom. Эта память состоит из блоков, содержащих 4 или 8 «матриц» емкостью по 1 Гбайт, а всего VE имеет шесть блоков HBM2 (рис. 2). Таким образом, общая емкость HBM2 в VE составляет 24 или 48 Гбайт. Канал доступа к каждому блоку имеет пропускную способность 200 Гбайт/с, что дает 1,2 Тбайт/с общей производительности памяти для VE. Для сравнения, в KNL ускоренная память MCDRAM имеет емкость 16 Гбайт при 490 Гбайт/с, а в V100 применяется HBM2 емкостью 16 Гбайт с 900 Гбайт/с, что свидетельствует о преимуществах SX-Aurora. Важнейшая особенность SX-Aurora, обеспечивающая высокую эффективность работы с памятью, — «интерфейс» между HBM2 и ядрами, представляющий собой общий для них программно управляемый кэш LLC (Last Level Cache). Гранулярность записи данных в LLC cоставляет 8 байт, а гранулярность по доступу к памяти в SX-10+ — 128 байт. Кэш имеет емкость 16 Мбайт (по 2 Мбайт на ядро) и состоит из двух частей по 8 Мбайт (рис. 2). Пропускная способность канала от ядра к кэшу составляет 384 Гбайт/с, а от ядра к памяти — 153,6 Гбайт/с при общей пропускной способности памяти LLC около 3 Тбайт/с. Для связи между двумя частями LLC, как и для связи между ядрами, используется «межсоединение» 2D mesh, концептуально аналогичное применяемому в KNL и Skylake. В LLC поддерживается технология обратной записи, что обеспечивает когерентность кэша и возможность применения традиционного для систем с общей памятью распараллеливания программ посредством OpenMP [1, 2]. Процессоры SX-Aurora — это развитие векторных процессоров NEC SX-ACE, в которых также поддерживались механизмы работы с памятью, обеспечивающие внеочередной доступ: программно управляемый буфер ADB (Assignable Data Buffer) и специальные регистры MSHR (Miss Status Handling Registers) [4]. В SX-Aurora буфер ADB входит в LLC. Емкость LLC можно сопоставить с емкостью кэшей старшего уровня в процессорах Intel KNL (кэш L2 в моделях Xeon Phi x200 имеет емкость по 0,5 Мбайт на ядро и максимальную емкость 36 Мбайт). Такие же показатели имеет кэш L2 в Xeon Phi архитектуры Knights Mill (модели x205). В серверных процессорах Skylake — Xeon Scalable Processor, в классе Gold емкость кэша L3 в расчете на ядро также существенно ниже, чем у SX-10+, — 1,375 Мбайт. Соответственно, у старших 20-ядерных моделей Intel Xeon 6154 этого класса общая емкость L3 равна 24,75 Мбайт. Важная особенность вычислительных систем NEC TSUBASA — гибридная архитектура. Эти системы представляют собой серверы под управлением ОС Linux, а процессоры SX-Aurora служат к ним дополнением, однако, в отличие от акселераторов, включая и GPU, приложения выполняются на SX-Aurora полностью, а не отдельными частями. Например, на GPU от Nvidia выполняются только те части приложения, где может быть обеспечена высокая производительность с плавающей запятой, а другие части выполняются на сервере-хосте стандартной архитектуры, тогда как в SX-Aurora приложение выполняется целиком, включая операции ввода-вывода. Запрос на ввод-вывод передается от VE к серверу-хосту стандартной архитектуры, для которого в NEC используется термин Vector Host (VH). VE работает с VH через шину PCIe 3.0 x16, которая применяется и для коммуникаций VE между собой [2]. В реализации NEC SX-10+ применена технология 16 нм FinFET (Fin Field Effect Transistor — «техпроцесс с вертикально расположенным затвором»), что позволило сделать процессор компактным — его размеры всего 33 x 14,96 мм против 76,0 x 56,5 мм у 20-ядерного процессора Xeon Gold 6148. У Nvidia V100 площадь — 815 кв. мм. Производитель предлагает три модели процессоров SX-10+: 10A, 10B и 10С, отличающихся емкостью памяти HBM2 и тактовыми частотами 1,4 или 1,6 ГГц. Это близко к применяемым в KNL — 1,3–1,5 ГГц, однако для процессоров Intel тактовая частота при работе с технологией AVX (и, соответственно, при подсчете пиковой производительности) ниже, чем базовая. Hапример, у KNL она ниже базовой на 200 МГц, а для Xeon Gold 6148 при базовой частоте 2,4 ГГц частота для AVX512 составляет 1,6 ГГц. Тактовая частота NEC 10A равна 1,6 ГГц, чему соответствует пиковая производительность одного ядра 307,2 GFLOPS, а всего процессора 10A — 2,45 TFLOPS. Для сравнения, максимальная пиковая производительность KNL близка к 3 TFLOPS, а V100 при увеличенной частоте 1,53 ГГц — 7,8 TFLOPS. Модель 10B отличается от 10A только тактовой частотой в 1,4 ГГц, а 10С от 10B — уменьшенной с 48 до 24 Гбайт емкостью HBM2. Средняя пропускная способность работы с памятью каждого ядра 10A и 10B составляет 150 Гбайт/с против 94 Гбайт/с в 10C, а всего процессора — 1,2 Тбайт/с и 0,75 Тбайт/с соответственно. Потребляемая мощность платы SX-Aurora TSUBASA не превышает 300 Вт против 150 Вт для TDP одного процессора Xeon Gold 6148 и 260 Вт у Xeon Phi 7290F. Процессоры 10A предполагают работу только с водяным охлаждением, 10B — еще и с воздушным, а 10С — только с воздушным; для него VE имеет специальную плату. Диапазон систем TSUBASA простирается от рабочих станций A100 до стоечных суперкомпьютеров A500 (см. таблицу). По производительности на тесте HPL процессоры VE и Intel SKL демонстрируют близкие результаты, включая и данные по отношению производительность/стоимость, что позволяет сделать вывод и о сравнимой стоимости (можно оценить процессор 10B на уровне 6 тыс. долл., однако прямых указаний по стоимости аппаратных средств c SX-Aurora производитель не приводит). Процессоры NEC SX-10+ — это потенциальная альтернатива GPU, особенно на фоне недавнего объявления Intel о прекращении развития линии процессоров Xeon Phi KNL. Однако полноценной заменой KNL процессоры VE считать нельзя — они работают только в гибридных вычислительных системах, включающих x86-процессоры. Вместе с тем высокие характеристики пропускной способности памяти расширяют потенциальные сферы применения TSUBASA — кроме HPC-приложений, компания NEC указывает и на такие области, как обработка больших данных, задачи искусственного интеллекта, включая и задачи машинного обучения. При разработке приложений автоматическая векторизация в компиляторах NEC проще, чем распараллеливание вручную, однако работа с длинными векторами может оказаться не так эффективна. Компания NEC активизировала работы по развитию программного инструментария для разработки приложений, например для операций с разреженными матрицами, что актуально не только для машинного обучения, но и, например, для классических для HPC-задач квантовой химии. Открытые системы. СУБД 2018 № 01 Векторные процессоры против акселераторов В связи с появлением векторных процессоров NEC SX-Aurora и гибридных вычислительных систем TSUBASA на их основе обострилась дискуссия о противостоянии традиционных процессоров и ускорителей различного типа, включая и GPU. 19.02.2018 Михаил Кузьминский Ключевые слова / keywords: HPC HPC NEC Графические процессоры GPU Суперкомпьютеры Гибридные вычислительные системы NEC TSUBASA на базе новых векторных процессоров SX-Aurora представлены в диапазоне от рабочих станций до суперкомпьютеров и отличаются не только высокой производительностью, но и эффективной работой с памятью, что позволяет их использовать не только для высокопроизводительных вычислений, но и для обработки больших данных и решения задач искусственного интеллекта, где уже применяются специализированные акселераторы, включая GPU. Еще со времен первых систем Cray в суперкомпьютерах применяются векторные операции, а поддержка коротких векторов реализована уже и в ПК, что сегодня возможно благодаря применению в x86-процессорах Intel технологии AVX512, обеспечивающей работу с векторами длиной 512 бит (8 чисел с плавающей запятой двойной точности, DP). При поддержке распространенных в HPC-приложениях команд типа «умножить-и-сложить» каждое соответствующее исполнительное устройство в процессоре архитектуры Intel Skylake дает 16 DP-результатов за такт. Новые процессоры NEC SX-Aurora (SX-10+) поддерживают работу с более длинными векторами и с более расширенной функциональностью. Процессоры SX-10+, именуемые в NEC также Vector Engine (VE), имеют 8 ядер, состоящих из скалярного и векторного блока. В каждом ядре содержится по 64 векторных регистра длиной по 256 DP-элементов, имеющих по 64-разряда. Соответственно, суммарная емкость регистров в каждом ядре составляет 128 Кбайт. В эти регистры помещаются исходные данные для выполнения векторных команд и результаты. Ядра SX-10+ поддерживают выполнение векторных команд «умножить-и-сложить», для чего у них имеется по три устройства FMA (Floating Point Multiply Add) [1, 2], однако на каждом такте из векторных регистров в FMA поступает по 32 DP-элемента (е) векторов и формируется 32 DP-числа результата (рис. 1). Общая операция над 256 DP-элементами векторов завершается за 8 тактов. Таким образом, пиковая производительность ядра за такт составляет 32 x 2 x 3 = 192 FLOPS. Для сравнения, поддерживающие технологию AVX512 ядра процессоров Skylake дают за такт по 32 FLOPS, как и ядра процессоров-акселераторов KNL (Xeon Phi семейства x200 содержат до 72 ядер) [3], а в Tesla V100 используются 80 потоковых мультипроцессоров, содержащих по 32 DP-устройства (ядра), которые выдают по два результата, или 64 FLOPS за такт, для одного потокового мультипроцессора и, соответственно, 5120 FLOPS на весь V100. Рис. 1. Операция «умножить-и-сложить» над векторными регистрами Производительность VE при работе с 32-разрядными числами одинарной точности вдвое выше, чем при работе с DP [1], однако большинство HPC-приложений работают с DP, поэтому далее все обсуждаемые результаты относятся именно к DP. Кроме FMA-устройств, каждое ядро SX-10+ имеет устройство для выполнения деления и извлечения квадратного корня, дающих существенный вклад в полное время расчета (например, в приложениях молекулярной механики или молекулярной динамики), однако эти операции при расчете пиковой производительности не учитываются. Ядра VE содержат также устройства для выполнения операций над числами с фиксированной запятой и логических операций. Все эти устройства работают с векторными регистрами [2]. Очень важной для обеспечения эффективной работы с векторами является поддержка пошаговой загрузки векторных регистров из памяти и соответствующей записи из них в память. Кроме того, в SX-Aurora имеются еще и более сложные команды сборки/разборки векторных регистров с непрямым доступом к памяти типа работы с элементами массивов, имеющих двухуровневую индексацию a (index (i)), в синтаксисе языка Fortran. Эти команды поддерживались и в предыдущем поколении векторных процессоров NEC SX-ACE. Другой кардинально важный для обеспечения высокой производительности компонент архитектуры VE — подсистема памяти. В VE применяется стандарт памяти с высокой пропускной способностью — High Bandwidth Memory (HBM2), трехмерная память стековой организации, интегрированная с процессором на кристалле посредством соединительной подложки (технология «silicon interposer»). Кроме NEC, созданием подложки для VE занимались также компании TSMC и Broadcom. Эта память состоит из блоков, содержащих 4 или 8 «матриц» емкостью по 1 Гбайт, а всего VE имеет шесть блоков HBM2 (рис. 2). Таким образом, общая емкость HBM2 в VE составляет 24 или 48 Гбайт. Канал доступа к каждому блоку имеет пропускную способность 200 Гбайт/с, что дает 1,2 Тбайт/с общей производительности памяти для VE. Для сравнения, в KNL ускоренная память MCDRAM имеет емкость 16 Гбайт при 490 Гбайт/с, а в V100 применяется HBM2 емкостью 16 Гбайт с 900 Гбайт/с, что свидетельствует о преимуществах SX-Aurora. Рис.2. Общее строение VE в NEC SX-Aurora Важнейшая особенность SX-Aurora, обеспечивающая высокую эффективность работы с памятью, — «интерфейс» между HBM2 и ядрами, представляющий собой общий для них программно управляемый кэш LLC (Last Level Cache). Гранулярность записи данных в LLC cоставляет 8 байт, а гранулярность по доступу к памяти в SX-10+ — 128 байт. Кэш имеет емкость 16 Мбайт (по 2 Мбайт на ядро) и состоит из двух частей по 8 Мбайт (рис. 2). Пропускная способность канала от ядра к кэшу составляет 384 Гбайт/с, а от ядра к памяти — 153,6 Гбайт/с при общей пропускной способности памяти LLC около 3 Тбайт/с. Для связи между двумя частями LLC, как и для связи между ядрами, используется «межсоединение» 2D mesh, концептуально аналогичное применяемому в KNL и Skylake. В LLC поддерживается технология обратной записи, что обеспечивает когерентность кэша и возможность применения традиционного для систем с общей памятью распараллеливания программ посредством OpenMP [1, 2]. Процессоры SX-Aurora — это развитие векторных процессоров NEC SX-ACE, в которых также поддерживались механизмы работы с памятью, обеспечивающие внеочередной доступ: программно управляемый буфер ADB (Assignable Data Buffer) и специальные регистры MSHR (Miss Status Handling Registers) [4]. В SX-Aurora буфер ADB входит в LLC. Емкость LLC можно сопоставить с емкостью кэшей старшего уровня в процессорах Intel KNL (кэш L2 в моделях Xeon Phi x200 имеет емкость по 0,5 Мбайт на ядро и максимальную емкость 36 Мбайт). Такие же показатели имеет кэш L2 в Xeon Phi архитектуры Knights Mill (модели x205). В серверных процессорах Skylake — Xeon Scalable Processor, в классе Gold емкость кэша L3 в расчете на ядро также существенно ниже, чем у SX-10+, — 1,375 Мбайт. Соответственно, у старших 20-ядерных моделей Intel Xeon 6154 этого класса общая емкость L3 равна 24,75 Мбайт. Важная особенность вычислительных систем NEC TSUBASA — гибридная архитектура. Эти системы представляют собой серверы под управлением ОС Linux, а процессоры SX-Aurora служат к ним дополнением, однако, в отличие от акселераторов, включая и GPU, приложения выполняются на SX-Aurora полностью, а не отдельными частями. Например, на GPU от Nvidia выполняются только те части приложения, где может быть обеспечена высокая производительность с плавающей запятой, а другие части выполняются на сервере-хосте стандартной архитектуры, тогда как в SX-Aurora приложение выполняется целиком, включая операции ввода-вывода. Запрос на ввод-вывод передается от VE к серверу-хосту стандартной архитектуры, для которого в NEC используется термин Vector Host (VH). VE работает с VH через шину PCIe 3.0 x16, которая применяется и для коммуникаций VE между собой [2]. В реализации NEC SX-10+ применена технология 16 нм FinFET (Fin Field Effect Transistor — «техпроцесс с вертикально расположенным затвором»), что позволило сделать процессор компактным — его размеры всего 33 x 14,96 мм против 76,0 x 56,5 мм у 20-ядерного процессора Xeon Gold 6148. У Nvidia V100 площадь — 815 кв. мм. Производитель предлагает три модели процессоров SX-10+: 10A, 10B и 10С, отличающихся емкостью памяти HBM2 и тактовыми частотами 1,4 или 1,6 ГГц. Это близко к применяемым в KNL — 1,3–1,5 ГГц, однако для процессоров Intel тактовая частота при работе с технологией AVX (и, соответственно, при подсчете пиковой производительности) ниже, чем базовая. Hапример, у KNL она ниже базовой на 200 МГц, а для Xeon Gold 6148 при базовой частоте 2,4 ГГц частота для AVX512 составляет 1,6 ГГц. Тактовая частота NEC 10A равна 1,6 ГГц, чему соответствует пиковая производительность одного ядра 307,2 GFLOPS, а всего процессора 10A — 2,45 TFLOPS. Для сравнения, максимальная пиковая производительность KNL близка к 3 TFLOPS, а V100 при увеличенной частоте 1,53 ГГц — 7,8 TFLOPS. Модель 10B отличается от 10A только тактовой частотой в 1,4 ГГц, а 10С от 10B — уменьшенной с 48 до 24 Гбайт емкостью HBM2. Средняя пропускная способность работы с памятью каждого ядра 10A и 10B составляет 150 Гбайт/с против 94 Гбайт/с в 10C, а всего процессора — 1,2 Тбайт/с и 0,75 Тбайт/с соответственно. Потребляемая мощность платы SX-Aurora TSUBASA не превышает 300 Вт против 150 Вт для TDP одного процессора Xeon Gold 6148 и 260 Вт у Xeon Phi 7290F. Процессоры 10A предполагают работу только с водяным охлаждением, 10B — еще и с воздушным, а 10С — только с воздушным; для него VE имеет специальную плату. Диапазон систем TSUBASA простирается от рабочих станций A100 до стоечных суперкомпьютеров A500 (см. таблицу). Векторные процессоры против акселераторов Модели TSUBASA, кроме типа и количества используемых VE, отличаются также разными VH. Во всех VH в качестве x86-процессоров используются Intel Xeon микроархитектуры Skylake, входящие в семейства Silver 4100 или Gold 6100 с памятью DDR4/2666 МГц. Так, в A100-1 и A300-2 доступно максимум по 6 DIMM общей емкостью 192 Гбайт, а в A300-4 и A300-8 доступно вдвое больше памяти. Старшая модель A500-64, которую NEC относит к суперкомпьютерам, представляет собой стойку, содержащую до 64 VE и 8 VH. С применением процессоров 10A эта модель достигает максимальной пиковой производительности 157,3 TFLOPS. С учетом энергопотребления A500-64 в 30 кВт, понятно, что на его основе можно легко построить суперкомпьютерный кластер петафлопсной производительности. Для построения кластеров, системы TSUBASA обеспечивают работу со 100-гигабитным межсоединением Infiniband EDR 4x. В качестве базовой операционной системы для VH используется дистрибутив RHEL 7.3, а на VE работает своя ОС, минимизирующая взаимодействие с ядром Linux для снижения накладных расходов. Поскольку приложения полностью выполняются на VE, их можно транслировать с оптимизирующими под SX-10+ компиляторами от NEC, поддерживающими языки программирования Fortran 2003 (c расширениями от Fortran 2008), Cи 11 и C++ 14. Эти компиляторы обеспечивают векторизацию и автоматическое распараллеливание. Наряду с этим предоставляются средства OpenMP 4.5 и MPI 3.1, а также оптимизированные математические библиотеки [1, 2]. Важно, что MPI-операции выполняются напрямую между VE через PCIe, без обращения к VH. Кроме того, NEC предлагает собственную систему пакетных очередей NQSV, распределенную параллельную файловую систему ScaTeFS и др. Преимущества NEC SX-Aurora (высокая производительность с плавающей запятой при низком энергопотреблении и отличные характеристики используемой памяти) еще нужно научиться использовать при работе с реальными приложениями — на данный момент единственные доступные показатели реальной производительности приводятся в [1] и относятся к стандартным тестам памяти STREAM/triad и тесту HPL. Результаты работы на процессоре 10B сопоставлены с данными для Nvidia Tesla V100, Intel KNL и Xeon Skylake (двухпроцессорная система с Xeon Gold 6148 (SKL)). На тесте STREAM пропускная способность памяти у VE почти в пять раз выше, чем у SKL, и существенно выше по сравнению и с KNL, и с V100. А на тесте HPL процессор VE показал производительность, близкую к SKL, но лучше, чем у KNL. Однако наивысшие результаты теста HPL достигнуты на V100: вдвое выше, чем у VE. По отношению пропускной способности памяти к стоимости процессор NEC VE в пять раз превосходит Intel SKL и также кардинально лучше, чем KNL и V100. А по отношению HPL-производительности к стоимости VE близок к SKL и превосходит KNL, однако этот показатель у V100 лучше, чем у VE. По производительности на тесте HPL процессоры VE и Intel SKL демонстрируют близкие результаты, включая и данные по отношению производительность/стоимость, что позволяет сделать вывод и о сравнимой стоимости (можно оценить процессор 10B на уровне 6 тыс. долл., однако прямых указаний по стоимости аппаратных средств c SX-Aurora производитель не приводит). *** Процессоры NEC SX-10+ — это потенциальная альтернатива GPU, особенно на фоне недавнего объявления Intel о прекращении развития линии процессоров Xeon Phi KNL. Однако полноценной заменой KNL процессоры VE считать нельзя — они работают только в гибридных вычислительных системах, включающих x86-процессоры. Вместе с тем высокие характеристики пропускной способности памяти расширяют потенциальные сферы применения TSUBASA — кроме HPC-приложений, компания NEC указывает и на такие области, как обработка больших данных, задачи искусственного интеллекта, включая и задачи машинного обучения. При разработке приложений автоматическая векторизация в компиляторах NEC проще, чем распараллеливание вручную, однако работа с длинными векторами может оказаться не так эффективна. Компания NEC активизировала работы по развитию программного инструментария для разработки приложений, например для операций с разреженными матрицами, что актуально не только для машинного обучения, но и, например, для классических для HPC-задач квантовой химии. Литература Momose S. SX-Aurora TSUBASA. Brand-new Vector Supercomputer, SC’17 Supercomputer Forum (2017). URL: http://www.nec.com/en/global/solutions/hpc/sx/vector_engine.html (дата обращения: 18.03.2018). М. Кузьминский. Из ускорителей в процессоры // Открытые системы.СУБД.— 2016.— № 3. — C. 4–6. URL: https://www.osp.ru/os/2016/03/13050252 (дата обращения: 18.03.2018). Ryusuke Egawa e.a. Early Evaluation of the SX-ACE Processor (2014). URL: http://sc14.supercomputing.org/sites/all/themes/sc14/files/archive/tech_poster/ poster_files/post196s2-file3.pdf (дата обращения: 18.03.2018). Михаил Кузьминский (kus@free.net) — старший научный сотрудник, Институт органической химии РАН (Москва).

milstar: Техпроцесс 28 нм на «Микроне» готовы были разработать самостоятельно, не покупая зарубежное оборудование и лицензии, которые для подобной технологии оцениваются в сумму до $7 млрд. Да их, скорее всего, и не удастся купить, отзывались эксперты -– технологии такого уровня запрещены к продаже в ряд стран, включая Россию, по политическим причинам. Чипы с топологией 28 нм на тот момент разрабатывали мировые лидеры Qualcomm, Samsung, Altera для смартфонов Samsung, Sony, Motorola, HTC, iPhone 5S. В России созданием таких чипов занимались несколько дизайн-центров: «Байкал Электроникс» (Baikal), МЦСТ («Эльбрус»), зеленоградские «Элвис» и КМ211. Фабрика 28 нм будет ориентироваться прежде всего на отечественные заказы, заявляли на «Микроне», но ничто не мешает выполнять и заказы зарубежных компаний. https://www.soel.ru/novosti/2018/v_zelenograde_namereny_postroit_fabriku_chipov_28_nm/ 500 пластин в месяц – такая производительность будущей фабрики 28 нм озвучивалась в презентации НИИМЭ. Для сравнения, плановая производительность линии «Ангстрема-Т», которую предлагали демонтировать ради 28 нм – до 15 тысяч пластин в месяц, недавно заключены контракты на поставки в Китай, которые загрузят её более чем наполовину. Отечественный рынок для чипов 28 нм тоже весьма невелик. Согласно опубликованному в октябре отчёту J’son & Partners «Анализ потенциала импортозамещения в микроэлектронике: Интегральные схемы 32 нм», доля спроса отечественных потребителей на чипы 28 нм не превышает 3% ############################################### и его почти полностью закрывают поставки американских чипов (произведённых в основном в ЮВА). «Задачи по импортозамещению должны быть существенно более амбициозны, особенно с учётом продолжающегося быстрого прогресса технологий производства интегральных схем», – резюмируют составители отчёта. https://www.soel.ru/novosti/2018/v_zelenograde_namereny_postroit_fabriku_chipov_28_nm/

milstar: *2019: Во втором квартале поставлено 31 890 серверов (-10,2%) на $226,63 млн (-6,2%) По результатам исследования IDC EMEA Quarterly Server Tracker, во втором квартале 2019 года на российский рынок было поставлено 31 890 серверов всех типов на общую сумму $226,63 млн. По сравнению с аналогичным периодом 2018 года, количество поставленных серверов уменьшилось на 10,2% и сопровождалось уменьшением объёма поставок в денежном выражении на 6,2%, сообщили 13 сентября 2019 года в IDC. Квартальные поставки серверов стандартной х86 архитектуры составили 99,2% в количественном и 89,9% в денежном выражении. В сегменте RISC-систем наблюдался рост поставок. Так в денежном выражении данный сегмент вырос на 33,3% по сравнению с аналогичным периодом прошлого года. По итогам квартала лидирующую позицию по поставленным серверным решениям стандартной х86 архитектуры заняла компания Hewlett Packard Enterprise. Несмотря на общее уменьшение объема поставок, ряд вендоров показали положительные темпы роста. Совокупная доля пятёрки крупнейших поставщиков составила 75,3% всех отгруженных серверов стандартной х86 архитектуры. Как и кварталом ранее, ODM-производители вошли в пятёрку ведущих поставщиков как в количественном, так и в денежном выражениях. « Несмотря на то, что рынок продемонстрировал отрицательную динамику по сравнению с аналогичным периодом прошлого года, мы наблюдали рост поставок у ряда международных вендоров. Среди них можно отметить компании Dell Technologies и Lenovo. ODM-поставщики также продемонстрировали рост, удовлетворяя спрос со стороны крупных поставщиков облачных сервисов, — отметил Михаил Лебедев, менеджер программы исследований рынка корпоративных систем, IDC в России и СНГ. — На фоне общего спада, сегмент малого и среднего бизнеса показал положительную динамику в части инвестиций в серверное оборудование. » 2018: Поставлено 132,2 тыс. серверов (+29,6%) на $770 млн (+42,7%) За 2017 год на российский рынок было поставлено 132 223 серверов всех типов на общую сумму $770,2 млн. Такие данные приводит аналитическая компания IDC в своем отчете IDC EMEA Quarterly Server Tracker, обнародованном в марте 2018 года. По оценкам аналитиков, за 2017 календарный год серверный рынок в России вырос на 29,6% в количественном и 42,7% в денежном выражении.

milstar: По итогам I квартала 2019 г. серверы стандартной х86 архитектуры составили 99,6% от всех поставок, если говорить о количестве устройств, и 94,7% — если говорить об их стоимости, показав рост на 27,1%. Поставки RISC-систем продемонстрировали годовой спад в денежном выражении. https://cnews.ru/news/top/2019-06-11_rossijskij_rynok_serverov_vyros_na_20 Напомним, по итогам IV квартала 2018 г. лидерство на рынке удерживала Hewlett Packard Enterprise, на втором месте находилась Huawei, на третьем — Dell EMC.



полная версия страницы