онлайн Миколаїв
randf1975@gmail.com
icq 387022909
0978603434
0934860664
Понеділок 23.10.2017 20:34

Міні-чат
Статистика

Онлайн всього: 1
Гостей: 1
Користувачів: 0
Mykolaiv.ucoz.ua

Mykolaiv.ucoz.ua стоит $529.00 USD
$529.00 USD
Сколько стоит ваш?

Головна » Статті » статті

AMD Bulldozer и Bobcat: архитектуры нового поколения

После выхода микроархитектуры AMD "Hammer" прошло уже семь лет, а три года назад архитектура получила обновление в виде K10. В момент же своего появления новые процессоры Athlon 64 на основе архитектуры K8 прославились тем, что смогли обойти процессоры Intel Pentium 4 и стали фаворитом среди энтузиастов.

Но ситуация на рынке производительности меняется довольно быстро, а Intel известна своими стремительными возвращениями, стоит компании оказаться на втором месте Микроархитектура Core изменила расстановку сил в пользу Intel в 2006 году, компания удерживала лидирующую позицию все последующие четыре года.

Конечно, AMD продаёт привлекательные процессоры. Линейка Athlon II постоянно присутствует в наших ежемесячных рекомендациях по выбору лучшего CPU для геймера за свои деньги благодаря приличной производительности и невысоким ценам. Двуядерный Phenom II X2 555 Black Edition просто непобедим по цене дешевле $100. Да и процессоры на основе дизайна AMD Thuban предлагают шесть ядер по цене ниже $200.

Но если оценивать производительность в расчёте на такт, то вряд ли кто-то будет спорить, что процессоры AMD отстают от Intel. У Intel, как обычно, в преимуществах лидерство по техпроцессу, поскольку новые процессоры производятся по технологии 32 нм. Между тем AMD пришлось умещать шестиядерный процессор в 130-Вт тепловом пакете, используя 45-нм техпроцесс.

AMD надеется, что дизайну K10 не придётся сдерживать микроархитектуру Intel Westmere долгое время. В прошлом году во время Financial Analyst Days AMD впервые приоткрыла завесу тайны над "модулями", которые определяют дизайн процессоров следующего поколения. Конечно, информация была очень скудной, но представители компании дали чётко понять, что перед нами самое существенное изменение дизайна после K8.


Насколько мы знаем, на новой архитектуре выйдут два ядра x86, каждое из которых будет предоставлять конкурентоспособный набор функций для нескольких разных рынков. Bulldozer предназначен для использования в разных ПК, от массовых клиентских (настольные системы и ноутбуки) до серверов. Bobcat позиционируется как более гибкий дизайн, то есть на его основе будут производиться ядра с более экономичным и компактным дизайном для нетбуков и облачных клиентов.

Следует помнить, что, как и в случае других смен поколений, нам следует разобраться в нескольких внутренних названиях. AMD обсуждала чипы Bulldozer и Bobcat только на недавно прошедшей конференции Hot Chips 22 (спонсируемое IEEE мероприятие, посвящённое производительным процессорам). Впрочем, вероятно следует чуть более глубоко окунуться в тему сферы применения упомянутых дизайнов CPU, хотя бы чтобы предотвратить путаницу с кодовыми названиями. Если вы запутаетесь в номенклатуре, то на последней странице статьи приведены планы AMD на 2011 год.

Подробности о Bulldozer

На самом деле большая часть информации, которую выдала AMD на Hot Chips, уже известна, то есть нас не покидало ощущение того, что мы уже где-то видели детали об архитектурах Bulldozer и Bobcat.

Компания явно поставила наиболее сильный акцент на Bulldozer и на его подход к многопоточности. AMD провела чёткую границу между обычной параллельной многопоточностью SMT (simultaneous multi-threading, также продвигается как Intel как Hyper-Threading) и мульти-обработкой на уровне чипа (CMP), которую, например, реализует шестиядерный дизайн Thuban, когда одно ядро работает над одним потоком.

Подход CMP прямолинеен. Вы дублируете физические ядра, чтобы увеличить производительность в многопоточном программном обеспечении. Такой прямой подход даёт наилучшую производительность, но при этом становится весьма накладным для производителей CPU, когда они упираются в пределы техпроцесса, особенно если исполнительные ресурсы будут оставаться незагруженными. Именно поэтому мы часто рекомендуем быстрые четырёхъядерные процессоры по сравнению с медленными шестиядерными для игр. Если ваша нагрузка не оптимизирована должным образом для параллельного выполнения, то CMP приведёт к избыточным вычислительным ресурсам, и более высокая тактовая частота менее сложных двуядерных и четырёхъядерных дизайнов даст более высокую производительность.

Intel пытается обойти эту проблему с технологией Hyper-Threading, которая позволяет каждому физическому ядру выполнять два потока. При этом как раз предполагается избыточность вычислительных ресурсов, то есть дополнительная производительность от каждого ядра как раз достигается за счёт нагрузки потока ниже номинальной. Эту технологию реализовать относительно дёшево. Но она, в свою очередь, даёт весьма ограниченные преимущества. Некоторые нагрузки вообще не получают прироста производительности от Hyper-Threading. Другие едва достигают двузначного прироста производительности в процентах.


AMD пытается реализовать третий подход к многопоточности под названием Two Strong Threads ("два сильных потока"). Если Hyper-Threading только дублирует архитектурные состояния, то дизайн Bulldozer использует общие переднюю (fetch/запрос и decode/декодирование) и заднюю (через общий кэш L2) часть ядра, но дублирует целочисленные планировщики и исполнительные конвейеры, то есть каждый из двух потоков получит выделенные для него блоки.

Пара потоков использует общий планировщик для работы с плавающей запятой, с двумя 128-битными исполнительными блоками, поддерживающими умножение и накопление (FMAC, fused multiply-accumulate-capable). Следовательно, здесь явно прослеживается акцент AMD на целочисленную производительность, что имеет смысл с учётом инициативы Fusion компании, когда за обработку чисел с плавающей запятой будет отвечать GPU. Но следует помнить, что первые процессоры на дизайне Bulldozer будут работать самостоятельно. И, несмотря на то, что в данном случае мы получили общие исполнительные ресурсы по работе с числами с плавающей запятой, AMD остаётся уверенной в поддержании должного баланса между выделенными и общими компонентами.

Впрочем, ничего нового в этом нет. AMD говорила об этом ещё в ноябре 2009 года.

До презентации Hot Chips у нас была возможность обновить знания об архитектуре Bulldozer с Диной МакКинни (Dina McKinney), вице-президентом по инженерному проектированию AMD. По словам Дины, подход Two Strong Thread компании позволяет получить около 80% производительности от простого дублирования ядер. В то же время, использование некоторых общих ресурсов позволяет снизить энергопотребление и площадь кристалла.

Подобное совершенствование дизайна вместе с переходом на 32-нм техпроцесс SOI (кремний на диэлектрике) привели к тому, что AMD предполагает 33% увеличение количества ядер и 50% увеличение пропускной способности (что даст намного большее число исполняемых инструкций за такт, IPC) в том же тепловом пакете, что и у процессоров Opteron на дизайне Magny-Cours. Данное предположение базируется на симуляции производительности современной 12-ядерной линейки Opteron 6100 и грядущей 16-ядерной линейки Bulldozer с кодовым названием Interlagos.


Теперь настало время перейти к одному опасению, которое появилось у меня по поводу систематики AMD: модуль Bulldozer кажется мне одним ядром с поддержкой SMT. Но вместо дублирования регистров для сохранения архитектурного состояния AMD даёт каждому потоку своё окно инструкций и выделенные конвейеры. В нашей беседе с Джоном Фруэх (John Fruehe) из AMD стало понятно, что компания оценивает дублирование целочисленных планировщиков и соответствующих конвейеров (несмотря на другие общие компоненты) в каждом модуле Bulldozer как двуядерный дизайн, то есть отличает его от SMT, который ассоциируется с Hyper-Threading. Это кажется мне маркетинговым ходом, но всё же следует по достоинству оценить, что данная архитектура даст намного большую производительность, чем Hyper-Threading при параллельных нагрузках.

Пока ещё неизвестно, насколько хорошо модули Bulldozer будут взаимодействовать с Windows 7. Intel и Microsoft приложили немало усилий для оптимизации под Hyper-Threading. Планировщик операционной системы понимает разницу между физическим ядром и виртуальным ядром Hyper-Threading. Если нужно распределить два потока, то Windows 7 и Server 2008 R2 используют два физических ядра. Альтернатива - распределение двух потоков на одном и том же физическом ядре с поддержкой Hyper-Threading - явно бы привела к падению производительности. Поскольку модули Bulldozer всё равно используют общие ресурсы, вполне понятно, что процессоры Zambezi с четырьмя модулями лучше всего будут работать, когда два потока будут распределяться по разным модулям. Хотя AMD пока не объяснила, каким образом будет поддерживаться взаимодействие с ОС, представители компании заверили нас, что работают с производителями ОС насчёт оптимизаций, которые будут готовы к выходу Bulldozer.


Мы также поинтересовались у Джона насчёт возможностей передней части конвейера по работе с инструкциями в расчёте на такт, а также конфигурации общего кэша L2, но все эти детали пока закрыты. Однако с нами поделились информацией о том, что 128-битные блоки работы с плавающей запятой являются симметричными, и на любом такте любое интегрированное ядро может запустить на выполнение 256-битную инструкцию AVX (если программа скомпилирована с учётом поддержки AVX). Либо оба целочисленных ядра могут запустить на выполнение по одной 128-битной инструкции одновременно.

Кроме того, Джон прояснил, как ориентированы конвейеры каждого целочисленного блока. Если у K10 присутствовали три ALU/AGU, то теперь используется два набора по два ALU/AGU. Конфигурация кэша L1 тоже стала немного другой. Если у K10 на ядро мы получали 64 кбайт кэша L1 для инструкций и 64 кбайт L1 для данных, то у Bulldozer используется 16 кбайт кэша L1 для данных на ядро, а также 64 кбайт кэша L1 2-way для инструкций на модуль. Будет интересно посмотреть, как скажется на производительности меньший объём кэша L1.

Категорія: статті | Додав: randf (03.09.2010)
Переглядів: 663
Додавати коментарі можуть лише зареєстровані користувачі.
[ Реєстрація | Вхід ]
інформаційний блок
Aliexpress INT Aliexpress INT
PC Gaming


Зарабіток в Інтернеті
 54.81.79.128  2017 р.     М И К О Л А Ї В