вторник, 25 января 2022 г.

История Intel в процессорах. Часть девятая - Sandy Bridge – свежее дыхание и начало эпохи застоя

   Следуя стратегии развития tick-tock, предусматривающей поочередную смену техпроцесса и архитектуры процессоров, после выпуска процессоров на новом 32 нм. техпроцессе в первых числах 2010-го года, спустя год пришло время представлять новую архитектуру получившую название - Sandy Bridge.

Sandy Bridge

   Процессоры Sandy Bridge можно считать работой над ошибками Nehalem, выпущенного более двух лет назад и особенно его 32 нм. вариации Clarkdale. Для начала посмотрим на ключевые отличия новой архитектуры.
   Во-первых - Sandy Bridge является цельным чипом, содержащим как 4 вычислительных ядра с кэшем третьего уровня, так и контроллер памяти с графическим ускорителем на одном кристалле, выполненном с применением норм 32 нм. техпроцесса. Было ликвидировано узкое место Clarkdale - вынесенный на отдельный чип контроллер памяти. Это наилучшим образом сказалось на скорости работы с оперативной памятью. Контроллер памяти остался двухканальным – как показали эксперименты с тремя каналами в Bloomfield – их скорость избыточна.
   В сами процессорные ядра также было внесено множество изменения. Интересно то, что корни многих архитектурных решений тянутся еще к архитектуре NetBurst. Так в дополнение к классическому кэшу инструкций первого уровня объемом 32 Кб, после декодера был добавлен еще один кэш, хранящий уже декодированные инструкции, объемом до полутора тысяч инструкций, являющийся полным аналогом Trace Cache в Pentium 4.
   Также от Pentium 4 была взята логика работы блока внеочередного исполнения команд (Out-of-Order) – суть изменения в том, что в отличии от Core и Nehalem, в процессорах Sandy Bridge блок внеочередного исполнения оперирует не самими инструкциями, а ссылками на них. Это позволяет держать в поле зрения почти в полтора раза больше инструкций для внеочередного исполнения. Обратной стороной такого решения стали дополнительные стадии исполнительного конвейера (вспоминаем основную особенность NetBurst в виде удлиненного конвейера).
   Пойти на такой шаг пришлось не для приверженности традициям, а из-за добавление нового набора инструкций названного AVX (Advanced Vector Extensions). Их ключевой особенностью было увеличение длины инструкции до 256 бит. Они фактически повторяют наборы инструкций SSE обеспечивая повышенную скорость выполнения и возможность работы с большими массивами данных одновременно.
   Кэш третьего уровня сохранив максимальный объем в 8 Мб для четырехядерной модели, наконец-то стал полноскоростным работая на частоте ядра. Кроме процессорных ядер, кэш L3 также может использоваться находящимся на одном кристалле видеоядром.
   Видеоядро также было улучшено – оно теперь содержит до 12 шейдерных конвейеров и может работать на частотах до 1,35 ГГц что позволяет ему почти догнать по производительности дискретные видеоадаптеры самого бюджетного сегмента. Кроме возросшей скорости в 3D (ее в любом случае было недостаточно для современных игр), в видеоядре появились блоки для обработки видео высокого разрешения. Причем они могут задействоваться даже при использовании внешнего видеоадаптера, разгружая процессорные ядра при работе с видеопотоком.
   Для подключения внешнего видеоадаптера в процессоре остался контроллер PCI-Express обеспечивающий 16 линий, которые могут обслуживать как подключение одной видеокарты в режиме 16х, так и двух в режиме 8х. Тут ничего не изменилось в сравнении с Lynnfiled. Как и связь с микросхемой чипсета по шине DMI.
   Так как кэш третьего уровня теперь работает вместе с процессорными ядрами, изменилось деление на модули Core и Uncore. Так часть процессора, ранее называвшаяся Uncore, теперь сменила название на Системный агент. Этот блок объединяет контроллеры памяти, шины PCI-Express и DMI.
   Еще один изменением логической организации процессорного чипа стало внедрение новой кольцевой шины для связи между собой компонентов процессорного чипа. Кольцевая шина объединяет между собой системный агент, процессорные ядра через кэш третьего уровня и графическое ядро. Эта шина хороша тем, что уменьшает количество внутрипроцессорных шин точка-точка, соединявших ранее различные блоки, а также тем, что функциональные блоки процессора для обмена данными выбирают самый короткий маршрут.
   
   Не остались без внимания функции управления энергопотреблением, и завязанная на них технология Turbo Boost. В модуль PCU (Power Control Unit), впервые появившийся в Nehalem были внесены важные изменения. Так весь процессорный кристалл, с точки зрения энергопитания, был разбит на три блока – Системный агент, процессорные ядра с кэшем третьего уровня, и графическое ядро. Такой подход позволил более гибко и независимо управлять динамическим разгоном графического и процессорных ядер (которые могут повышать свою частоту на 4 ступени, что для Sandy Bridge составляет 400 МГц).
   Также при выборе максимальной частоты в Turbo Boost, блок PCU анализирует температуру процессора и позволяет кратковременно, до 25 секунд (или пока не будет достигнута пороговая температура), работать с превышением максимального теплового пакета. Из этого следует два вывода: во-первых - для достижения максимальной производительности Sandy Bridge важным является качественная система охлаждения. И во-вторых – при использовании внешнего видеоускорителя, тепловой пакет встроенного видеоядра отдается процессорным ядрам, что также повышает скорость их работы.
   Но в этой бочке меда не обошлось без ложки дегтя. Речь идет о кардинальном изменении системы образования частот для разных блоков процессора. Дело в том, что из-за очень сложной внутренней организации процессоров Sandy Bridge задающий генератор был перенесен в микросхему чипсета, и используется для формирования опорной частоты для всех контроллеров в системе, включая те, что находятся в чипсете! Для изменения доступны лишь множители определяющие частоты процессорных ядер, видеоускорителя и контроллера памяти. Частоты остальных модулей процессора и чипсета, в частности шин PCI-Express и DMI, USB и SATA жестко завязаны на частоту внешнего генератора, который выдает 100 МГц. И при разгоне более чем на 5 МГц, эти блоки теряют стабильность. Таким образом Intel раз и навсегда покончила с разгоном процессоров, как с явлением, когда купив младшую модель процессора, можно было получить производительность приближенную, или даже превосходящую, производительность старших моделей. Но все-же для энтузиастов были выпущены модификации процессоров с разблокированным множителем, стоящие на пару десятков долларов дороже обычных моделей. А также старшие линейки процессоров поддерживали увеличение базового коэффициента умножения не более чем на 4 позиции. При этом сохранялась корректная работа технологии Turbo Boost, что в пике давало 800 МГц частоты. Такого разгона должно было хватить для нетребовательных пользователей, желающих немного поднять производительность своего процессора, не вкладываясь при этом в дорогую систему охлаждения.
   Несмотря на то, что новые процессоры по своим возможностям были аналогичны процессорам на платформе Socket 1156 (встроенное видеоядро, двухканальный контроллер памяти, 16 линий шины PCI-Express и связь с южным мостом через шину DMI), процессоры сменили конструктив на несовместимый Socket 1155, или как его еще называли LGA 1155. Необходимость смены процессорного разъема была вызвана в первую очередь изменениями в цепях управления питанием и другим формированием задающей частоты.
   Система наименования новых процессоров перекочевала с прошлого поколения с минимальными изменениями – первая цифра процессорного номера 2, стала указывать на второе поколение процессоров Intel Core. Вся-же остальная логика осталась прежней - принадлежность к бренду Intel Core, после чего идет имя семейства i7, i5 или i3. Далее следует процессорный номер, первая цифра которого указывает на второе поколение, а следующие три – на позицию процессора внутри семейства. И в конце может находится буква, обозначающая модификацию процессора. K – процессор с разблокированным множителем, S – низкое энергопотребление и T – сверхнизкое энергопотребление, P – процессоры без встроенного видеоядра.
 
   
   На момент представления Sandy Bridge у Intel наблюдался настоящий хаос из трех платформ для различных сегментов рынка, самой старой из которых было уже пять лет. Чтобы покончить с неразберихой, в компании Intel анонсируя новую платформу представили сразу пять семейств процессоров для всех сегментов рынка – от бюджетных Celeron, до топовых Core i7. Для наилучшего позиционирования все десктопные процессоры Sandy Bridge были основаны на двух дизайнах отличающихся количеством ядер. Первые - Sandy Bridge QC – четырехъядерные процессоры состоящие из 1,16 млрд. транзисторов для верхних сегментов рынка. Это ядро применялось в семействах Core i7 и Core i5 представленных в первых числах января 2011-го года. Процессоры Core i7, традиционно представляли верхний сегмент рынка и оснащались всеми доступными технологиями. Благодаря поддержке Hyper-Threading представляются операционной системе 8-ядерными процессорами способными выполнять 8 потоков. Обладают полным размером кэша третьего уровня в 8 Мб.
   В семействе процессоров Core i5 наконец-то был наведен порядок – это были честные четырехъядерные модели не поддерживающие технологию Hyper-Threading (кроме одного, энергоэффективного процессора Core i5-2390T). Но кроме отсутствия виртуальной многоядерности, семейство процессоров Core i5 лишилось части кэш-памяти третьего уровня – ее размер был уменьшен до 6 Мб.
   Второе ядро, на котором были основаны процессоры Sandy Bridge получило название Sandy Bridge DC – двухъядерные процессоры, состоящие из 504 млн. транзисторов для среднего и нижнего сегментов рынка. Более чем двукратное уменьшение количество транзисторов вызвано не только в два раза меньшим количеством процессорных ядер, но и уменьшившимся размером кэша третьего уровня – его базовый объем в Sandy Bridge DC – 3 Мб. Также эти процессоры не поддерживают технологию Turbo Boost и вообще не позволяют увеличивать значение множителя выше штатного значения.
   Старшими из бюджетных Sandy Bridge были процессоры, принадлежащие семейству Core i3, первые модели которых были анонсированы в феврале 2011-го года. Основные параметры процессоров этого семейства практически не изменились в сравнении с предшественниками. За исключением размера кэша третьего уровня – его объём был уменьшен до 3 Мб (что, впрочем, все равно составляет половину кэша Core i5). В остальном – это все те-же Core i3 – два ядра благодаря Hyper-Threading обрабатывают четыре потока. Отсутствие технологии Turbo Boost компенсировалось работой на довольно высоких частотах - Intel не стала замедлять свои процессоры основных семейств Core i – все они работают на близких частотах.
 
   Для Low-End сегмента рынка предназначаются два семейства Pentium и Celeron. Процессоры Pentium были анонсированы к лету 2011-го года, а в сентябре Intel представила максимально бюджетные Celeron. Эти процессоры лишились всех дополнительных функций Sandy Bridge, и кроме отсутствия Hyper-Threading, Turbo Boost и набора инструкций AVX их встроенное видеоядро не поддерживает обработку видео-потока. Еще в этих процессорах была понижена частота работы.
   Этих мер оказалось достаточно чтобы ограничить производительность бюджетных процессоров и адаптировать высокопроизводительную архитектуру Sandy Bridge для работы в нижнем сегменте рынка. Справедливости ради стоит сказать, что благодаря прогрессивной архитектуре исполнительных ядер, скорость новых Pentium оказалась сравнимой с скоростью процессоров Core i3 прошлого поколения. 
   Новые Celeron, кроме еще большего уменьшения рабочих частот, лишились также 1 Мб кэша третьего уровня, что тем не менее позволило занять им лидирующие позиции в самом нижнем ценовом сегменте, и окончательно поставить крест на долгожителе рынка LGA775.
   Наименование бюджетных процессоров отличалось от того, как выглядели названия основных процессорных семейств Core i. К названию семейства Pentium или Celeron добавлялась буква G и номер модели состоящий из трех цифр.
   И напоследок про скорость. Хоть все усовершенствования Sandy Bridge по одиночке не выглядят слишком революционными и выдающимися, все вместе они обеспечивают ощутимый, на уровне 15-30% прирост производительности над процессорами прошлого поколения на архитектуре Nehalem работающими на одинаковой частоте. А учитывая то, что базовые частоты на которых работают новые процессоры тоже немного выросли, вполне реальным стал прирост вплоть до 40-50% между процессорами старого и нового поколения имеющими одинаковую стоимость! Сложилась ситуация, когда процессоры Sandy Bridge младших линеек показывали сравнимую, или даже более высокую, скорость в сравнении с процессорами Nehalem старшей линейки. Нередко новые Core i5 опережали старые Core i7, равно как и новые Core i3 оказывались не медленнее старых Core i5. Таким образом у Sandy Bridge получилось то, чего не получилось у Nehalem – представить новую архитектуру, которая оказалась ощутимо быстрее старой, безо всяких оговорок. При этом без излишнего усложнения и удорожания готовой системы, как это было с Bloomfield и его трехканальной памятью с двухчиповым чипсетом.
   Также в этом поколении процессоров Intel окончательно сформировала свой курс на расширение линейки «вширь». Так в каждом семействе были предложены всего 2-3 модели, незначительно отличающиеся по частоте. У Core i5 и Core i7 для старших моделей кроме этого были версии с индексом K – версии с разблокированным множителем. В семействе Celeron была выпущена одноядерная модель для неттопов Celeron G440, которая поставила крест на процессорах Atom в этом сегменте.

LGA 2011

   Начиная с начала 2011-го года, процессоры Sandy Bridge планомерно заняли все сегменты рынка, начиная с топовых Core i7, и дойдя в сентябре до максимально бюджетных Celeron. Но оставался один сегмент рынка, где до сих пор главенствовала уже устаревающая архитектура Nehalem – это платформа для энтузиастов Socket 1366. Несмотря на то, что процессоры Core i7 на архитектуре Sandy Bridge часто не уступали шестиядерным Gulftown или даже превосходили их в скорости, они не могли похвастаться такими возможностями платформы, как полноскоростное подключение двух видеокарт в режиме 16х+16х. Да и максимальный объем оперативной памяти подключенный к трем каналам был выше, чем объем двух каналов на Socket 1155. Кроме того, есть задачи, для которых важным оказывается количество потоков, и 6 старых ядер будут лучше, чем 4 новых.
   Поэтому специальное для энтузиастов, Intel в ноябре 2011-го года, запускает новую платформу LGA 2011. Фактически это адаптация серверных процессоров Xeon, использующих этот-же сокет, и полностью с ним совместимых, для работы в настольных системах. Для адекватной замены Socket 1366 новые процессоры оснащены встроенным контроллером PCI-Express обеспечивающим 40 линий этого интерфейса. Что позволяет подключить две видеокарты на полной скорости, и еще немного линий останется! Из серверного мира пришел четырехканальный контроллер памяти. Но, что удивительно, его скорость оказалась даже немного ниже, чем скорость двухканального контроллера на платформе Socket 1155. Таковы издержки серверного прошлого – контроллер памяти в Xeon заточен не на скорость, а на совместимость с различными модулями памяти и надежность работы. Именно поэтому он не реагирует увеличением скорости на добавление новых каналов – зато можно нарастить доступный объем памяти.
   Количество ядер осталось прежним – новые процессоры, получившие принадлежность к семейству Core i7 по-прежнему шестиядерные. Интересно то, что внутри кристалла, получившего название Sandy Bridge-E и состоящие из 2,27 млрд. транзисторов, содержится 8 процессорных ядер, два из которых отключены. Максимальный объем кэш-памяти третьего уровня составлял 15 Мб. И так-же как на предыдущей платформе для энтузиастов Socket 1366 отсутствует встроенное видеоядро. Что, учитывая целевую аудиторию этих процессов, не существенно.

   В процессорном номере фигурирует цифра 3, хотя процессоры и относятся к второму поколению. По-видимому, так было сделано для того, чтобы у покупателей топовой платформы в 12-м году, когда выйдут процессоры третьего поколения, не было чувства что они покупают за немалые деньги устаревшие процессоры.
   Всего было выпущено четыре процессора на ядре Sandy Bridge-E. Три шестиядерных работающих на частотах 3,2-3,5 ГГц. Две старшие модели обладали полным объемом кэша третьего уровня, у младшей модели с частотой 3,2 ГГц кэш был урезан до 12 Мб. А также одна четырехядерная модель с 10 Мб кэша.

Ivy Bridge

   Если в начале 2011-го года была представлена новая архитектура, значит спустя год пришло время уменьшать техпроцесс. Именно это и сделала Intel в следующем поколении процессоров, названном Ivy Bridge. Фактически это был перевод Sandy Bridge на более тонкий 22 нм. техпроцесс. Параллельно с этим процессор получил некоторые улучшения, о которых мы сейчас и поговорим.
   Более тонкий техпроцесс позволил увеличить количество транзисторов до 1,4 млрд.  и одновременно уменьшить площадь процессорного кристалла, что напрямую влияет на себестоимость готового процессора. Также более чем ощутимо уменьшилось тепловыделение с 95 до 77 ватт у старших моделей. Благодаря этому технология Turbo Boost может работать более агрессивно, повышая частоту сразу на 2 ступени при загрузке всех ядер.
   Но обратной стороной уменьшения площади кристалла стал выросший тепловой поток от ядра к системе охлаждения. Даже несмотря на сниженный уровень энергопотребления, меньшей площади процессорного кристалла тяжелее отводить тепло к системе охлаждения. Поэтому, несмотря на то, что при работе в штатном режиме новые процессоры показывали лучшие показатели, рекордами в разгоне они похвастаться не могли. Банально, было трудно охладить маленький кристалл Ivy Bridge работающий на предельных режимах. Но эта особенность слабо интересовала большую часть покупателей.
   Процессорные ядра новинки практически идентичны Sandy Bridge, но вот контроллер памяти получил возможность работы с более скоростной памятью, а контроллер PCI-Express теперь поддерживает третью версию этой шины. Наибольшие изменения претерпело графическое ядро. Во-первых, оно теперь содержит 16 конвейеров (вместо 12), каждый из которых оборудован двумя блоками текстурирования (ранее было по одному блоку на конвейер). Во-вторых - поддерживает стандарт DirectX 11 и оснащено обновленной версией блока аппаратной обработки видео.
   Процессоры Ivy Bridge не являются представителями новой архитектуры, поэтому и разница в скорости с предшественниками получилась незначительной – в среднем укладываясь в 5%, и была больше обусловлена не оптимизациями исполнительного ядра, а более агрессивной работой Turbo Boost что позволяло даже при полной нагрузке на все ядра работать на частоте на 100 МГц выше чем процессоры Sandy Bridge.
   Так как Ivy Bridge представляет из себя всего лишь уменьшение техпроцесса Sandy Bridge, Intel сохранила между ними полную совместимость. Новые процессоры работают на той-же платформе Socket 1155. Для них конечно было выпущено новое семейство чипсетов, отличающийся в первую очередь поддержкой USB 3.0 и SATA 3, но процессоры Ivy Bridge прекрасно работали и на старых материнских платах, после обновления БИОСа.
   Если несколько лет подряд Intel выпускала новое поколение процессоров в первых числах нового года, то в этот раз решено было сделать паузу. Процессоры Sandy Bridge к тому времени покрывали все сегменты рынка и не имели альтернатив в плане быстродействия. Поэтому чтобы не срывать рождественские продажи старого поколения процессоров, новое было решено выпускать немного позже. Это немного растянулось аж до апреля. Когда были представлены четырехъядерные процессоры на ядре Ivy Bridge QC под торговыми марками Core i7 и Core i5. Характеристики процессоров и поддерживаемые ими возможности не изменились. Также не изменились и частоты процессоров – топовые Core i7 имеют стартовую частоту в 3,5 ГГц, а Core i5 – 3,4 ГГц. В семействе Core i7 осталась одна модель Core i7-3770 работающая на 3,4 ГГц, и ее версия с разблокированным множителем Core i7-3770K имеющая стартовую частоту 3,5, но вместе с тем менее агрессивную работу Turbo Boost, что в реальных условиях уравнивает эти процессоры.
   Семейство Core i5 также ничем не отличалось от предшественников – 4 ядра без поддержки HT, уменьшенный до 6 Мб кэш третьего уровня. Это семейство было представлено более широко и включало процессоры, работавшие на частотах от 3,0 до 3,4 ГГц. Интересно что вместе с анонсом были представлены процессоры с частотами 3,1 ГГц (Core i5-3450), 3,3 ГГц (Core i5-3550) и 3,4 ГГц с разблокированным множителем (Core i5-3570K). А позже были добавлены модели с частотами 3,0 и 3,2, а также модификация лишенная встроенного видеоядра.
   Первые представители на двухъядерном дизайне Ivy Bridge DCCore i3 были выпущены в сентябре 2012-го года. Эти процессоры состояли из 634 млн. транзисторов, и кроме уменьшенного размера кэша третьего уровня до 3 Мб, двухъядерный дизайн Ivy Bridge лишился и поддержки третьего поколения PCI-Express, что, впрочем, не очень актуально для процессоров ориентированных на средний и бюджетный сегменты рынка – никто не будет ставить ему в компаньоны топовую видеокарту. Первыми были выпущены модели с частотами 3,3 (Core i3-3225) и 3,4 (Core i3-3240) ГГц. Кроме частот, эти процессоры также отличались конфигурацией встроенного видеоядра – процессоры с процессорным номером заканчивающимся на 5 – обладали полноценным видеоядром с 16-ю конвейерами, а с номерами заканчивающимися на 0 – его урезанной версией оснащённой всего 6-ю конвейерами. Остальные параметры процессоров не отличались от предшественников – 2 ядра благодаря технологии Hyper-Threading обрабатывали 4 потока и виделись операционной системой как четырехъядерный процессор. Также процессоры семейства Core i3 были лишены поддержки технологии Turbo Boost и возможности увеличить множитель на 4 позиции.
   Осенью 2012-го года Intel выпускает процессоры Pentium на архитектуре Ivy Bridge. Они повторяли своих предшественников – два ядра без поддержки технологии HT, 3 Мб кэш-памяти третьего уровня, отсутствие Turbo Boost и видеоядро с 6-ю конвейерами. В наименовании появились четырехзначные процессорные номера. Первым был выпущен процессор Pentium G2120 работающий на частоте 3,1 ГГц. Позже, в 2013-м году модельная линейка была расширена моделями с частотами от 2,8 ГГц (Pentium G2010) до 3,3 ГГц (Pentium G2140).
   Семейство Celeron перешло на новую архитектуру уже в январе 2013-го года, с выпуском двух моделей Celeron G1610 и Celeron G1620 работающих на частотах 2,6 и 2,7 ГГц. Эти процессоры оснащались 2 Мб кэша третьего уровня и видеоядром с 6-ю конвейерами. Больше никаких функций им не было положено. Старшая модель в семействе Celeron G1630 работала на частоте 2,8 ГГц и была выпущена в сентябре 2013-го года.
   Платформа для энтузиастов LGA 2011 осуществила переход на архитектуру Ivy Bridge позже всех – в сентябре 2013-го года, когда на рынке уже была представлена следующая архитектура процессоров Intel – Haswell. Процессоры, ядро которых получило название Ivy Bridge-E состояли из 1,86 млрд. транзисторов и функционально были идентичны своим предшественникам, отличаясь только незначительными улучшениями исполнительного ядра Ivy Bridge. Всего были выпущены три модели, получившие, по традиции, номера - указывающие на их принадлежность к четвертому поколению, чего на самом деле не было. Старшая Core i7-4960X обладала шестью ядрами, 15 Мб кэша третьего уровня, и работала на базовой частоте 3,6 ГГц. Средняя Core i7-4930K при наличии тех-же шести ядер имела кэш в 12 Мб. А младшая Core i7-4820K, кроме того что была четырехъядерным процессором, еще и потеряла 2 Мб кэша сохранив его объём на уровне в 10 Мб.

Haswell

   Если процессоры Ivy Bridge были шагом «тик» в стратегии развития Intel, то спустя год пришло время для обновления архитектуры – следующего шага «так». Этим шагом стало представление новой процессорной архитектуры, названной Haswell.

   Новые процессоры по своей компоновке повторяли процессоры поколения Sandy Bridge/Ivy Bridge – четыре ядра, общий кэш третьего уровня объемом 8 Мб, встроенное видеоядро, интегрированный двухканальный контроллер памяти DDR3 и 16 линий интерфейса PCI-Express для подключения видеокарт. И во многие эти составляющие процессорного ядра были внесены изменения. Но перед тем как рассказать об этих изменениях, я кратко расскажу о тех целях, которые преследовала Intel разрабатывая новую архитектуру. И да, среди этих целей не было кардинального увеличения процессорной мощности…
   В 2013-м году уже было понятно, что основные продажи компьютерной техники приходятся на ноутбуки и ультрабуки. Поэтому направления модернизации были выбраны для улучшения характеристик управления энергопотреблением и энергоэффективности. Настольные процессоры в этой архитектуре были побочным продуктом мобильных – если увеличить допуски по максимальной тепловой мощности и энергопотреблению – можно увеличить рабочие частоты и, следовательно, производительность. Насколько хорошо сработал такой подход мы сейчас и посмотрим.
   Рассматривая архитектуру Haswell, начнем с изменений исполнительного ядра. А их было немало! Пожалуй, самое главное нововведение – это добавление двух исполнительных устройств в процессорном конвейере. Это первое столь серьезное расширение с времен Core 2, где было 6 исполнительных устройств. Но так как декодер остался без изменений, и может за такт выдавать от четырех до семи микроопераций, то такое расширение само по себе не дает значительного роста. Но вместе с новыми исполнительными устройствами были в ядре Haswell были увеличены внутренние буферы, очереди команд, буферы механизмов предсказания ветвлений, вдвое увеличена пропускная способность кэшей первого и второго уровней. Все эти нововведения должны благотворно сказаться как на производительности исполнительного ядра, так и на работе технологии Hyper-Threading, позволяющей одному ядру выполнять два потока вычислений.
   Кроме «расширения» функциональных элементов процессорного ядра, также были добавлены новые наборы команд. Уже знакомая по Sandy Bridge AVX (Advanced Vector Extensions) была расширена до версии AVX2. Был добавлен новый набор команд FMA (Fused Multiply-Add) – позволяющий выполнять операции умножения и сложения над числами с плавающей запятой с разрядностью 128 или 256 бит. По заявлениям разработчиков, использование этого набора инструкций должно поднять производительность кода до 30%.
   Для ускорения многопоточного доступа к памяти предназначено расширение TSX (Transactional Synchronization Extensions) – транзакционная память. Это аппаратная реализация контроля целостности данным в памяти при работе в многопоточном режиме. Ранее этот контроль выполняла операционная система программно, что снижало производительность. Также были ускорены наборы команд, использующиеся для виртуализации, что должно ускорить серверные варианты Haswell, но будет практически бесполезно для остальных пользователей. На этом изменения исполнительного ядра закончились.
   Одним из главных нововведений платформы Haswell стал регулятор напряжения, перенесенный с материнской платы в кристалл процессора. Ранее, в процессорах Sandy Bridge на процессор требовалось подавать несколько напряжений – для работы процессорных ядер, графического ядра и системного агента. Теперь-же процессор требует подачу одного напряжения 1,8 В, а дальше сам формирует различные напряжения для разных блоков. Такое решение позволяет намного более гибко управлять энергопотреблением процессора, но с другой стороны потребует обязательную смену сокета и материнской платы. Так вместе с Haswell была представлена платформа Socket 1150.
   В плане энергопотребления были внесены некоторые изменения. Так минимальная частота процессоров Haswell была уменьшена в два раза в сравнении с Sandy Bridge и составляет 800 МГц. Был ускорен переход из сна в рабочий режим, и добавлено новое состояние процессора, когда почти все модули процессора выключены, но изображение на экране остается активным.
Еще у Haswell кэш третьего уровня снова стал «отвязан» от блока процессорных ядер. Но на этот раз не для работы на более низкой частоте, а скорее наоборот. В Sandy Bridge, где кэш является частью ядер и синхронизирован с ним по частоте, при уменьшении частоты процессорными ядрами, уменьшается частота и кэша третьего уровня. Что может негативно влиять на производительность графического ускорителя, также использующего общий кэш. Поэтому в новых процессорах кэш третьего уровня может работать на более высокой частоте, чем процессорные ядра, обслуживая запросы в память графического ускорителя.
   Наиболее заметные изменения затронули как раз графическое ядро. Вообще графическое ядро – это именно та часть Haswell, которая будет сильнее всего меняться при позиционировании процессоров для различных сегментов рынка. Так количество графических конвейеров может достигать 40 штук (в процессорах для десктопа до 20), частота - до 1300 МГц. И что самое интересное – в максимально производительном варианте, под процессорной крышкой содержится 128 Мб кэш-памяти четвертого уровня eDRAM (Embedded DRAM), предназначенной в первую очередь, для ускорения видеоядра. Но его также могут использовать процессорные ядра. Концепция большого кэша четвертого уровня получила название Crystalwell. К сожалению такие процессоры поставлялись только в конструктиве BGA, то есть предназначенные для распайки на плату в ноутбуках и ультрабуках, и на рынке десктопных процессоров моделей Crystalwell представлено не было.
   Процессоры Haswell, практически повторяя своих предшественников конфигурацией процессорных ядер, количеством исполняемых потоков, размерами кэш-памяти и работая на одинаковых частотах, несмотря на все архитектурные улучшения, показывали прирост производительности всего до 10%. Также, архитектурные изменения нацеленные на энергоэффективные процессоры и хорошо показавшие себя в сегменте ноутбуков, не очень хорошо работали при увеличении теплового пакета до величин десктопных процессоров. Так тепловой пакет старших моделей вырос с 77 Вт у Ivy Bridge до значения в 84 Вт. При этом сильнее проявились проблемы с отводом тепла от кристалла.
   Для любителей немного повысить производительность с помощью легкого разгона новые процессоры тоже не очень хорошо подходят – в довершение к повышенному тепловому пакету и трудностями с охлаждением, Intel заблокировала возможность добавить к множителю 4 единицы – разгон остался уделом только процессоров с разблокированным множителем.
А еще были обновлены логотипы процессорных семейств – они опять стали вертикальной ориентации, и с изображения пропал весь объём.

   В первых числах июня 2013-го года было представлено четвертое поколение процессоров Intel Core, семействами Core i7 и Core i5, работающими на архитектуре Haswell. Четырехъядерные процессоры состояли из 1,4 млрд. транзисторов, и выпускались с использованием 22 нм. техпроцесса, уже привычного по Ivy Bridge.
   Семейство Core i7 по своим характеристикам повторяли своих предшественников – 4 ядра, 8 потоков, 8 Мб кэш-памяти третьего уровня. Рабочие частоты тоже не изменились. Даже названия повторяли процессорные номера третьего поколения процессоров. Так модель с частотой 3,4 ГГц называется Core i7-4770 (аналогичная модель третьего поколения носит название Core i7-3770). Топовая модель с разблокированным множителем носит процессорный номер Core i7-4770K и работает на стартовой частоте 3,5 ГГц, имея в максимуме все те-же 3,9 ГГц. Также был представлен целый ряд процессоров с пониженным тепловым пакетом, с частотами, стартующих с 2 ГГц.
   Процессоры Core i5 также были представлены на старте платформы. И тоже не предлагали ничего нового – 4 ядра и 4 потока, 6 Мб кэша третьего уровня. Семейство процессоров Core i5 нацелено на более широкую рыночную нишу, чем топовые Core i7, поэтому и ассортимент моделей тут был пошире – стартуя с модели Core i5-4430 имеющей базовую частоту 3,0 ГГц (с возможностью повышения до 3,2 ГГц) и заканчивая Core i5-4670 работающим на 3,4 ГГц (до 3,9 ГГц в режиме Turbo Boost). У старшей модели была версия с разблокированным множителем Core i5-4670K.
   Гораздо интереснее стали модели среднего уровня Core i3, которые появились в сентябре 2013-го года. Во-первых - они получили полноценное графическое ядро, как у старших семейств четырехъядерных процессоров. А во-вторых - размер кэш-памяти третьего уровня вырос до 4 Мб. Также процессоры семейства Core i3 получили поддержку всех последних наборов команд и инструкций. Еще, в сравнении с предшественниками, на 100 МГц выросла частота старшей модели – теперь самые быстрые Core i3 работают на частоте в 3,6 ГГц.  Но поддержку технологии Turbo Boost новые процессоры все-же не получили.
   В семействе Core i3 четвертого поколения было две линейки процессоров: Core i3-43xx имеющие 4 Мб кэша, и Core i3-41xx с кэшем в 3 Мб. Частоты на которых работают процессоры – от 3,4 до 3,6 ГГц.
   Бюджетный сегмент рынка традиционно представляют семейства Pentium и Celeron. Первыми на новой архитектуре были представлены процессоры семейства Pentium. В сентябре 2013-го года были выпущены три процессора с частотами от 3,0 (модель Pentium G3220) до 3,3 ГГц (Pentium G3430). Как и процессоры Pentium второго поколения Core, новинки обладают двухъядерным дизайном и кэшем третьего уровня размером 3 Мб. Также, традиционно, процессоры Pentium не поддерживают технологии Hyper-Threading и Turbo Boost. Графическое ядро было вдвое урезано относительно полноценных процессоров семейств Core i и содержит 10 графических конвейеров.
   Процессоры Celeron на новом ядре традиционно были выпущены последними – в начале 2014-го года. Самые простые процессоры кроме еще больше урезанного кэша, до 2 Мб, получили также значительное отставание в частотах, которые составили 2,7-2,8 ГГц.

Haswell Refresh

   Спустя год после выпуска Haswell, в 2014-м году, согласно стратегии Intel по выпуску новых продуктов «тик-так», ожидались процессоры выпущенные с применением 14 нм. техпроцесса, и известные под кодовым именем Broadwell. Но спустя почти 10 лет с момента перехода Intel на пошаговое совершенствование своих продуктов, поочередной сменой техпроцесса и архитектуры, случился сбой в освоении нового техпроцесса. Справедливости ради следует сказать, что у Intel получилось вовремя освоить новый техпроцесс и выпустить в 2014-м году продукты на новых чипах. Но вот на десктопный рынок они не попали – в связи с сложностями в освоении нового техпроцесса, новых процессоров для всех не хватало, кроме этого новые чипы имели проблемы с покорением высоких частот, поэтому Intel использует их только в сегменте мобильных низковольтных энергоэффективных процессоров. А для рынка десктопных систем объявляет «новое» семейство процессоров в рамках существующей архитектуры Haswell названное - Haswell Refresh. 11 мая 2014-го года были анонсированы сразу 25 процессоров для всех сегментов рынка десктопных процессоров. Одновременно выходит россыпь процессоров от бюджетных Celeron до топовых Core i7, единственным отличием которых от уже существующих моделей были частоты на 100 МГц выше, при сохранении прежней цены.
   Таким образом базовая частота старшей модели семейства Core i7 составила 3,6 ГГц, что при загрузке двух ядер позволило «дотянуться» до заветной цифры в 4 ГГц, а старший процессор из Core i5 теперь работает на базовой частоте в 3,5 ГГц. Но главное было не это, а тот факт, что при прежней цене новые процессоры были хоть немного, но быстрее.
   Также вместе с анонсом процессоров, было представлено новое поколение чипсетов, ключевой особенностью которых была поддержка твердотельных накопителей с подключением к интерфейсу PCI-Express. И конечно заявленная полная совместимость с будущими процессорами Broadwell.

Devil’s Canyon

   Во время обновления процессоров названного Haswell Refresh, фирма Intel представила множество процессоров для всех сегментов рынка. Кроме моделей с разблокированным множителем.
   Но это не значит, что в Intel про них забыли. Спустя месяц, в начале июня 2014-го года анонсируется новая линейка процессоров Haswell названная Devil’s Canyon. Эти процессоры были продолжателями моделей с разблокированным множителем и представляли из себя Haswell Refresh для оверклокеров. Но кроме подросших базовых частот новые процессоры обладали и другими отличиями, позволившими Intel вынести их в отдельную линейку.
   Во-первых, это впечатляющая базовая частота старшей модели Core i7-4790K составляющая 4,0 ГГц и поднимающаяся до 4,4 при нагрузке на два ядра. При этом тепловой пакет вырос очень незначительно – с 84 до 88 Вт. Во-вторых – это изменение системы питания процессора. Для улучшения стабильности питающих напряжений были добавлены новые конденсаторы на нижней части процессора, между контактными площадками. И в-третьих – Intel заменила термопасту внутри процессора и сам материал защитной крышки. Таким образом, при работе в одинаковых условиях новые процессоры греются в среднем на 10 градусов меньше.
   Средняя модель Core i5-4690K не получила столь значительную прибавку в частоте, как старшая Core i7, довольствуясь традиционными 100 Мгц, как у остальных процессоров Haswell Refresh. Зато все остальные особенности Devil’s Canyon были в наличии, так что разгон получался даже более впечатляющим чем у старшей модели, изначально работающей на высоких частотах. 
   Но наиболее интересен третий процессор линейки Devil’s Canyon - Pentium G3258. Ранее разблокированный множитель был уделом только топовых семейств, и даже более высоко стоящие по рангу Core i3 не имели в своем арсенале таких моделей.
   Выпуск процессора семейства Pentium обладающего разблокированным множителем фирма Intel приурочила к 20-летию выхода первого процессора Pentium, что нашло свое отражение на упаковке процессора. Но этот повод немного притянут за уши – ведь как мы помним, первые Пентиумы появились марте 1993-го года. И скорее всего этот шаг был призван подогреть интерес к платформе, и сгладить негатив от перенесенного на более поздний срок анонса Broadwell. Также оверклокерский Pentium имел среднюю частоту (и цену) в линейке своих собратьев, и поддерживал функцию разгона даже на недорогих материнских платах – то есть вернул все то, за что ранее любили разгон не экстремалы-энтузиасты, а обычные пользователи, желающие сэкономить на покупке процессора. Но как младший процессор в линейке, Pentium G3258 оказался лишен улучшенного термоинтерфейса и усиленной подсистемы питания. Что, впрочем, учитывая его параметры не очень и нужно.

LGA 2011-3

   29 августа 2014-го года Intel выпускает три процессора и обновляет платформу для энтузиастов LGA 2011 до версии LGA 2011-3. Как можно понять из описания особенностей питания процессоров Haswell, про которые я рассказывал выше, новая платформа хоть и имеет схожее название с существующей уже три года платформой LGA 2011, электрически и даже механически с ней не совместимая.
   Процессоры сохранили все преимущества и особенности платформы – интегрированный контроллер шины PCI-Express поддерживающий подключение 40 линий (у младшей модели 28 линий, что все равно больше чем 16 в настольной платформе) и четырехканальный контроллер памяти, который теперь работает с памятью DDR4.
   Также среди процессоров, получивших традиционно номера следующего, пятого поколения, появилась восьмиядерная модель Core i7-5960X выполняющая 16 потоков с помощью технологии виртуальной многоядерности Hyper-Threading. Но ценой такого увеличения количества ядер, при сохранении теплового пакета, стало заметное снижение частот. Так восьмиядерный процессор работает на базовой частоте всего в 3,0 ГГц, увеличивая ее до 3,5 ГГц во время загрузки не более двух ядер, и 3,3 ГГц в случае загрузки большего чем два количества ядер при условии непревышения теплового пакета в 140 Вт.
   Остальные два процессора были шестиядерными, и работали на более высоких частотах от 3,3 до 3,5 ГГц (максимум при не полной нагрузке составлял 3,7-3,6 ГГц). Восьмиядерная модель обладала 20 Мб кэша третьего уровня, тогда как шестиядерные имели 15 Мб кэша.
Процессоры для экстремальной платформы выпускались на ядре, получившем название Haswell-E, и состоявшем из 2,6 млрд. транзисторов.
   Следующее обновление платформы LGA 2011-3, которое было представлено аж в мае 2016-го года, получило название Broadwell-E. В основе новых процессоров лежала обновленная, 14 нм. архитектура пятого поколения Broadwell. Но традиционно, процессоры экстремальной платформы имели процессорные номера, показывающие их принадлежность к шестому поколению.
   Действительного нового было немного. Внешне - это немного другая упаковка процессора, с более тонким текстолитом, но более толстой и массивной крышкой. Остальные отличия - это первый десктопный десятиядерный процессор (выполняющий 20 потоков), и обновлённый механизм динамического разгона Turbo Boost Max 3.0. Суть его в том, что на этапе производства отбирается лучшее ядро, и при наличии однопоточной задачи именно это ядро может существенно увеличивать частоту своей работы. Существенно – это, например, на 1 ГГц для старшей десятиядерной модели! Для остальных моделей относительная прибавка меньше, но это все те-же 4,0 ГГц (кроме самой младшей, урезанной шестиядерной Core i7-6800K где эта частота составляет 3,8 ГГц). При этом классический разгон десятиядерного процессора технологией Turbo Boost возможен всего до 3,5 ГГц. Важная особенность новой технологии в том, что она работает в паре с операционной системой, через специальный драйвер. И при наличии однопоточной задачи, ОС отправляет ее на выбранное ядро, увеличивая его частоту до максимального ситуациях работает классический автоматический разгон всего процессора в зависимости от его общей нагрузки.
   Всего было выпущено 4 процессора Broadwell-E, состоящих из 3,4 млрд. транзисторов, в основе которых лежал десятиядерный дизайн. Старший, десятиядерный Core i7-6950X работает на частоте 3,0 ГГц и обладает 25 Мб кэша третьего уровня. Средний, восьмиядерный Core i7-6900K, работает на базовой частоте 3,2 ГГц и размер кэша составляет 20 Мб. Две шестиядерные модели отличаются базовой частотой 3,6 и 3,4 ГГц, а также урезанным до 28 количеством линий PCI-Express у младшей, обладая одинаковым размером кэша в 15 Мб.

Broadwell

   Следующий шаг в совершенствовании процессоров Haswell – это их перевод на более тонкий техпроцесс 14 нм., который по планам Intel должен был произойти в 14-м году. Но трудности, возникшие с освоением нового техпроцесса, не позволили вовремя полноценно выпустить новое поколение процессоров. Процессоры пятого поколения архитектуры Core, известные как Broadwell были выпущены осенью 2014-го года только для рынка мобильных устройств. Когда-же они добрались до десктопов 2 июня 2015-го года, были представлены всего две модели процессоров – по одной в семействах Core i7 и Core i5. Но при этом назвать анонс Broadwell «бумажным» (это когда процессоры анонсируются только на бумаге, в пресс-релизах, фактически не поступая в широкую продажу) или запоздалым будет неправильно – для рынка мобильных устройств был представлен широкий спектр процессоров всех семейств, за исключением бюджетных Pentium и Celeron. Но все они производились в конструктиве BGA для пайки на материнскую плату в фабричных условиях, и не предназначались для десктопных компьютеров.
   Хоть Broadwell и является шагом «Тик» в стратегии развития Intel, подразумевающим перенос существующей архитектуры на более тонкий техпроцесс, новые процессоры, кроме обновленного техпроцесса, получили некоторые архитектурные усовершенствования. Которые, впрочем, весьма незначительны - наподобие увеличения размеров внутренних буферов или небольших ускорений исполнительных устройств. Все эти улучшения в сумме дают прибавку на уровне 5-7%, и напоминают то, что мы видели при переходе от Sandy Bridge к Ivy Bridge.
   Небольшой ложкой дегтя была ограниченная совместимость процессоров Broadwell с платформами для Haswell. Несмотря на то, что новые процессоры использовали все тот-же Socket 1150, их корректная работа гарантировалась только с последним поколением чипсетов, выпущенных с платформой Haswell Refresh.
   Линейка десктопных моделей Broadwell состояла всего из двух процессоров, обладающих разблокированным множителем, как топовые представители своих семейств - Core i7-5775C и Core i5-5675C, где символ C в конце процессорного номера указывал на принадлежность к семейству Crystalwell. Иными словами, эти десктопные процессоры оснащены дополнительным кэшем четвертого уровня объёмом в 128 Мб!
   Кэш такого объема было затруднительно встроить в ядро, поэтому он размещен в виде отдельного кристалла, выполненного кстати по старому 22 нм. техпроцессу, под процессорной крышкой.
Спустя 20 лет после выхода Pentium PRO - новый виток истории. Два кристалла под крышкой, один из которых – выделенный кэш.

   Но на этот раз чуда не произошло. Скорость кэша четвертого уровня была всего лишь в полтора раза выше чем скорость оперативной памяти, и многократно медленнее скорости кэша третьего уровня. Также он работал на частоте всего лишь 1800 МГц, то есть не был полноскоростным.
   Как и процессоры Haswell с дополнительным кэшем Crystalwell, процессоры Broadwell также были оснащены топовым видеоускорителем Iris Pro Graphics, который в новом поколении имеет в своем распоряжении уже 48 графических конвейеров. Именно для ускорения графики и предназначен дополнительный кэш. Вот только мало кто покупает топовый процессор и использует его с встроенным видеоускорителем, интересуясь при этом его производительностью.
Кроме того, для того, чтобы стало возможным увеличить количество графических конвейеров пришлось пожертвовать объемом кэша третьего уровня – для процессора Core i7 его объем составил 6 Мб, а младший брат Core i5 и вовсе довольствовался 4 Мб.
   Ну и не зря процессоры Broadwell дебютировали именно в мобильном сегменте – выстраданный техпроцесс 14 нм., хоть и позволил значительно снизить энергопотребление (оба процессора довольствуются 65-ю Ваттами), но с частотным потенциалом все было намного хуже – так Core i7-5775C работает на частоте 3,3 ГГц (с максимальным увеличением до 3,7 ГГц), а Core i5-5675C и вовсе имеет базовую частоту 3,1 ГГц (повышая ее до 3,6 ГГц). Эти цифры оказались заметно ниже чем частоты на которых работали процессоры Haswell. Особенно сильным было отставание от прошлогоднего флагмана семейства Devil’s Canyon, который работая на базовой частоте в 4,0 ГГц не оставлял новинкам ни малейшего шанса, имея при этом стоимость почти на 30 долларов меньше. И тут Broadwell не могли помочь ни архитектурные улучшения, ни 128 Мб кэша четвёртого уровня.
   Поэтому пятое поколение архитектуры Core не оставило заметного следа среди десктопных процессоров, являясь фактически смелым, но неудачным экспериментом – а что будет если мобильному процессору увеличить нормы энергопотребления и выпустить его на десктоп. Как оказалось – ничего хорошего.
   Также не способствовал популярности этих процессоров и скорый анонс новой архитектуры Skylake, спустя всего пару месяцев после выпуска Broadwell на десктоп. Являясь представителями новой архитектуры, то есть шагом «так» в цепочке развития продуктов Intel, они обладали уже многими изменениями и новыми качествами, являясь более предпочтительной покупкой. Но про них – в следующей части.

Комментариев нет:

Отправить комментарий