Обзор процессора Intel Core i7-920 на ядре Bloomfield Новые двухъядерники AMD - Phenom II X2 550 и Athlon II X2 250 Процессоры Pentium для LGA1155. Повод сэкономить? Обзор процессора AMD Phenom II X3 720 на ядре Deneb Обзор процессора Intel E7200 на ядре Wolfdale
Новости Hardware Software Спецификации Файлы Реклама
Все опросы
Производитель Вашей материнской платы?
  • abit
  • ASRock
  • Albatron
  • Gigabyte
  • Epox
  • Asus
  • Biostar
  • Soltek
  • ECS
  • Palit
  • Не знаю
  • Chaintech
  • MSI
  • DFI
  • Foxconn
Отправить
Реклама
11 февраля 2009

Обзор процессора Intel Core i7-920 на ядре Bloomfield

Автор: Александр Митрофанов
Источник: 3DNews.Ru

Стр.1 - Intel Core i7-920
Стр.2 - Производительность. Выводы

Политика компании Intel в отношении настольных процессоров заключается в ежегодном обновлении продуктовой линейки. Это осуществляется двумя способами - переходом на новый технологический процесс и сменой архитектуры. И то, и другое - весьма затратные операции, и поэтому каждый год Intel выбирает что-то одно. В частности, в прошлом году компания перешла на 45-нм техпроцесс и представила новые продукты на ядрах Yorkfield и Wolfdale. В 2008 году подошла очередь смены архитектуры и Intel представила свою последнюю разработку - Nehalem.

Логотип процессора Core i7

На первый взгляд, перед нами очередная революционная платформа, которая может поднять планку производительности на еще большую высоту. Начнем с главного, а именно с процессоров на ядре Bloomfield, которые отличаются встроенным контроллером памяти. Как мы помним, первые настольные процессоры со встроенным контроллером памяти представила компания AMD, и этот шаг привел к значительному росту производительности. Поэтому мы можем ожидать подобного эффекта и от новейшей разработки Intel. Впрочем, встроенный контроллер памяти - это главная, но не единственная инновация Intel. Архитектура процессора приобрела кардинально новую модульную структуру, которая характеризуется новым вычислительным ядром, новой процессорной шиной, встроенным трехканальным контроллером памяти DDR3, возможностью интеграции графического ядра, новой технологией многопоточности SMT и дополнительным контроллером PCU, который отвечает за управление напряжением и частотой каждого из ядер. Стоит ли говорить, что новая процессорная архитектура потребовала смены процессорного сокета, поэтому новые процессоры имеют упаковку LGA с 1366 контактами.

Сокет LGA 1366 с процессором

Сокет LGA 1366 без процессора

Итак, рассмотрим каждый из вышеперечисленных пунктов более подробно. Во-первых, новое вычислительное ядро основано на высокоэффективной и хорошо себя зарекомендовавшей архитектуре Core. Действительно, процессоры Core 2 Duo и Core 2 Quad демонстрируют прекрасное сочетание высокой производительности, разумного тепловыделения и оптимальной цены. Но у архитектуры Core есть несколько фундаментальных проблем, которые не видны обычному пользователю. Главная из них заключается в сложности масштабирования или, проще говоря, в проблемах, возникающих при увеличении количества ядер в одном процессоре. Изначально архитектура Core разрабатывалась для использования в двухъядерном исполнении. А когда возникла необходимость в 4-ядерных процессорах, единственным возможным решением стало объединение в одном корпусе двух двухъядерных кристаллов. Вот тут-то и проявилась проблема, связанная со взаимодействием ядер между собой. Дело в том, что процессорная шина Quad Pumped Bus уже давно исчерпала свой потенциал и не позволяла обмениваться данными между ядрами напрямую. К тому же, ее пропускная способность не соответствовала требованиям в многоядерных системах. И чем больше количество ядер, тем заметнее становились недостатки QPB. Понятно, что данная ситуация совершенно не устраивала Intel, которая взяла курс на активное увеличение количества ядер. Поэтому на свет появилась новая шина QPI (Quick Path Interconnects) с топологией "точка-точка". Передача данных осуществляется по двум соединениям шириной 20 бит, из которых 16 предназначены для передачи данных. Итоговая пропускная способность равна 25,6 Гб в секунду, что приблизительно равно пропускной способности шины HyperTransport v3.0.

Второе важное изменение в архитектуре процессора касается структуры и размера кэш-памяти. По сравнению с ядром Penryn, размер кэша L1 в Nehalem не изменился. Его объем равен 64 кб, из которых 32 кб отведено под данные, и 32 кб - под инструкции. А что касается кэш-памяти L2, то здесь изменения куда существеннее - вместо одного большого разделяемого кэша инженеры Intel оснастили каждое ядро собственным кэшем L2 объемом 256 кб. Также в Nehalem появилась разделяемая кэш-память третьего уровня объемом 8 Мб (для ядра Bloomfield).

Модульная структура процессора Nehalem

Третье, и наиболее важное изменение касается модульной структуры процессора, которая позволяет инженерам Intel достаточно свободно изменять параметры процессоров, включая в него те или иные блоки. В частности, в процессор может быть интегрировано графическое ядро и контроллер памяти. Но если встроенную графику мы увидим только в 2009 году, то контроллер памяти есть уже в процессорах Bloomfield. Данный контроллер оптимизирован для работы с памятью DDR3 и поддерживает одно-, двух- и трехканальный режим доступа. В частности, при использовании 3-канального доступа пропускная способность памяти DDR3-1066 равна 25,6 Гб/с, что соответствует пропускной способности шины QPI. Следовательно, для платформы Socket LGA 1366 более скоростная память пока не нужна.

Также отметим, что на материнских платах с чипсетом X58 будет минимум три слота DIMM для DDR3, а стандартное количество слотов будет равно шести:

6 слотов DDR3 на материнской плате ASUS P6T Deluxe

Помимо перечисленных особенностей архитектуры Nehalem, стоит упомянуть о незначительных модификациях самого вычислительного ядра. Инженеры Intel взяли за основу ядро Core и изменили некоторые из функциональных блоков, таких как декодеры простых (3) и сложных (1) команд, улучшили технологию Macrofusion (x32/x64) (исполнение нескольких команд (до пяти) как единую инструкцию), оптимизировали блок оптимизации циклов (Loop Stream Detector), улучшили блок предсказания переходов (Stack Buffer), увеличили объем буферов (Reorder Buffer / Reservation Station), предназначенных для технологии многопоточности SMT. Кстати, на последней технологии стоит остановиться и рассмотреть ее подробнее.

Во время использования архитектуры Netburst, инженеры Intel усиленно работали над оптимизацией загрузки и исполнения команд в довольно длинных конвейерах (отличительная особенность данной архитектуры). Одним из технических решений этой проблемы стала технология HyperThreading, позволяющая одновременно исполнять два потока команд одним процессорным ядром. В результате, пользователь видел в своей системе удвоенное количество процессоров, и данная технология давала некоторый прирост производительности в оптимизированных приложениях. Напротив, в неоптимизированных программах (например, в играх) пользователь сталкивался с ситуацией, когда система с включенной HyperThreading работала несколько медленнее. В новой архитектуре Nehalem инженеры Intel попытались ликвидировать все слабые места HyperThreading, и конечный результат получил название Simultaneous MultiThreading (или SMT). Одной из особенностей данной технологии является разделение ядер на реальные и виртуальные, что позволяет более эффективно их использовать (с точки зрения разработчика ПО).

Хронология загрузки четырех-ядерного процессора Core i7-920 с технологией SMT

Пара слов о физических параметрах нового ядра Nehalem. Первые процессоры Core i7 имеют площадь ядра 263 кв. мм, а само ядро состоит из 731 млн транзисторов. При этом, типичный уровень тепловыделения остается в рамках спецификаций Intel и составляет 130 Вт. Этот показатель можно считать вполне приемлемым, учитывая возросшую сложность ядра. Кстати, не последнюю роль в энергосбережении играет специальный блок PCU (Power Control Unit), который отвечает за текущую частоту и напряжение каждого из ядер, в зависимости от нагрузки. Более того, блок PCU способен полностью отключать неактивные ядра.

Интересно, что блок PCU довольно тесно связан с технологией Turbo Boost, которая также управляет частотами ядра, но она ориентирована на повышение частоты. Изменение частоты осуществляется путем изменения множителя, и, следовательно, множитель должен быть разблокирован в сторону увеличения. Инженеры Intel так и сделали, но с небольшой оговоркой: множитель может быть увеличен только на единицу от штатного. На практике это выглядит следующим образом:

Теперь подведем промежуточные итоги, и сравним параметры ядер Bloomfield и Yorkfield.

ЯдроBloomfieldYorkfield
Техпроцесс45 нм45 нм
Число ядер/кристалов4/14/2
Поддержка многопоточностиSMT-
Встроенный контроллер памяти3-канальный DDR3-
Кэш L164 кб (32+32)64 кб (32+32)
Кэш L24х 256 кб2х 6 Мб
Кэш L38 Мб-
Тип/Частота шиныQPI / 133 МГцQPB / 266, 333, 400 МГц
Пакет TDP130 Вт130 Вт
УпаковкаLGA 1366LGA 775
Поддержка SSESSE 4.1, SSE 4.2SSE 4.1
Площадь ядра (кв. мм)2632x 107
Количество транзисторов (млн)7312x 410
Управление питанием/частотойSpeed Step; PCU + TurboSpeed Step

Итак, с архитектурой Nehalem мы уже разобрались. Теперь рассмотрим ассортимент первых процессоров на ядре Bloomfield:

Наименование Core i7 965 Extreme Edition Core i7 940 Core i7 920
Количество ядер444
Поддержка SMT+++
Частота3,20 ГГц2,93 ГГц2,66 ГГц
Множитель242220
Шина (QPI)6,4 GT/s4,8 GT/s4,8 GT/s
Поддержка памятиDDR3-800/1066/1333/1600DDR3-800/1066DDR3-800/1066
Тепловой пакет (TDP, Ватт)130130130
Рекомендуемая цена, $999562284

В нашем распоряжении оказался самый слабый процессор новой линейки - Core i7 920. Из-за увеличенного количества контактов, его размеры несколько превышают размеры процессоров LGA775:

Сравнение процессоров LGA 1366 (слева) и LGA 775 (справа) - вид сверху

Сравнение процессоров LGA 1366 (слева) и LGA 775 (справа) - вид снизу

Утилита CPU-Z предоставляет следующую информацию:

Показания утилиты CPU-Z для процессора Intel Core i7 920

Стр.1 - Intel Core i7-920
Стр.2 - Производительность. Выводы

Автор: Александр Митрофанов
Источник: 3DNews.Ru
- 17328
- 14
Реклама
Скриншоты
Яндекс цитирования Рейтинг@Mail.ru