Технические характеристики процессоров
Изучение истории появления, назначения и основных составляющих процессоров - вычислительных устройств, состоящих из транзисторов. Анализ современной микропроцессорной технологии фирмы Intel. Развитие семейства K-6. Советы по выбору процессора Intel и AMD.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 21.11.2010 |
Размер файла | 2,3 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Два кристалла в одном корпусе.
Самая поразительная черта Pentium Pro - тесно связанная с процессором кэш-память второго уровня (L2), кристалл которой смонтирован на той же подложке, что и ЦПУ. Именно так, Pentium Pro это два чипа в одном корпусе. Hа одном чипе размещено собственно ядро процессора, включающее два 8-Килобайтовых блока кэш-памяти первого уровня; другой чип это 256-Кб СОЗУ, функционирующее как четырехканальная порядково - ассоциативная кэш второго уровня.
Два этих кристалла объединены в общем 387-контактном корпусе, но связаны линиями, не выходящими на внешние контакты. Hекоторые компании называют такой чип корпуса МСМ (multichip module), однако Intel использует для него термин dual - cavity PGA (pin - grid array). Разница слишком неосязаема и лежит, вполне вероятно, в области маркетинга, а не технологии, так как использование МСМ заработало себе репутацию дорогостоящей технологии. Но, сравнивая цены на процессоры Pentium и Pentium Pro, можно утверждать, что новая терминология исправит положение дел, так как P6 претендует на статус массового процессора. Впервые в истории промышленности многокристальный модуль станет крупносерийным изделием.
Степень интеграции нового процессора также поражает: он содержит 5.5 млн. транзисторов, да еще 15.5 млн. входит в состав кристалла кэш-памяти. Для сравнения, последняя версия процессора Pentium состоит из 3.3 млн. транзисторов. Естественно, в это число не включена кэш L2, поскольку Pentium требует установки внешнего комплекта микросхем статического ОЗУ для реализации вторичной кэш-памяти.
Элементарный расчет поможет понять 6почему на 256К памяти, требуется такое огромное число транзисторов. Это статическое ОЗУ, которое в отличие от динамического, имеющего всего один транзистор на бит хранения и периодически регенерируемого, использует для хранения бита ячейку из шести транзисторов:
256 x 1024 х 8 бит х 6 пр - ров = 12.5 млн. транзисторов. С учетом буферов и обвязки накопителя как раз и выйдет 15.5 миллионов.
Площадь процессорного кристалла равна 306 кв. мм. (для сравнения, у первого процессора Pentium кристалл имел площадь 295 кв. мм). Кристалл статической памяти, как всякая регулярная структура, упакован намного плотнее - 202 кв. мм. Только Pentium Pro 150 MHz изготавливается по 0.6-микронной технологии. Все остальные версии нового процессора изготавливаются по 0.35-микронной BiCMOS-технологии с четырехслойной металлизацией.
Почему компания Intel пошла на двухкристалльный корпус, объединив ядро ЦПУ с вторичным КЭШем? Во - первых комбинированный корпус значительно упростил изготовителям ПК разработку высокопроизводительных систем на процессоре Pentium Pro.
Одна из главных проблем при проектировании компьютера на быстром процессоре связана с точным согласованием с процессором вторичного КЭШа по его размеру и конфигурации. Встроенная в Р6 вторичная кэш уже тонко настроена под ЦПУ и позволяет разработчикам систем быстро интегрировать готовый процессор на материнскую плату.
Во-вторых, вторичная кэш тесно связана с ядром ЦПУ с помощью выделенной шины шириной 64 бита, работающей на одинаковой с ним частоте. Если ядро синхронизируется частотой 150 МГц, то кэш должна работать на частоте 150 МГц.
Поскольку в процессоре Pentium Pro есть выделенная шина для вторичного КЭШа, это решает сразу две проблемы: обеспечивается синхронная работа двух устройств на полной скорости и отсутствие конкуренции за шину с прочими операциями ввода-вывода. Отдельная шина L2, "задняя" шина полностью отделена от наружной, "передней" шины ввода-вывода, вот почему в P6 вторичная кэш не мешает своими циклами операциям с ОЗУ и периферией. Передняя 64-битовая шина может работать с частотой, равной половине, трети или четверти скорости ядра Pentium Pro. "Задняя" шина продолжает работать независимо, на полной скорости.
Такая реализация представляет серьезный шаг вперед по сравнению с организацией шины процессора pentium и других процессоров х86. Только NexGen приближенно напоминает такую схему. Хотя в процессоре Nx586 нет КЭШа L2, зато встроен ее контроллер и полноскоростная шина для связи с внешней кэш-памятью. Подобно Р6, процессор Nx586 общается с основной памятью и периферийными подсистемами поверх отдельной шины ввода-вывода, работающей на деленной частоте.
В экзотическом процессором Alpha 21164 компания Digital пошла еще дальше, интегрировав прямо на кристалле в дополнение к первичной кэш-памяти еще и 96 Кбайт вторичной. За счет вздувания площади кристалла достигнута беспрецедентная производительность кэширования. Транзисторный бюджет Альфы составляет 9.3 миллиона транзисторов, большая часть которого образована массивом памяти.
Есть одна незадача: необычный дизайн Pentium Pro, пожалуй, затруднит экспертам задачку вычисления соотношения цены и производительности. Интегрированная в процессор кэш вроде как скрыта с глаз. Pentium Pro сможет показаться более дорогим, чем его конкуренты, но для создания компьютера на других процессорах потребуется внешний набор микросхем памяти и кэш-контроллер. Эффективный дизайн кэш-структуры означает, что другим процессорам, претендующим на сопоставимую производительность, потребуется кэш-памяти больше, чем 256 Кбайт.
Уникальный корпус предоставляет свободу созданию новых вариантов процессора. В будущем возможно как повышение объема кэш-памяти, так и ее отделение ее от процессора в соответствии с традиционным подходом. Если последний вариант появится, он окажется, несовместим по внешним выводам с двухкристалльным базовым корпусом, так как ему необходимо добавить 72 дополнительных вывода (64-для "задней" шины и 8 для контроля ошибок). Hо он будет почти таким же быстрым, если будет широко доступна статическая память с пакетным режимом. По мнению инженеров Intel, подключение внешних микросхем памяти к "передней" шине Pentium Pro с целью реализации кэш-памяти третьего уровня, вряд ли оправдано. Отправной точкой для такой убежденности служат результаты натурного моделирования прототипа системы, которая в следствии высокой эффективности интерфейса кэш L2-процессор, практически до теоретического предела загружает вычислительные ресурсы ядра. Процессор Alpha 21164, напротив, спроектирован с учетом необходимости кэш L3.
Значения тестов для некоторых чипов фирмы Intel.
Processor Benchmarks |
Intel Pentium Pro Processor (200MHz) |
Intel Pentium Pro Processor (180MHz) |
Intel Pentium Pro Processor (166MHz) w/512K L2 |
Intel Pentium Pro Processor (150MHz) |
Intel Pentium Processor (133MHz) |
|
UNIX |
||||||
SPEC95 SPECint95 SPECint_base95 SPECfp95 SPECfp_base95 |
8.09 8.09 6.75 5.99 |
7.29 7.29 6.08 5.40 |
7.11 7.11 6.21 5.47 |
6.08 6.08 5.42 4.76 |
4.14 4.14 3.12 2.48 |
|
SPEC92 SPECint92 SPECint_base92 SPECfp92 SPECfp_base92 |
366.0 336.7 283.2 234.3 |
327.4 3.5.8 254.6 210.4 |
327.1 306.6 261.3 209.6 |
276.3 258.3 220.0 182.0 |
190.9 175.9 120.6 107.3 |
|
Windows |
||||||
Norton System Index SI32 |
86.7 |
77.6 |
Not tested |
67.0 |
34.2 |
|
Ziff-Davis CPUmark32 |
541 |
466 |
Not tested |
412 |
278 |
3.11 Intel® Pentium® 4 с технологией Hyper-Threading, Intel® Pentium® 4, Intel® Pentium® III Processor , Intel® Pentium® II-в сравнительной характеристике
Процессор Intel® Pentium® 4 с технологией Hyper-Threading |
Процессор Intel® Pentium® 4 |
Intel® Pentium® III Processor |
Процессор Intel® Pentium® II (Процессор снят с производства и используется только для сравнения.) |
|
Представленный 14 ноября 2002 года, процессор Intel® Pentium® 4 с технологией HT обеспечивает производительность и скорость отклика системы, необходимые для самых требовательных современных приложений, а также запас производительности для будущих новинок. Технология Hyper-Threading является выдающимся достижением, поднимающим процессор Pentium® 4 на новый уровень. |
Представленный в конце 2000 года, процессор Pentium® 4 стал наиболее популярным процессором для современных ПК. Разработанный для пользователей передовых игровых программ, цифровой музыки, видео и фото, процессор Pentium® 4 является основой Вашего цифрового мира. |
Представленный в начале 1999 года, процессор Pentium® III, был создан для использования преимуществ Интернета. Хотя производительность процессора Pentium® III достаточно высока, ее не хватает для приложений с интенсивным использованием мультимедийных средств, передовых игровых программ и одновременной работы с несколькими задачами. |
Представленный в середине 1997 года, процессор Pentium® II открыл эру использования мультимедиа в ПК и хорошо показал себя при работе с простой графикой, аудиодисками CD и двумерными играми. С тех пор произошло развитие этих приложений, и новые ПК, основанные на передовых технологиях, позволят Вам получить больше удовольствия от работы и сэкономить время при создании цифровой музыки или редактировании фотографий. |
|
Частота ядра |
Частота ядра |
Частота ядра |
Частота ядра |
|
3,20 ГГц (0.13 микрон) с частотой шины 800 МГц 3.06 ГГц (0.13 микрон) с частотой шины 533 МГц |
До 3.06 ГГц (0.13 микрон) |
До 1.40 ГГц (0.13 микрон) |
До 450 МГц |
|
Технология Hyper-Threading† |
Технология Hyper-Threading† |
Технология Hyper-Threading† |
Технология Hyper-Threading† |
|
Технология Hyper-Threading обеспечивает более эффективную работу Вашего ПК - она позволяет максимально полно использовать ресурсы процессора благодаря возможности одновременного выполнения одним процессором двух потоков программы |
нет |
нет |
нет |
|
Системная шина |
Системная шина |
Системная шина |
Системная шина |
|
800 МГц (при такотовой частоте процессора 3,20 ГГц) 533 МГц (при такотовой частоте процессора 3.06 ГГц) |
До 533МГц |
До 133МГц |
До 100 МГц |
|
Кэш-память |
Кэш-память |
Кэш-память |
Кэш-память |
|
Кэш-память второго уровня с улучшенной передачей данных 512 KБ |
Кэш-память второго уровня с улучшенной передачей данных 512 KБ (0,13 микрон). Кэш-память с улучшенной передачей данных 256 KБ (0,18 микрон) |
Унифицированная неблокируемая кэш-память второго уровня объемом 512 КБ либо интегрированная кэш-память с улучшенной передачей данных объемом 256 КБ |
Встроенная кэш-память второго уровня объемом 512 Кб работающая на половинной частоте процессора |
|
Системная плата |
Системная плата |
Системная плата |
Системная плата |
|
Системные платы Intel®, совместимые с процессором Pentium® |
Системные платы Intel®, совместимые с процессором Pentium® 4 |
Системные платы Intel®, совместимые с процессором Pentium® III |
Системные платы Intel®, |
|
Оперативная память |
Оперативная память |
Оперативная память |
Оперативная память |
|
Двухканальная память DDR 400/333 Двухканальная RDRAM PC 1066/800 DDR 333/266/200 SDRAM |
Двухканальная память DDR 400/333 Двухканальная RDRAM 1066/800 |
DDR 333/266/200 RDRAM PC800/700/600 |
SDRAM PC133/100/66 SDRAM, PC100/66 |
|
Микроархитектура |
Микроархитектура |
Микроархитектура |
Микроархитектура |
|
Технология Intel® Netburst™ |
Технология Intel® Netburst™ |
Архитектура динамического исполнения P6 |
Архитектура динамического исполнения P6 |
|
Набор микросхем |
Набор микросхем |
Набор микросхем |
Набор микросхем |
|
совместимые с процессором Pentium® 4 |
совместимые с процессором Pentium® 4 |
для разных платформ |
для разных платформ |
|
Технология изготовления |
Технология изготовления |
Технология изготовления |
Технология изготовления |
|
0.13 микрон |
До 0.13 микрон |
До 0.13 микрон |
0.25 микрон |
Для реализации технологии Hyper-Threading необходима вычислительная система на базе процессора Intel® Pentium® 4 с поддержкой технологии HT, набора микросхем, BIOS и операционной системы, поддерживающих эту технологию. Реальные значения производительности могут изменяться в зависимости от конфигурации и настроек аппаратных средств и программного обеспечения.
3.12 Hyper-Threading: зачем она нужна
Попробуем понять, что же такое нам предлагает Intel и как к этому следует относиться. Эта компания, если внимательно посмотреть, никогда не отличалась абсолютным совершенством своих продуктов, более того -- вариации на те же темы от других производителей подчас получались гораздо более интересными и концептуально стройными. Однако, как оказалось, абсолютно все делать совершенным и не нужно -- главное чтобы чип олицетворял собой какую-то идею, и идея эта приходилась очень вовремя и к месту. И еще -- чтобы ее просто не было у других.
Так было с Pentium, когда Intel противопоставила весьма шустрому в «целочисленке» AMD Am5x86 мощный FPU. Так было с Pentium II, который получил толстую шину и быстрый кэш второго уровня, благодаря чему за ним так и не смогли угнаться все процессоры Socket 7. Так было (ну, по крайней мере, я считаю это свершившимся фактом) и с Pentium 4, который противопоставил всем остальным наличие поддержки SSE2 и быстрый рост частоты -- и тоже де-факто выиграл. Сейчас Intel предлагает нам Hyper-Threading. И мы отнюдь не призываем в священной истерике биться лбом о стенку и кричать «господи помилуй», «аллах велик» или «Intel rulez forever». Нет, мы просто предлагаем задуматься -- почему производитель, известный грамотностью своих инженеров (ни слова про маркетологов! :)) и громадными суммами, которые он тратит на исследования, предлагает нам эту технологию.
Объявить Hyper-Threading «очередной маркетинговой штучкой», конечно, проще простого. Однако не стоит забывать, что это технология, она требует исследований, денег на разработку, времени, сил… Не проще ли было нанять за меньшую сумму еще одну сотню PR-менеджеров или сделать еще десяток красивых рекламных роликов? Видимо, не проще. А значит, «что-то в этом есть». Вот мы сейчас и попытаемся понять даже не то, что получилось в результате, а то, чем руководствовались разработчики IAG (Intel Architecture Group), когда принимали решение (а такое решение наверняка принималось!) -- разрабатывать «эту интересную мысль» дальше, или отложить в сундук для идей забавных, но бесполезных.
Как ни странно, для того чтобы понять как функционирует Hyper-Threading, вполне достаточно понимать как работает… любая многозадачная операционная система. И действительно -- ну ведь исполняет же каким-то образом один процессор сразу десятки задач? Этот «секрет» всем уже давно известен -- на самом деле одновременно все равно выполняется только одна (на однопроцессорной системе), просто переключение между кусками кода разных задач выполняется настолько быстро, что создается иллюзия одновременной работы большого количества приложений.
По сути, Hyper-Threading предлагает нам то же самое, но реализована аппаратно, внутри самого CPU. Есть некоторое количество различных исполняющих блоков (ALU, MMU, FPU, SIMD), и есть два «одновременно» исполняемых фрагмента кода. Специальный блок отслеживает, какие команды из каждого фрагмента необходимо выполнить в данный момент, после чего проверяет, загружены ли работой все исполняющие блоки процессора. Если один из них простаивает, и именно он может исполнить эту команду -- ему она и передается. Естественно, существует и механизм принудительного «посыла» команды на выполнение -- в противном случае один процесс мог бы захватить весь процессор (все исполняющие блоки) и исполнение второго участка кода (исполняемого на втором «виртуальном CPU») было бы прервано. Насколько мы поняли, данный механизм (пока?) не является интеллектуальным т. е. не способен оперировать различными приоритетами, а просто чередует команды из двух разных цепочек в порядке живой очереди т. е. просто по принципу «я твою команду исполнил -- теперь уступи место другому потоку». Если, конечно, не возникает ситуации, когда команды одной цепочки по исполняющим блокам нигде не конкурируют с командами другой. В этом случае мы получаем действительно на 100% параллельное исполнение двух фрагментов кода.
Теперь давайте подумаем, чем Hyper-Threading потенциально хороша, и чем -- нет. Самое очевидное следствие ее применения -- повышение коэффициента полезного действия процессора. Действительно -- если одна из программ использует в основном целочисленную арифметику, а вторая -- выполняет вычисления с плавающей точкой, то во время исполнения первой FPU просто ничего не делает, а во время исполнения второй -- наоборот, ничего не делает ALU. Казалось бы, на этом можно закончить. Однако мы рассмотрели лишь идеальный (с точки зрения применения Hyper-Threading) вариант. Давайте теперь рассмотрим другой: обе программы задействуют одни и те же блоки процессора. Понятно, что ускорить выполнение в данном случае довольно сложно -- ибо физическое количество исполняющих блоков от «виртуализации» не изменилось. А вот не замедлится ли оно? Давайте разберемся. В случае с процессором без Hyper-Threading мы имеем просто «честное» поочередное выполнение двух программ на одном ядре с арбитром в виде операционной системы (которая сама представляет собой еще одну программу), и общее время их работы определяется:
1. временем выполнения кода программы №1
2. временем выполнения кода программы №2
3. временными издержками на переключение между фрагментами кода программ №1 и №2
Что мы имеем в случае с Hyper-Threading? Схема становится немного другой:
1. время выполнения программы №1 на процессоре №1 (виртуальном)
2. время выполнения программы №2 на процессоре №2 (виртуальном)
3. время на переключение одного физического ядра (как набора требуемых обеим программам исполняющих блоков) между двумя эмулируемыми «виртуальными CPU»
Остается признать, что и тут Intel поступает вполне логично: конкурируют между собой по быстродействию у нас только пункты за номером три, и если в первом случае действие выполняется программно-аппаратно (ОС управляет переключением между потоками, задействуя для этого функции процессора), то во втором случае мы фактически имеем полностью аппаратное решение -- процессор все делает сам. Теоретически, аппаратное решение всегда оказывается быстрее. Подчеркнем -- теоретически. Но и это еще не все. Также одним из серьезнейших неприятных моментов является то, что команды, увы, не исполняются в безвоздушном пространстве, но вместо этого Pentium 4 приходится иметь дело с классическим x86-кодом, в котором активно используется прямое адресование ячеек и даже целых массивов, находящихся за пределами процессора -- в ОЗУ. Да и вообще, к слову, большинство обрабатываемых данных чаще всего находится там :). Поэтому «драться» между собой наши виртуальные CPU будут не только за регистры, но и за общую для обоих процессорную шину, минуя которую данные в CPU попасть просто не могут. Однако тут есть один тонкий момент: на сегодняшний день «честные» двухпроцессорные системы на Pentium III и Xeon находятся в точно такой же ситуации! Ибо наша старая добрая шина AGTL+, доставшаяся в наследство всем сегодняшним процессорам Intel от знаменитого Pentium Pro (в дальнейшем ее лишь подвергали модификациям, но идеологию практически не трогали) -- ВСЕГДА ОДНА, сколько бы CPU ни было установлено в системе. Вот такой вот «процессорный коаксиал» :). Отойти от этой схемы на x86 попробовала только AMD со своим Athlon MP -- у AMD 760MP/760MPX от каждого процессора к северному мосту чипсета идет отдельная шина. Впрочем, даже в таком «продвинутом» варианте мы все равно убегаем от проблем не очень далеко -- ибо уж что-что, а шина памяти у нас точно одна -- причем вот в этом случае уже везде (напоминаем, разговор идет про x86-системы).
Однако нет худа без добра, и даже из этого в общем-то не очень приятного момента Hyper-Threading может помочь извлечь какую-то пользу. Дело в том, что по идее мы должны будем наблюдать существенный прирост производительности не только в случае с несколькими задачами, использующими разные функциональные блоки процессора, но и в том случае, если задачи по-разному работают с данными, находящимися в ОЗУ. Возвращаясь к старому примеру в новом качестве -- если одно приложение у нас что-то усиленно считает «внутри себя», другое же -- постоянно подкачивает данные из ОЗУ, то общее время выполнения их в случае использования Hyper-Threading по идее должно уменьшиться даже если они используют одинаковые блоки исполнения инструкций -- хотя бы потому, что команды на чтение данных из памяти смогут обрабатываться в то время, пока наше первое приложение будет что-то усиленно считать.
Итак, подведем итог: технология Hyper-Threading с теоретической точки зрения выглядит весьма неплохо и, мы бы сказали, «адекватно», т. е. соответствует реалиям сегодняшнего дня. Уже довольно редко можно застать пользователя с одним сиротливо открытым окном на экране -- всем хочется одновременно и музыку слушать, и по Internet бродить, и диски с любимыми MP3 записывать, а может даже, и поиграть на этом фоне в какую-нибудь стрелялку или стратегию, которые, как известно, процессор «любят» ну просто со страшной силой. С другой стороны, общеизвестно, что конкретная реализация способна иногда своей «кривизной» убить любую самую превосходную идею, и с этим мы тоже не раз встречались на практике.
3.13. Pentium 5
Итак, сегодня компания Intel выпустила, по всей видимости, последний процессор семейства Pentium 4, теперь всему миру остается ждать появления Intel Pentium 5 Prescott. Насколько нам известно, сегодняшний Intel Pentium 4 3.20 GHz будет последним процессором линейки собранным по 130 нм техпроцессу. Intel, как известно, будет выпускать процессоры Prescott по 90 нм технологии, а со следующего года поменяет и собственно процессорный разъем. Нынешние Pentium 4, с технологией Netbust, тем не менее, будут производиться еще около года, Netbust останется и в Pentium 5.
4. AMD
AMD - мировой поставщик интегральных микросхем для рынка персональных и сетевых компьютеров и коммуникаций, чьи производственные мощности расположены в Соединенных Штатах, Европе, Японии и Азии. AMD производит микропроцессоры, устройства флэш-памяти и вспомогательные микросхемы для коммуникационных и сетевых приложений. Компания AMD, основанная в 1969 году со штаб-квартирой в г. Саннивейл (шт. Калифорния), в 2000 году имела оборот 4,6 млрд. долл. (NYSE: AMD).
Первым процессором, который AMD разрабатывала самостоятельно, был K5, выпущенный в 1996 году. Сейчас о нем уже мало кто помнит, правда и помнить там особо нечего. Как всегда, опоздав с выпуском этого кристалла, отставая по тактовой частоте и производительности, AMD не смогла тогда завоевать расположения пользователей.
После этого провала AMD приобрела забытую сейчас фирму NexGen, еще одного независимого разработчика x86 процессоров, который обладал передовой на то время технологией и в небольших количествах выпускал кристаллы без арифметического сопроцессора. Используя эти наработки, AMD спроектировала новое поколение своих CPU - K6. По операциям с целыми числами эти процессоры стали превосходить аналоги от Intel, однако блок операций с плавающей точкой все еще оставлял желать лучшего.
AMD не сдавалась и для нужд компьютерных игр предложила использовать не сопроцессор, а специально спроектированный набор SIMD-инструкций 3DNow!. Так появился процессор AMD K6-2, в котором к обычному ядру K6 добавился еще один блок операций с числами одинарной точности с плавающей точкой. Благодаря тому, что он мог выполнять однотипные вычисления с четырьмя парами операндов одновременно, на специально оптимизированных под 3DNow! приложениях K6-2 показывал неплохую производительность.
В скоре AMD к своему процессору K6-2 добавила интегрированный в ядро кеш второго уровня, работающий на частоте кристалла. Это спасло производительность - полученный K6-III мог успешно конкурировать с аналогами.
Находясь в состоянии ценовой войны, Intel и AMD пришли к тому, что самые дешевые Intel Celeron продаются практически по себестоимости, если не ниже, а на рынке дорогих процессоров обосновался другой продукт от Intel - Pentium III. Единственный оставшийся шанс выжить для измотанной и порастерявшей в борьбе свои капиталы AMD - вылезти на рынок дорогих и производительных процессоров. Причем, закрепиться на нем не за счет цены - этим оружием в совершенстве владеет Intel, который может сбрасывать цены значительно сильнее AMD, а за счет быстродействия. Именно это и попыталась сделать AMD, выбросив на рынок процессор нового поколения - Athlon.
4.1 Развитие семейства K-6
AMD K6
Clock speeds (MHz)166, 200, 233
Level one (L1) cache 32K instruction, 32K data
Level two (L2) cacheControlled by chip set
L2 cache speed Same as bus
Type of bus Socket 7
Bus speed (MHz) 66
Instructions per clock cycle 2
MMX units 1
Pipelined FPU N
Out-of-order executionY
Process technology0.35µ CMOS
Die size 162 mm2
Transistors 8.8 million
AMD K6-2
Этот процессор является логическим продолжением линейки K6 и отличается от предшественника только добавленным в ядро нового модуля, обрабатывающего "3D-инструкции" и носящего название 3DNow!. По сути - это еще один сопроцессор по типу MMX, но умеющий выполнять 21 новую инструкцию. Эти новые инструкции призваны, прежде всего, ускорить обработку данных, связанных с трехмерной графикой. Поэтому в набор инструкций 3DNow! включены команды, работающие с вещественночисленными аргументами одинарной точности. Именно поэтому, технология ММХ не пошла в жизнь - ММХ работает с целыми числами, а при расчете трехмерных сцен оперировать приходится с вещественными. Как и ММХ, 3DNow! использует те же регистры, что и сопроцессор, это связано с тем, что операционные системы должны сохранять и сбрасывать все регистры процессора при переключении задач.
Теоретически, 3DNow! должен заменить сопроцессор при расчетах трехмерной геометрии и существенно ускорить выполнение этих вычислений. Модуль 3DNow! может выполнять до четырех SIMD (Single Instruction Multiple Data) инструкций (из своего 21-командного набора) параллельно, что при грамотном использовании может дать небывалый прирост производительности. Хорошей иллюстрацией этого тезиса может послужить Quake2, работающий на процессорах K6 в полтора раза медленней, чем на Pentium той же частоты. Однако, вопреки распространенному мнению, это связано не с тормознутостью AMD-шного сопроцессора, а с тем что Intel реализовал в своем кристалле возможность параллельной работы процессора с арифметическим сопроцессором. В Quake2, код оптимизирован с учетом этой особенности, поэтому если процессорные и сопроцессорные инструкции не могут выполняться одновременно (как на AMD K6), производительность получается крайне низкая. K6-2 должен решить эту проблему, но другим путем - за счет конвейеризации 3D вычислений в модуле 3DNow! Однако, вопрос распараллеливания вычислений должен решаться программистом, что вызывает определенные трудности при реализации алгоритмов, тем более, что процесс вычисления геометрии 3D-сцен далеко не линейный. Поэтому, теоретическая производительность К6-2, значительно превышающая скорость всех современных PII-процессоров, достигнута быть не может.
Таким образом, чтобы от 3DNow! был хоть какой-то эффект, необходимо, чтобы приложение использовало те самые 21 инструкцию. Причем не как-нибудь, а с учетом конвейерной структуры этого модуля процессора.
AMD K6-2 3DNow!
AMD вновь надеется сократить отрыв от Intel'а, на этот раз с помощью технологий высокого уровня и заточенных под процессор 3D драйверов. Названная "K6-2 3DNow!", эта серия процессоров должна разбить иллюзию, что пользователи должны покупать процессоры Intel Pentium II для достижения максимально возможного 3D быстродействия.
Выйдя в 300 и 333Мгц версиях, линия K6-2 содержит некоторые улучшения, по сравнению с уже знакомой пользователям линии K6. Улучшенный сопроцессор, более высокие скорости работы ядра, поддержка 100Мгц кэша 2 уровня, и набор инструкций, известный как 3Dnow!, - вот качества, вознесшие K6-2 на вершину предлагаемых AMD процессоров.
3DNow!, говоря человеческим языком, - это улучшенный процесс вычислений, ускоряющий обсчитывание сцены для 3D графики. Cyrellis уже раньше упоминал, что одним из главных препятствий для ускорителей 3D графики является конфликт между медленным созданием сцены типичным процессором Intel/AMD и возможностями родного процессора 3D карты. Видеокарта должна дождаться, пока CPU завершит свою работу, и только тогда ее 3D-процессор будет в состоянии выжать требуемое нам количество кадров в секунду. 3DNow! обещает изменить такое положение вещей, проносясь сквозь генерацию сцены на максимальной скорости, тем самым значительно повышая производительность.
Вот как это выглядит:
Как вы видите, процессор загружен работой, даже если 3D-ускоритель берет на себя генерацию треугольников, как например это делает чипсет Voodoo2.
4.2 Технология 3DNow
Технология 3DNow!, предложенная AMD в своем новом процессоре K6-2 (кодовое имя было K6 3D), представляет собой развитие применяемой повсеместно технологии MMX. MMX - это дополнительные 57 инструкций процессора и 8 дополнительных регистров, которые призваны увеличить производительность мультимедийных приложений. Если программа использует эти возможности, то это вносит немалый вклад в скорость ее выполнения. MMX была введена в процессорах фирмы Intel, но к настоящему моменту все x86-процессоры, включая AMD, IDT и Cyrix, поддерживают ее. Однако, несмотря на повсеместную поддержку, MMX используется недостаточным числом приложений, поэтому преимущества от наличия поддержки MMX пока невелики.
После внедрения MMX, инициатива по внедрению новых инструкций неожиданно перешла к AMD. Правда, в ответ на этот шаг, Intel анонсировал набор команд MMX2, который появился в процессоре Katmai. Дополнительная система команд от AMD, названная 3DNow! (кодовое имя было AMD-3D Technology), представляет собой набор инструкций для ускорения операций трехмерной графики. Этот набор включает, в частности, быстрое деление вещественных чисел, выполняемое за 3 такта процессора, и вычисление обратной величины к квадратному корню, выполняемое также за 3 такта. По мнению AMD, использование в 3D-играх технологии 3DNow! позволит 300-мегагерцовому K6-2 догнать по производительности Pentium II 400 МГц.
AMD K6-III
Вслед за выходом очередного процессора от Intel, Pentium III, появилась новинка и от AMD - процессор K6-III. Этот процессор должен был позволить AMD подняться из ниши дешевых систем и начать конкуренцию с Intel на рынке более дорогих машин, подготавливая почву для нанесения решающего удара по позициям микропроцессорного гиганта блокбастером K7. Долгое ожидание, чтение спецификаций и первые впечатления от AMD K6-III давали все основания для того, чтобы надеяться на то, что позиции Intel пошатнутся. Но, традиционно, AMD выступает в роли догоняющего, а для победы в этом случае, согласно военной тактике, требуется немалое превосходство в силе. Но, тем не менее, новый раунд сражения AMD против Intel, Socket7 против Slot1, Давид против Голиафа, начался.
Вот технические данные процессора AMD K6-III:
· Чип, производимый по технологии 0.25 мкм;
· Ядро CXT, представляющее собой обычное ядро K6-2 с возможностью пакетной записи;
· Работает в Socket-7-системных платах, но требует обновления BIOS;
· Кэш первого уровня - 64 Кбайта, по 32 Кбайта на код и данные;
· Имеет встроенный кэш второго уровня объемом 256 Кбайт;
· Кэш материнской платы работает как кэш третьего уровня;
· Напряжение питания 2.3-2.5В (есть разные партии);
· Набор из 21 SIMD-команды 3DNow! Имеется 2 конвейера, оперирующие с двумя парами вещественных чисел одинарной точности;
· Частоты - 350, 400, 450 и 475 МГц. Системная шина 100 МГц (для модели 475 МГц - 95 МГц). Возможна работа и на 66МГц системной шине;
· 3DNow! поддерживается в DirectX 6.0 и выше.
Как видно из спецификации, AMD K6-III - это AMD K6-2 плюс 256 Кбайт кэша второго уровня, интегрированного в ядро и работающего на его частоте. Помня, какие чудеса производительности показывает Intel Celeron, от AMD K6-III ожидается также немалый прирост в быстродействии, тем более, что шина памяти - главное узкое место в системе, хоть она и работает на частоте 100 МГц. К тому же L2 кэш e К6-III имеет размер в два раза больший, чем у Celeron и в два раза более быстрый (хотя и вдвое меньший), чем у Pentium II. Не следует к тому же забывать и про кэш, установленный на материнской плате - он становится кэшем третьего уровня и добавляет еще несколько процентов производительности.
Надо уделить внимание и еще одному факту, а именно буквам CXT в названии ядра. Это ядро появилось в процессорах K6-2 совсем недавно и отличается от предшествующего наличием функции пакетной записи в память Write Allocate. То есть, новое ядро позволяет передавать данные по шине не как придется, а по мере накопления 8-ми байтовыми пакетами, что дает небольшой выигрыш в производительности при передаче данных по 64-битной шине. Правда, новой эту функцию назвать нельзя, так как Write Allocate имеется и в интеловских процессорах еще со времен Pentium Pro.
Что касается 3DNow!, то тут по сравнению K6-2 все осталось совсем без изменений. Однако, надо констатировать, что приложений использующих эту технологию на рынке не много, а поддержка 3DNow! в драйверах видеокарт и DirectX не дает практически ничего. Также как и в случае с SSE, для получения значимого прироста в быстродействии, необходимо использование SIMD-инструкций при расчете геометрии 3D-сцены, так как функции, оптимизированные в DirectX работают недостаточно быстро и не используются разработчиками.
Отметим тот факт, что для поддержки новых K6-III подойдут и старые Socket7 системные платы, для которых есть BIOS с поддержкой ядра CXT и имеющие возможность выставления напряжения питания ядра 2.3-2.5В. Однако, если в руководстве к системной плате не указан способ выставления этих напряжений, отчаиваться рано. В большинстве случаев существуют недокументированные установки для такого напряжения питания.
AMD K7
К7 - первый из семейства микропроцессоров х86 7-го поколения, в котором присутствуют конструктивные решения, до сих пор не применявшиеся в процессорах архитектуры х86 и сулящие выигрыш в быстродействии даже при одинаковых тактовых частотах. Наиболее впечатляющим из них является, конечно, 200-мегагерцовая системная шина, однако есть и другие, менее заметные на первый взгляд новшества, ставящие К7 выше процессоров 6-го поколения.
· Новая архитектура узла вычислений с плавающей точкой (fpu). К7 содержит 3 узла вычислений с плавающей точкой (fpu), любой из которых способен принимать на вход инструкции каждый такт работы процессора. При этом один узел предназначен исключительно для выполнения команды FSTORE! Назначение этого узла - обеспечивать обмен между регистрами и памятью в то время, как процессор выполняет другие инструкции. Такой подход, хотя и не повышает пиковую производительность, позволяет достичь более высокой средней производительности, что во многих случаях важнее. Остальные два fpu состоят из блока сложения (adder) и блока умножения (multiplier). Оба блока используют конвейеры (fully pipelined). Архитектура каждого fpu такова, что он может принимать на вход каждый такт одну инструкцию сложения и одну умножения, что дает пиковую производительность 1000MFLOPS при 500МГц. Ближайшим аналогом с точки зрения архитектуры является Pentium II, у которого также присутствуют adder и multiplier. Однако существуют два основных отличия. Во-первых, у PII только adder является полностью конвейеризованным (fully pipelined), multiplier же может принимать инструкцию на вход только каждый второй такт. Во-вторых, каждый узел fpu PII может принимать только одну инструкцию за такт, таким образом, пиковая производительность составляет 500MFLOPS при 500МГц. Вышесказанное ни в коем случае не является нападками на достойную архитектуру семейства Р6, которое до сих пор остается единственным семейством процессоров с конвейерным fpu. Да, чуть не забыл... Rise mP6, возможно, будет иметь архитектуру fpu, похожую на ту, что используется в К7 (как во всем, что связано с компанией Rise, здесь полно тумана, но компания уверенно заявляет, что fpu их процессора способен выполнять 2 инструкции х87 за такт), однако максимальная тактовая частота в 200МГц не позволяет этому процессору претендовать на место не только в "высшем обществе", но даже и в "среднем классе", поэтому сравнивать mP6 с К7 некорректно.
· Огромный кэш L1. Если помните, Pentium MMX-166 показывал такую же производительность на приложениях, не использующих инструкции ММХ, как и классический Pentium-200. В чем причина? А причина в том, что чип ММХ имел в 2 раза больше кэша L1 (32К против 16К). Это также объясняет, почему К6-200 приблизительно равен по производительности Pentium MMX-233 - он имеет 64К кэша. К чему это я? К тому, что в К7 кэш L1 увеличился еще в 2 раза - до 128К. Это еще не гарантирует эффективного роста производительности процессора с увеличением тактовой частоты, но, по крайней мере, устраняет опасность простоя, из-за обмена с памятью.
· Модернизируемый кэш L2. У К7 кэш L2 будет размещен, по примеру PII, в картридже, а не интегрирован в кристалл, как у К6-3. Результатом этого является возможность "модернизации" кэша. Первоначально его частота будет составлять 1/3 частоты процессора. В дальнейшем планируется выпуск версий с кэшем L2, работающим на частоте процессора, и, возможно, на половинной частоте. То же и с размером. К7 может нести кэш L2 размером от 512К в "нижних" моделях до 8МВ в серверных моделях "high-end" (впечатляюще, Xeon на сегодня имеет до 2МВ, но цена...).
4.3 AMD Duron 650
В то время, когда популярность Socket 7 платформ находилась на самом пике, и оба крупнейших микропроцессорных производителя и Intel, и AMD делали процессоры под этот разъем, мы привыкли к тому что AMD предлагала менее производительные, но и более дешевые решения. Однако, год назад это положение коренным образом изменилось. Анонсировав Athlon, который архитектурно превосходит Intel Pentium III, AMD удалось на какое-то время захватить лидерство в производительности процессоров. И хотя Intel впоследствии удалось усовершенствовать ядро своих процессоров, в которое был добавлен встроенный кеш второго уровня, AMD прочно обосновалась на рынке скоростных CPU, где и по сей день продолжает укреплять свои позиции.
В настоящий момент AMD применяет против Intel два средства. Первое - агрессивная ценовая политика, в результате которой процессоры Athlon оказались намного дешевле своих соперников, Intel Pentium III, работающих на аналогичной частоте. И второе - благодаря своей архитектуре AMD удается повышать частоту своих процессоров несколько легче, чем Intel. В результате, на настоящий момент, например, AMD уже серийно продает свои гигагерцовые CPU.
Однако, есть у AMD и проблемы. Самая большая головная боль с Athlon - это кеш второго уровня, выполненный в виде микросхем SRAM, которые до недавнего времени располагались на процессорной плате и производились сторонними производителями. Младшие модели Athlon имели L2-кеш, работающий на половинной частоте ядра процессора, однако по мере роста частот производители SRAM не поспевали за AMD и не могли обеспечить поставки микросхем кеша, работающих на 1/2 частоты процессора. В результате, начиная с частоты 750 МГц Athlon стал снабжаться кеш-памятью, работающей на 2/5 частоты процессора, а начиная с частоты 900 МГц - и вовсе работающей на 1/3 частоты. Таким образом, получилась парадоксальная ситуация, когда самый быстрый L2-кеш оказался у 700-мегагерцового Athlon. AMD же, естественно, такая ситуация устроить не могла, так как медленная кеш-память второго уровня начала сдерживать рост производительности процессоров.
Поэтому, решение наконец-то переместить L2-кеш AMD Athlon с внешней процессорной платы внутрь ядра выглядит вполне логично. Тем более, что оба завода AMD и в Остине и в Дрездене успешно освоили технологию 0.18 мкм, что позволило при переходе со старой 0.25 мкм технологии уменьшить площадь ядра Athlon на 82 кв.мм.
В результате, линейка AMD Athlon получила продолжение в лице процессоров на ядре Thunderbird, имеющих кеш первого уровня размером 128Кбайт и 256-килобайтный интегрированный в ядро кеш второго уровня, работающий на полной частоте CPU. Это семейство новых AMD Athlon с частотой 750 МГц и выше было анонсировано более двух недель назад.
Однако, этим AMD не ограничилась. Еще год назад при представлении Athlon компания заявила о намерении производства различных модификаций своего CPU, рассчитанных на различные сектора рынка. И вот, наконец, теперь она начала осуществлять свои планы, представив и семейство процессоров AMD Duron ориентированное на low-end сектор и являющееся прямым конкурентом Intel Celeron.
Итак, посмотрим, что же представляют из себя процессоры Duron с точки зрения их основных характеристик:
· Чип, производимый по технологии 0.18 мкм с использованием медных соединений
· Ядро Spitfire, основанное на архитектуре Athlon. Содержит 25 млн. транзисторов и имеет площадь 100 кв.мм
· Работает в специальных материнских платах с 462-контактным процессорным разъемом Socket A
· Использует высокопроизводительную 100 МГц DDR системную шину EV6
· Кеш первого уровня 128 Кбайт - по 64 Кбайта на код и на данные
· Интегрированный кеш второго уровня 64 Кбайта. Работает на полной частоте ядра
· Напряжение питания - 1.5В
· Набор SIMD-инструкций 3DNow!
· Выпускаются версии с частотами 600, 650, 700 МГц
Итак, с точки зрения архитектуры, Duron ничем не отличается от обычного Athlon, кроме встроенного в ядро 64-Кбайтного кеша второго уровня. Если же сравнить Duron с новыми Athlon на ядре Thunderbird, то различия между ними будут заключаться в размере интегрированного L2 кеша (у Thunderbird он 256 Кбайт против 64 Кбайт у Duron) и в частотах (Thunderbird выпускаются с частотами начиная с 750МГц, а Duron - с частотами до 700 МГц). В остальном же, архитектурно и старые и новые Athlon и Duron ничем не отличаются. При этом, все же необходимо иметь в виду, что все же новые процессоры Duron и Thunderbird имеют обновленное и технологически усовершенствованное ядро, выпускаемое по технологии 0.18 мкм. В результате, например, даже получается, что ядро Duron с встроенным L2-кешем по площади даже меньше, чем ядро K75 (0.18 мкм Athlon).
И отдельно хочется коснуться нового форм-фактора и процессорного разъема, который теперь использует AMD для своих CPU. Поскольку микросхем SRAM, используемых для внешнего L2-кеша у новых процессоров Duron и Thunderbird теперь нет, AMD вслед за Intel вновь обратила внимание на процессорный разъем типа socket. Это не только более выгодно из экономических соображений (нет необходимости в процессорной плате, картридже и т.п.), но и более рационально с точки зрения организации лучшего охлаждения. В качестве такого разъема AMD решила использовать 462-контактный Socket A, который по своим размерам, да и по внешнему виду похож как на Socket 7, так и на Socket 370. Поэтому, с Socket A процессорами AMD можно использовать старые Socket 7 и Socket 370 кулеры. Единственное, не следует при этом забывать, что тепловыделение Duron несколько превосходит количество тепла, отдаваемое Celeron, поэтому они нуждаются в несколько лучшем охлаждении. Например, Duron 650 выделяет тепла примерно столько же, сколько и Intel Pentium III 733.
У AMD Duron с системной шиной все в порядке. Поскольку этот процессор, как и остальные из семейства Athlon использует 100-мегагерцовую DDR шину EV6, пропускная способность этого звена оказывается 1,6 Гбайт/с. Кеш первого уровня Duron со времен выпуска первых Athlon не претерпел никаких изменений - его размер составляет 128 Кбайт. Кеш первого уровня Duron делится на две части - для кеширования данных и для кеширования инструкций.
Что же касается кеша второго уровня, то тут нас ждет небольшой сюрприз. Нетрудно заметить, что у Duron он в два раза меньше чем L1 кеш. Зачам он тогда нужен? Ответ на этот вопрос кроется в алгоритме работы L2 кеша Duron и, кстати, Thunderbird. Кеш второго уровня этих процессоров является эксклюзивным, что означает, что данные, хранящиеся в L1 кеше в нем не дублируются. Такой метод работы L2 кеша реализован пока только в новых процессорах AMD, все же интеловские процессоры имеют обычный inclusive L2 кеш, данные из L1 кеша в котором дублируются. Поэтому общий объем эффективной кеш-памяти у AMD Duron составляет 128+64=192 Кбайта, в то время как у Celeron он всего 128 Кбайт (32 Кбайта L2 кеша занято копией данных, имеющихся в L1 кеше).
Чтобы проиллюстрировать все вышесказанное приведу графики, показывающие скорость записи в память блоков данных различного размера для процессоров AMD Duron 650:
Процессор AMD Duron удался. Это можно сказать определенно. Его производительность находится на достаточно высоком уровне, чтобы не только обогнать конкурирующий Intel Celeron, но и вообще не оставить ему никаких шансов в штатном режиме. Производительность AMD Duron 650 всего на несколько процентов меньше скорости AMD Athlon 650 и примерно соответствует производительности Intel Pentium III 600EB. Таким образом, выход Duron, если Intel не предпримет никаких действий для улучшения производительности своего low-end процессора, означает смерть Celeron.
4.4 AMD Athlon
Если подойти к архитектуре AMD Athlon поверхностно, то основные его параметры можно обрисовать следующим образом:
· Чип, производимый по технологии 0.25 мкм
· Ядро нового поколения с кодовым именем Argon, содержащее 22 млн. транзисторов
· Работает в специальных материнских платах с процессорным разъемом Slot A
· Использует высокопроизводительную системную шину Alpha EV6, лицензированную у DEC
· Кеш первого уровня 128 Кбайт - по 64 Кбайта на код и на данные
· Кеш второго уровня 512 Кбайт. Расположен вне процессорного ядра, но в процессорном картридже. Работает на половинной частоте ядра
· Напряжение питания - 1.6В
· Набор SIMD-инструкций 3DNow!, расширенный дополнительными командами. Всего 45 команд
· Выпускаются версии с частотами 500, 550, 600 и 650 МГц. Версия с частотой 700 МГц появится в ближайшее время
Однако таким простым процессор AMD Athlon кажется только лишь на первый взгляд. На самом же деле за этими несколькими строками скрываются многочисленные архитектурные инновации, которые мы рассмотрим позднее. Однако и простые характеристики AMD Athlon впечатляют. Например, как нетрудно заметить, Athlon превосходит Intel не только по максимальной тактовой частоте (у Intel Pentium III она 600 МГц, да и к тому же при этом он работает на повышенном до 2.05В напряжении ядра), но и по размеру кеша первого уровня, который у Intel Pentium III всего 32 Кбайта.
Перейдем же к более подробному рассмотрению архитектуры AMD Athlon.
Системная шина
Прежде чем углубляться в сам процессор, посмотрим, чем же отличается системная шина EV6, примененная AMD, от привычной интеловской GTL+. Внешнее сходство бывает обманчиво. Хотя процессорный разъем Slot A на системных платах для процессора AMD Athlon выглядит также как и Slot 1, перевернутый на 180 градусов, шинные протоколы и назначения контактов у Intel Pentium III и AMD Athlon совершенно различны. Более того, различно даже число задействованных сигналов - Athlon использует примерно половину из 242 контактов, в то время как Pentium III всего четверть. Внешняя похожесть вызвана тем, что AMD просто хотела облегчить жизнь производителям системных плат, которым не придется покупать особенные разъемы для установки на Slot A системные платы. Только и всего.
На самом же деле, хоть EV6 и работает на частоте 100 МГц, передача данных по ней, в отличие от GTL+ ведется на обоих фронтах сигнала, потому фактическая частота передачи данных составляет 200 МГц. Если учесть тот факт, что ширина шины EV6 - 72 бита, 8 из которых используется под ECC (контрольную сумму), то получаем скорость передачи данных 64бита х 200 МГц = 1,6 Гбайт/с. Напомню, что пропускная способность GTL+, работающей на 100 МГц в два раза меньше - 800 Мбайт/с. Повышение частоты GTL+ до 133 МГц дает увеличение пропускной способности при этом только до 1,06 Гбайт/с. Казалось бы, как в случае с GTL+, так и с EV6 получаются внушительные значения пропускной способности. Однако, только современная PC100 память может отожрать от нее до 800 Мбайт/с, а AGP, работающий в режиме 2x - до 528 Мбайт/с. Не говоря уже о PCI и всякой другой мелочевке. Получается, что GTL+ уже сейчас может не справляться с передаваемыми объемами данных. У EV6 же в этом случае все в порядке, потому эта шина более перспективна.
При этом, как частота GTL+ может быть увеличена со 100 до 133 МГц, планируется, что и частота EV6 также впоследствии достигнет значения 133 (266), а затем и 200 (400) МГц. Однако планы эти могут и не осуществиться - реализовать работу на материнской плате EV6, требующую большего количества контактных дорожек, несколько сложнее, особенно на больших частотах. Хотя если у AMD все получится, пропускная способность системной шины может достичь 2.1 и 3.2 Гбайта/с соответственно, что позволит беспрепятственно применять в Athlon-системах, например, высокопроизводительную 266-мегагерцовую DDR SDRAM.
Кеш
Прежде чем переходить непосредственно к функционированию AMD Athlon, хочется затронуть тему L1 и L2 кешей.
Что касается кеша L1 в AMD Athlon, то его размер 128 Кбайт превосходит размер L1 кеша в Intel Pentium III аж в 4 раза, не только подкрепляя высокую производительность Athlon, но и обеспечивая его эффективную работу на высоких частотах. В частности, одна из проблем используемой Intel архитектуры Katmai, которая, похоже, уже не позволяет наращивать быстродействие простым увеличением тактовой частоты, как раз заключается в малом объеме L1 кеша, который начинает захлебываться при частотах, приближающихся к гигагерцу. AMD Athlon лишен этого недостатка.
Что же касается кеша L2, то и тут AMD оказалось на высоте. Во-первых, интегрированный в ядро tag для L2-кеша поддерживает его размеры от 512 Кбайт до 16 Мбайт. Pentium III, как известно, имеет внешнюю Tag-RAM, подерживающую только 512-килобайтный кеш второго уровня. К тому же, Athlon может использовать различные делители для скорости L2-кеша: 1:1, 1:2, 2:3 и 1:3. Такое разнообразие делителей позволяет AMD не зависеть от поставщиков SRAM определенной скорости, особенно при выпуске более быстрых моделей.
Благодаря возможности варьировать размеры и скорости кеша второго уровня AMD собирается выпускать четыре семейства процессоров Athlon, ориентированных на разные рынки.
Подобные документы
История развития фирмы INTEL. Развитие и выпуск процессоров INTEL. Обзор технологии ATOM. Обзор процессоров. Материнская плата Gigabyte GC230D. Ноутбуки на базе процессоров INTEL ATOM. Ноутбук MSI Wind U100-024RU, ASUS Eee 1000H, Acer One AOA 150-Bb.
курсовая работа [233,0 K], добавлен 24.11.2008История и перспективы развития производства процессоров компьютеров. Основы работы центрального процессора. Характеристика многоядерных процессоров. Ведущие производители: Intel и AMD, их планы по выпуску новых процессоров. Советы по выбору CPU.
курсовая работа [2,8 M], добавлен 03.11.2011Гнездовой или щелевой разъём центрального процессора для облегчения его установки. Стандартный слот типа Socket. История изменения и характеристики всех сокетов, используемых для установки процессоров Intel. Разработка новых интерфейсов компании Intel.
реферат [202,4 K], добавлен 01.10.2009Стратегия развития процессоров Intel. Структурная организация современных универсальных микропроцессоров. Особенности многоядерной процессорной микроархитектуры Intel Core, Intel Nehalem, Intel Westmere. Серверные платформы Intel c использованием Xeon.
реферат [36,5 K], добавлен 07.01.2015История создания и развития компьютерных процессоров Intel. Изучение архитектурного строения процессоров Intel Core, их ядра и кэш-память. Характеристика энергопотребления, производительности и систем управления питанием процессоров модельного рядя Core.
контрольная работа [7,6 M], добавлен 17.05.2013История Intel, выпуск оперативной памяти для компьютера. Главные особенности построения бренда компании. Модели процессоров, выпускаемые корпорацией Intel. Виды подложек, используемых при производстве микросхем. Краткая история процессоров Pentium.
реферат [28,8 K], добавлен 13.02.2013История развития центрального процессора. Основные проблемы создания многоядерных процессоров. Проектирование микропроцессорной системы на базе процессора Intel 8080. Разработка принципиальной схемы и блок-схемы алгоритма работы микропроцессорной системы.
курсовая работа [467,6 K], добавлен 11.05.2014История развития, устройство и назначение центральных процессоров Intel. Особенности архитектуры различных поколений ЦП. Характеристики и общая схема чипсетов материнских плат разных серий. Повышение их функциональности и уровня производительности.
реферат [121,4 K], добавлен 08.11.2015Управление взаимодействием всех устройств ЭВМ. История создания и развития производства процессора. Структура центрального процессора. Регистры общего назначения. Обозначения популярных моделей процессоров Intel и AMD. Команды центрального процессора.
реферат [111,2 K], добавлен 25.02.2015Принцип работы ядра процессора, типы архитектур ядер операционных систем. Сокет(Socket), кэш-память, контроллер ОЗУ, северный мост. Внутренняя архитектура процессоров Intel и AMD: расшифровка названий, технологии процессоров, сравнение производительности.
реферат [214,9 K], добавлен 05.05.2014