Технические характеристики процессоров

Изучение истории появления, назначения и основных составляющих процессоров - вычислительных устройств, состоящих из транзисторов. Анализ современной микропроцессорной технологии фирмы Intel. Развитие семейства K-6. Советы по выбору процессора Intel и AMD.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык русский
Дата добавления 21.11.2010
Размер файла 2,3 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Архитектура. Общие положения

Вот мы и подошли к рассказу о том, как же, собственно, работает Athlon. Как и процессоры от Intel с ядром, унаследованным от Pentium Pro, процессоры Athlon имеют внутреннюю RISC-архитектуру. Это означает, что все CISC-команды, обрабатываемые процессором, сначала раскладываются на простые RISC-операции, а потом только начинают обрабатываться в вычислительных устройствах CPU. Казалось бы, зачем усложнять себе жизнь? Оказывается, есть зачем. Сравнительно простые RISC-инструкции могут выполняться процессором по несколько штук одновременно и намного облегчают предсказание переходов, тем самым позволяя наращивать производительность за счет большего параллелизма. Говоря более просто, тот производитель, который сделает более "параллельный" процессор, имеет шанс добиться превосходства в производительности гораздо меньшими усилиями. AMD при проектировании Athlon, по-видимому, руководствовалась и этим принципом.

Однако перед тем, как начать работу над параллельными потоками инструкций, процессор должен их откуда-то получить. Для этого в AMD Athlon, как впрочем и в Intel Pentium III, применяется дешифратор команд (декодер), который преобразует поступающий на вход процессора код. Дешифратор в AMD Athlon может раскладывать на RISC-составляющие до трех входящих CISC-команд одновременно. Современные интеловские процессоры могут также обрабатывать до трех команд, однако если для Athlon совершенно все равно, какие команды он расщепляет, Pentium III хочет, чтобы две из трех инструкций были простыми и только одна - сложной. Это приводит к тому, что если Athlon за каждый процессорный такт может переварить три инструкции независимо ни от чего, то у Pentium III отдельные части дешифратора могут простаивать из-за неоптимизированного кода.

Перед тем, как попасть в соответствующий вычислительный блок, поступающий поток RISC-команд задерживается в небольшом буфере (Instruction Control Unit), который, что уже неудивительно, у AMD Athlon расчитан на 72 инструкции против 20 у Pentium III. Увеличивая этот буфер, AMD попыталась добиться того, чтобы дешифратор команд не простаивал из-за переполнения Instruction Control Unit.

Еще один момент, заслуживающий внимания - вчетверо большая, чем у Pentium III, таблица предсказания переходов размером 2048 ячеек, в которой сохраняются предыдущие результаты выполнения логических операций. На основании этих данных процессор прогнозирует их результаты при их повторном выполнении. Благодаря этой технике AMD Athlon правильно предсказывает результаты ветвлений где-то в 95% случаев, что очень даже неплохо, если учесть, что аналогичная характеристика у Intel Pentium III всего 90%.

Посмотрим теперь, что же происходит в Athlon, когда дело доходит непосредственно до вычислений.

Целочисленные операции

С целочисленными операциями у процессоров от AMD всегда все было в порядке. Со времен AMD K6 процессоры от Intel проигрывали именно в скорости целочисленных вычислений. Тем не менее, в Athlon AMD напрочь отказалась от старого наследия.

Благодаря наличию трех конвейерных блоков исполнения целочисленных команд (Integer Execution Unit) AMD Athlon может выполнять три целочисленные инструкции одновременно. Что же касается Pentium III, то его возможности ограничиваются одновременным выполнением только двух команд.

Отдельно хочется затронуть вопрос конвейеров. Оптимальной глубиной конвейера для процессоров с современными скоростями считается 9 стадий. Увеличение этого числа приводит к ускорению процесса обработки команд, так как скорость работы конвейера определяется работой самой медленной его стадии. Однако, в случае слишком большого конвейера при ошибках в предсказании переходов оказывается что большая часть работы по исполнению команд, уже вошедших на конвейер выполнена напрасно. Его приходится очищать и начинать процесс заново.

Потому в AMD Athlon глубина целочисленных конвейеров составляет 10 стадий, что близко к оптимуму. К сожалению, поклонники продукции Intel снова не услышат ничего утешительного, так как конвейер в Pentium III состоит из 12-17 стадий в зависимости от типа исполняемой инструкции.

Вещественные операции

С замиранием сердца обращаем наш взгляд на блок FPU, встроенный в Athlon. Как мы все хорошо помним, для предыдущих процессоров AMD операции с плавающей точкой были настоящей ахиллесовой пятой. Главной проблемой было то, что блок FPU в K6, K6-2 и K6-III был неконвейеризированый. Это приводило к тому, что хотя многие операции с плавающей точкой в FPU от AMD выполнялись за меньшее число тактов, чем на интеловских процессорах, общая производительность была катастрофически низкой, так как следующая вещественная операция не могла начать выполняться до завершения предыдущей. А что-то менять в своем FPU AMD в то время не хотела, призывая разработчиков к отказу от его использования в пользу 3DNow!.

Но, похоже, прошлый опыт научил AMD. В Athlon арифметический сопроцессор имеет конвейер глубиной 15 стадий против 25 у Pentium III. Не следует забывать, что, как уже говорилось выше, более длинный конвейер не всегда обеспечивает лучшую производительность. К тому же, существенным недостатком Intel Pentium III, которого в Athlon, естественно нет, является неконвейерезируемость операций FMUL и FDIV.

FPU в Athlon объединяет в себе три блока: один для выполнения простых операций типа сложения, второй - для сложных операций типа умножения и третий - для операций с данными. Благодаря такому разделению работы Athlon может выполнять одновременно по две вещественночисленные инструкциии. А ведь такого не умеет даже Intel Pentium III - он выполняет инструкции только последовательно!

Так что, как это ни странно, FPU интеловских процессоров оказался не таким уж замечательным, как это принято было считать ранее.

MMX

На первый взгляд с выполнением MMX-операций у Athlon по сравнению с K6-III изменений не произошло. Однако это не совсем так. Хотя и MMX-инструкции используются в крайне небольшом числе приложений, AMD добавила в этот набор еще несколько инструкций, которые также появились в MMX-блоке процессора Pentium III. В их число вошли нахождение среднего, максимума и минимума и изощренные пересылки данных.

Если обратить внимание на архитектурные особенности, то в AMD Athlon имеется по два блока MMX, потому на обоих процессорах - и на Athlon, и на Pentium III - может выполняться одновременно пара MMX-инструкций. Однако, MMX-блоки в AMD Athlon имеют большую, чем у Pentium III латентность, что теоретически должно приводить к отставанию этого CPU в MMX-приложениях.

3DNow!

Блока 3DNow! в AMD Athlon коснулись сильные изменения. Хотя его архитектура и осталась неизменной - два конвейера обрабатывают инструкции, работающие с 64-битными регистрами, в которых лежат пары вещественных чисел одинарной точности, в сам набор команд было добавлено 24 новинки. Новые операции должны не только позволить увеличить скорость обработки данных, но и позволить задействовать технологию 3DNow! в таких областях, как распознавание звука и видео, а также интернет :) Кроме этого, по аналогии с SSE были добавлены и инструкции для работы с данными, находящимися в кеше. Поддержка обновленного набора 3DNow! уже встроена в Windows 98 SE и в DirectX 6.2.

Таким образом, в набор 3DNow! входит теперь 45 команд, против 71 инструкции в SSE от Intel. Причем, судя по всему, использование новых команд должно дать еще больший эффект от 3DNow! В доказательство этого факта AMD распространила дополнительный DLL для известного теста 3DMark 99 MAX, задействующий новые возможности процессора.

Специально для оценки эффективности процессора в 3D-играх, 3DMark 99 MAX предлагает индекс CPU 3DМark, просчитывающий 3D-сцены, но не выводящий их не экран. Таким образом, получается результат, зависящий только от возможностей процессора по обработке 3D-графики и от пропускной способности основной памяти.

4.5 Чипсеты

Прекратив разрабатывать процессоры под гнездо Super 7 и начав продвигать собственный Slot A и системную шину EV6, AMD оказалась отрезана от всех интеловских наработок на поприще чипсетов и системных плат. Теперь AMD придется самой создавать необходимую инфраструктуру, чтобы мы могли приобрести не только процессор, но и системную плату, оборудованную Slot A.

И, судя по первым успехам, ей это удалось. На первое время компания разработала собственный набор логики AMD 750, имеющий кодовое имя Irongate, а также собственный дизайн системной платы - Fester, который был растиражирован рядом тайваньских производителей.

Сам чипсет AMD 750 не представляет собой ничего особенного - по возможностям он аналогичен i440BX. Но большего, в принципе, и не надо. AMD Athlon, как мы видели, и так работает нормально и даже обгоняет по производительности конкурирующие продукты.

AMD 750 имеет традиционую архитектуру и состоит из северного моста AMD 751 и южного AMD 756. Северный мост обеспечивает взаимодействие посредством шины EV6 процессора с памятью и шинами PCI и AGP, поддерживая до 768 Мбайт оперативной памяти PC100 в не более чем трех модулях, AGP 2x и 6 PCI bus maser устройств. Южный мост, осуществляющий интерфейс со всей периферией, кроме обычных функций, умеет работать с UltraDMA/66 IDE-устройствами.

4.6 AMD Athlon (Thunderbird) 800

Итак, взвесив все плюсы и минусы L2-кеша на ядре, AMD, пришла к выводу о необходимости переноса кеша на ядро. Тем более, что оба завода AMD, находящиеся в Дрездене и Остине вполне успешно освоили технологию 0.18 мкм, по которой, кстати, некоторое время уже выпускались старшие модели обычных AMD Athlon. Так появился новый старый AMD Athlon с кодовым именем Thunderbird, архитектурно отличающийся от старого Athlon наличием интегрированной кеш-памяти второго уровня размером 256 Кбайт вместо внешнего 512-килобайтного L2-кеша. Посмотрим на его спецификацию:

· Чип, производимый по технологии 0.18 мкм с использованием алюминиевых или медных соединений

· Ядро Thunderbird, основанное на архитектуре Athlon. Содержит 37 млн. транзисторов и имеет площадь 120 кв.мм

· Работает в специальных материнских платах с 462-контактным процессорным разъемом Socket A (Slot A версии доступны в ограниченных количествах только OEM)

· Использует высокопроизводительную 100 МГц DDR системную шину EV6

· Кеш первого уровня 128 Кбайт - по 64 Кбайта на код и на данные

· Интегрированный кеш второго уровня 256 Кбайт. Работает на полной частоте ядра

· Напряжение питания при частоте до 850МГц - 1.7В, при больших частотах - 1.75В

· Набор SIMD-инструкций 3DNow!

· Выпускаются версии с частотами 750, 800, 850, 900, 950 и 1000 МГц

Итак, с точки зрения архитектуры, Thunderbird ничем не отличается от обычного Athlon, кроме встроенного в ядро 256-Кбайтного кеша второго уровня. Несмотря на сокращение размера кеша вдвое по сравнению с обычным Athlon, быстродействие от этого упасть не должно - ведь новый кеш работает гораздо быстрее старого - на полной частоте ядра процессора. Да и к тому же благодаря более близкому его расположению к ядру латентность кеша у Thunderbird на 45% меньше, чем аналогичная характеристика у кеша старого Athlon. В остальном же, архитектурно и старые и новые Athlon ничем не отличаются, поэтому подробности о строении ядра этих CPU можно почерпнуть из обзора AMD Athlon 600. При этом, все же необходимо иметь в виду, что все же Thunderbird имеют обновленное и технологически усовершенствованное ядро, выпускаемое по технологии 0.18 мкм. В результате, например, даже получается, что ядро Thunderbird со встроенным L2-кешем по площади ненамного больше, чем ядро K75 (0.18 мкм Athlon) и даже значительно меньше, чем старое ядро K7, выполненное по технологии 0.25 мкм.

Вторым и не менее важным отличием старых и новых Athlon является то, что поскольку необходимость в процессорной плате отпала, они используют новый процессорный разъем типа socket, а не slot - Socket A. Хотя, конечно, некоторое время Slot A Thunderbird на рынке присутствовать будут, основным форм-фактором для этих CPU следует считать 462-контактный Socket A.

AMD выпускает Thunderbird на двух заводах - в Остине и в Дрездене, по двум различным технологиям - с использованием алюминиевых соединений и медных соединений. Тем не менее, обе эти модификации, похоже, между собой ни чем не отличаются, кроме … цвета. Дрезденские Thunderbird имеют синий цвет кристалла, в то время как Остинские - зеленый.

Что же касается видимых отличий старых и новых Athlon производимых в Slot A варианте, то тут найти отличие будет не так просто, так как оба они имеют одинаковый внешний вид картриджа и что более забавно, одинаковую цену. Однако отличить их все-таки возможно как по маркировке (старые Athlon маркируются как AMD-K7XXX, в то время как новые имеют маркировку AMD-AXXXX) так и заглянув внутрь картриджа со стороны процессорного разъема - у новых Athlon отсутствуют микросхемы SRAM, расположенные по обе стороны от ядра, в то время как у старых Athlon они есть.

До сих пор мы восхищались новыми Thunderbird и их интегрированным L2-кешем. Теперь пришло время немного огорчить фанатов AMD. Тем более, что сделать это будет нетрудно, если сравнить кеш Thunderbird и Coppermine.

Единственным преимуществом L2-кеша Thunderbird с этой точки зрения может являться его эксклюзивность. То есть, алгоритм работы L2 кеша у Thunderbird таков, что данные, хранящиеся в L1-кеше, в L2-кеше не дублируются. Это значит, что суммарный объем эффективной кеш-памяти новых Athlon равен 128+256 = 384Кбайта. В случае же с Coppermine 32Кбайта L2-кеша всегда занято копией содержимого кеш-памяти первого уровня и эффективный объем кешей у этого CPU составляет всего 256Кбайт.

Что же касается недостатков, то просто напросто кеш Thunderbird медленнее чем кеш Coppermine. Причины этого кроются как в меньшей латентности кеша Intel Pentium III так и в том, что инженеры AMD поленились переделать шину соединяющую ядро и L2 кеш, после того как перенесли последний внутрь процессорного ядра. В результате, она так и осталась 64-битной, в то время как шина кеша Coppermine в четыре раза шире.

4.7 AMD Athlon XP 1800+ (1533 MHz)

Вот мы и дождались. Дождались процессора, который нам обещали довольно длительное время. А именно - десктопного варианта процессора AMD Athlon, построенного на новом ядре Palomino.

На самом деле, само ядро присутствовало на рынке уже достаточно давно, но политика компании AMD по выпуску процессоров на его основе выглядела несколько оригинальной. Привычной уже стала схема, при которой на новом ядре выпускается сначала высокоуровневый процессор, спустя какое-то время выходит его несколько урезанный тем или иным образом бюджетный вариант, а затем появляется мобильный. Все логично и понятно, сначала снимается максимально возможное количество сливок с high-end сегмента рынка, а затем новинка продвигается в массы.

В случае же с Palomino все произошло несколько иначе, если не сказать "с точностью до наоборот". AMD начала, что называется, с конца цепочки. Сначала увидел свет мобильный вариант Palomino - Athlon 4, затем AMD Athlon MP, рассчитанный на работу в двухпроцессорных системах. Ладно, пока что ситуация забавная, но не экстраординарная. А вот затем AMD делает очень оригинальный шаг - вопреки всем ожиданиям, на рынок выходит не десктопный Palomino, а AMD Duron, основанный на ядре Morgan. Т.е., low-end процессор! Причем выходит без особой помпы, тихо и незаметно. Изначально вообще было не ясно, а Palomino ли это? Как оказалось - таки да, Palomino, только называется Morgan и кэш у него поменьше.

И лишь после этого на сцене появляется настольный Palomino, переименованный к этому времени в Athlon XP (реверанс в сторону Microsoft?), получивший вместо привычной керамической одежки пластиковую (OPGA, Organic Pin Grid Array) и… реанимированный Pentium Rating.

Если упаковка нового процессора в пластиковый конструктив шаг вполне логичный и обоснованный (керамический корпус гораздо дороже), то возвращение PR, пусть и несколько изменившегося - достаточно спорное решение.

Документ первый: QuantiSpeed™ Architecture

Итак, что же представляет из себя "новая архитектура" процессоров Athlon XP?

Nine-issue, superscalar, fully pipelined micro-architecture

Основной упор в описании своего ядра AMD делает на то, что количество ступеней конвейера у него меньше, чем у Pentium 4 (что и обуславливает меньшую частоту работы ядра при одинаковом техпроцессе), но зато количество одновременно исполняемых (за один такт) инструкций - больше.

Superscalar, fully pipelined Floating Point Unit (FPU)

Еще один плюс своих процессоров, который AMD решила показать в описании QuantiSpeed Architecture - это их знаменитый FPU. Он действительно мощный - три независимых конвейера для исполнения стандартных FPU-инструкций всего семейства x86, плюс инструкции из фирменного набора AMD 3DNow!, плюс (начиная с ядра Palomino) полная поддержка всего набора Intel SSE (к сожалению, пока еще только "первого" SSE). Фактически, ни для кого не секрет, что это похоже действительно самый мощный x86 FPU - даже у Pentium 4 он слабее. Однако… опять "плюс на минус" - все это правда, но все это было еще даже в ядре K7 (за исключением поддержки SSE).

Hardware data prefetch

В Athlon XP используется механизм предварительной (опережающей) загрузки инструкций в L1 cache. Примечательно следующее: во-первых - именно инструкций т.е. только исполняемого кода, а не данных. Во-вторых - именно в кэш первого уровня т.е. - минуя L2. В принципе, учитывая размер L1 у Athlon XP (128 KB)

Exclusive and speculative Translation Look-aside Buffers (TLBs)

TLB имеют практически все "сложные" современные процессоры. Фактически, это еще один подвид кэша, только кэшируются в нем не сами команды и данные, а их адреса. В Thunderbird двухуровневый TLB имел емкость 24/32 (24 адреса инструкций и 32 данных) и 256/256. Основное нововведение Palomino - расширенный L1 TLB, который теперь может хранить 40 адресов данных. Кстати, заметим - если Hardware Prefetch оптимизирует загрузку команд, то при усовершенствовании TLB AMD большее внимание уделила именно данным. Кроме того, "эксклюзивность" кэша (фирменная "фича" AMD, когда кэш второго уровня не дублирует в себе содержимое кэша первого уровня) теперь распространяется и на TLB. В общем, нам трудно будет судить насколько велик вклад нового Translation Look-aside Buffer в общую производительность Athlon XP т.к. нет возможности вычленить именно его вклад, но плюс мы все же поставим - это нечто действительно новое.

4.8 Athlon XP 3200+

Athlon XP 3200+ получился значительно лучше своего предшественника. Хотя вроде бы не так уж и много изменилось: подняли до 2200 МГц частоту ядра (раньше было 2167, т. е. всего на 33 МГц ниже), да еще 33 МГц «накинули» на шину -- теперь она работает на 400 МГц (200 МГц DDR). Итого: все тот же Barton (3000+), только увеличили частоту ядра и шины. Однако, как ни странно, похоже, мы наблюдаем то самое явление «перехода количества в качество», о котором так любили в тему и не в тему говорить большевики.

Маркировка -- смотрите, не ошибитесь при покупке

Но что-то совершенно непонятное творится у AMD, и в особенности у ее «придворных» изготовителей чипсетов, с поддержкой новых частот шин. Мало того, что сама AMD в этом вопросе хранит гордое молчание почти до последнего момента, так еще и производители чипсетов добавляют и убирают новые частоты в/из спецификаций, как Бог на душу положит. То у нас nForce2 был первым чипсетом, поддерживающим не только 333 МГц, но и 400 МГц FSB, а то уже 400 МГц официально вроде бы поддерживают только новые nForce 400/nForce 400 Ultra (последний из которых фактически является просто новой ревизией северного моста nForce2)…

У нас на плате вроде бы уже nForce2 Ultra 400, но… даже маркировка старая. Впрочем, процессор плата определяет уже правильно.

У VIA чипсет Apollo KT400 сначала, на момент анонса, поддерживает DDR400, потом -- нет (JEDEC отклонил ее стандартизацию), потом все-таки поддерживает (все заявили поддержку, а мы чем хуже?), а теперь вот снова не поддерживает (ну надо же как-то объяснять, чем от него KT400A отличается!). Учитывая, что FSB 400 МГц он тоже не поддерживает, становится немного непонятно -- откуда в его названии вообще взялась цифра «400»?! И что означает «600» в названии следующего чипсета этой компании? Очень не хотелось бы и в этой области сваливания в «3D-маразм» со всеми этими GeForce4 Ti 4800(SE) и Radeon 9100. Зачем SiS свой 746FX выпускала -- вроде бы было понятно… но ровно до тех пор, пока не оказалось, что и он со всеми новыми частотами FSB/DDR не совместим, в связи с чем был срочно выпущен 748, отличающийся от него исключительно тем, что поддерживает эту самую пресловутую 400 МГц FSB. Возникает впечатление, что то ли AMD сама толком не знает, что она собирается завтра выпускать, то ли она не информирует об этом своих партнеров, то ли они все вместе старательно делают вид, что каждая новая частота на них нисходит, как откровение свыше. Партнеры, однако, исправно клепают «новые» чипсеты, как горячие пирожки, сшибая деньгу с энтузиастов, которых немало среди пользователей платформы Socket .

5. Многопроцессорные системы. (SMP)

Представим как работает классическая SMP(Symmetric Multi-Processor)-система с точки зрения обычной логики. Нужно это хотя бы потому, что не так уж велико количество пользователей, хорошо себе представляющих как работает SMP-система, и в каких случаях от использования двух процессоров вместо одного можно ожидать реального увеличения быстродействия, а в каких -- нет. Итак, представим, что у нас есть, к примеру, два процессора (остановимся на этом, самом простом примере) вместо одного. Что это нам дает?

В общем-то… ничего. Потому что в дополнение к этому нам нужна еще и операционная система, умеющая эти два процессора задействовать. Система эта должна быть по определению многозадачной (иначе никакого смысла в наличии двух CPU просто быть не может), но кроме этого, ее ядро должно уметь распараллеливать вычисления на несколько CPU. Классическим примером многозадачной ОС, которая этого делать не умеет, являются все ОС от Microsoft, называемые обычно для краткости «Windows 9x» -- 95, 95OSR2, 98, 98SE, Me. Они просто-напросто не могут определить наличие более чем одного процессора в системе… ну и, собственно, дальше объяснять уже нечего :). Поддержкой SMP обладают ОС этого же производителя, построенные на ядре NT: Windows NT 4, Windows 2000, Windows XP. Также в силу своих корней, этой поддержкой обладают все ОС, основанные на идеологии Unix -- всевозможные Free- Net- BSD, коммерческие Unix (такие как Solaris, HP-UX, AIX), и многочисленные разновидности Linux. Да, к слову -- MS DOS многопроцессорность в общем случае тоже «не понимает» :).

Если же два процессора все же определились системой, то дальнейший механизм их задействования в общем-то (на «логическом», подчеркнем, уровне!) довольно-таки прост. Если в данный момент времени исполняется одно приложение -- то все ресурсы одного процессора будут отданы ему, второй же будет просто простаивать. Если приложений стало два -- второе будет отдано на исполнение второму CPU, так что по идее скорость выполнения первого уменьшиться не должна вообще никак. Это в примитиве. Однако на самом деле все сложнее. Для начала: исполняемое пользовательское приложение у нас может быть запущено всего одно, но количество процессов (т. е. фрагментов машинного кода, предназначенных для выполнения некой задачи) в многозадачной ОС всегда намного больше. Начнем с того, что сама ОС -- это тоже приложение… ну и не будем углубляться -- логика понятна. Поэтому на самом деле второй CPU способен немного «помочь» даже одиночной задаче, взяв на себя обслуживание процессов, порожденных операционной системой. Опять-таки, к слову об упрощениях -- именно так, идеально, разделить CPU между пользовательским приложением и ОС, конечно, все равно не получится, но, по крайней мере, процессор, занятый исполнением «полезной» задачи, будет меньше отвлекаться.

Кроме того, даже одно приложение может порождать потоки (threads), которые при наличии нескольких CPU могут исполняться на них по отдельности. Так, например, поступают почти все программы рендеринга -- они специально писались с учетом возможности работы на многопроцессорных системах. Поэтому в случае использования потоков выигрыш от SMP иногда довольно весом даже в «однозадачной» ситуации. По сути, поток отличается от процесса только двумя вещами -- он во-первых никогда не порождается пользователем (процесс может запустить как система, так и человек, в последнем случае процесс = приложение; появление потока инициируется исключительно запущенным процессом), и во-вторых -- поток умирает вместе с родительским процессом независимо от своего желания -- к примеру, если родительский процесс «глюкнул и упал» -- все порожденные им потоки ОС считает бесхозными и «прибивает» уже сама, автоматически.

Также не стоит забывать, что в классической SMP-системе оба процессора работают каждый со своим кэшем и набором регистров, но память у них общая. Поэтому если две задачи одновременно работают с ОЗУ, мешать они друг другу будут все равно, даже если CPU у каждой «свой собственный». Ну и наконец последнее: в реальности мы имеем дело не с одним, не с двумя, и даже не с тремя процессами. На приведенном коллаже (это действительно коллаж, потому что со скриншота Task Manager были удалены все пользовательские процессы, т. е. приложения, запускаемые «для работы») хорошо видно, что «голая» Windows XP, сама по себе, не запустив еще ни одного приложения, уже породила 12 процессов, причем многие из них к тому же еще и многопоточные, и общее количество потоков достигает двухсот восьми штук (!!!).

Поэтому рассчитывать на то, что нам удастся прийти к схеме «по собственному CPU на каждую задачу» совершенно не приходится, и переключаться между фрагментами кода процессоры будут все равно -- и физические, и виртуальные, и будь они хоть виртуальные в квадрате и по 10 штук на каждое физическое ядро :). Впрочем, на самом деле все не так грустно -- при грамотно написанном коде ничего в данный момент не делающий процесс (или поток) процессорного времени практически не занимает.

5.1 Многопроцессорные системы. Opteron

Очень интересная для нас ситуация сложилась с многопроцессорными системами на Opteron. С одной стороны, по распределению памяти -- ну совершенно типичная NUMA архитектура (с неравномерным доступом к памяти), даже спорить не о чем. Ибо время доступа к памяти будет зависеть от того, локальная это память, или нет -- а если не локальная, то какого именно процессора. С другой стороны, AMD буквально настаивает, что с точки зрения программной модели это SMP -- и ничего более. Даже название придумала -- SUMO. Как же разобраться в этом хитросплетении терминов?

Для начала давайте подумаем, чем же для программиста отличаются эти две программные модели? В общем случае, для того, чтобы программа исполнялась эффективно, необходимо следить за ее распределением в памяти в случае NUMA архитектуры, и нет такой необходимости в случае SMP архитектуры. Происходит это потому, что времена доступа к памяти различных иерархий в архитектуре NUMA обычно отличаются на порядки -- и, соответственно, неправильное размещение программы в памяти приводит к падению производительности в десятки раз. Если же время доступа к памяти для разных процессоров одинаково, или отличается несущественно -- то, с точки зрения программирования, мы имеем программную модель SMP. Она гораздо проще и практически весь софт для многопроцессорных архитектур х86 разработан именно для такой программной модели. Вот таким упрощенным образом можно вкратце описать различия между этими программными моделями. Естественно, различия на этом не заканчиваются.

Теперь, когда мы сформулировали критерий, надо каким-то образом добыть данные о временах доступа в многопроцессорных Opteron системах…. Нарисуем, что такое hop, чтобы не путаться с терминами:

Видно, что обращение к памяти называется hop-ом. При этом обращение к своей локальной памяти -- 0-hop. Обращение к памяти соседнего процессора, до которого надо путешествовать по шине Hyper Transport один раз -- 1-hop. То же самое, но к процессору, до которого два путешествия по Hyper Transport -- называется 2-hop.

А теперь посмотрим еще и на эти цифры (тестовая система -- Opteron 2 GHz, 128 bit memory DDR333, CL 2.5, Hyper Transport 6.4 GB/sec).

Время доступа для:

1. Однопроцессорной системы: порядка 45 нс

2. Двухпроцессорной системы: 0-hop -- 69 нс, 1-hop -- 117 нс.

3. 4-х процессорной системы: 0-hop -- 100 нс, 1-hop -- 118 нс, 2-hop -- 136 нс.

Теперь видно, что в случае, когда процессоров 4, все времена доступа подтягиваются к среднему времени около 93 нс для двухпроцессорной системы и около 118 нс для 4-х процессорной. Последняя цифра, кстати, соответствует времени доступа хорошего однопроцессорного чипсета. Но здесь у нас общее время складывается из собственно времени доступа в память и времени передачи его по шине Hyper Transport (один или два раза)! Так что подобный результат можно признать вполне удовлетворительным.

Теперь вернемся к нашему предыдущему вопросу -- так NUMA это, или SMP? Говоря формально, все-таки NUMA -- 40% разницы не дают возможности назвать эту модель памяти SMP. А можно ли пользоваться моделью для SMP? Можно. Данная разница, хоть и заметна, под нагрузкой будет сглажена -- у нас нет «твердых» цифр, но судя по некоторым данным, при нагрузке к этим временам надо добавить порядка 40 нс… Тогда эта разница превращается в 140 нс против 180 нс -- а это уже другое соотношение. Таким образом, можно считать, что название SMP для данной системы вполне можно употреблять -- и, соответственно, вполне можно программировать как для «классического SMP», без оглядки на действительную архитектуру системы (NUMA). Впрочем, мы не исключаем, что в дальнейшем ОС будут отслеживать распределение памяти в подобных системах -- благодаря этому можно будет рассчитывать еще процентов на 10% прироста быстродействия. Почти наверняка найдется некоторое количество пользователей, которые привыкли выжимать всю производительность из систем. Опять -- же, напомним, что сама AMD для наименования этой «переходной» архитектуры использует термин SUMO.

Теперь напомним вкратце, каково устройство многопроцессорных систем на архитектуре Hammer.

Система на 2 процессорах:

Система на 2 процессорах:

Система на 4-х процессорах:

Кстати, если сделать не 4 канала ввода/вывода, а 2 -- то две высвободившиеся связи Hyper Transport можно соединить друг с другом, вот так:

Тогда средневзвешенная скорость памяти составит 19,2 GB/sec вместо 12,8 GB/sec в классическом варианте, а средний «диаметр» системы (средняя длина пересылок данных в hop-ах) составит 1.17 hops, а не 1.33. В свою очередь, это приведет еще и к снижению задержек. Автору подобный вариант даже больше нравится, нежели классический симметричный -- редко когда в действительности для ввода/вывода необходимо больше, чем 2 канала Hyper Transport суммарной производительностью более 12 гигабайт в секунду. А поэтому такой вариант будет даже более интересен.

Кроме всего прочего, архитектура Hammer позволяет строить и 8-ми процессорные системы. При этом у крайних 4-х процессоров по одной шине Hyper Transport отдано для ввода/вывода, а у центральных -- все три задействованы в качестве межпроцессорных связей. Правда, надо отметить, что, по-видимому, задержки в такой системе сильно увеличатся -- впрочем, поскольку точные данные у автора отсутствуют, все сказанное суть только наше предположение. «Классический» вариант такой системы выглядит так:

Теперь применим такую же идею -- пару связей Hyper Transport, задействованных для ввода/вывода, соединим друг с другом. Задействуем диагональные крайние процессоры. Получаем средневзвешенную скорость памяти 32 GB/sec вместо 25,6 GB/sec в классическом варианте, а средний «диаметр» системы 1.64 hops, а не 1.71. Приятная прибавка, не правда ли?

Правда, есть некоторые сведения, что все три шины Hyper Transport не могут быть когерентными -- только две. Если так, то в 4-х процессорной архитектуре несимметричный вариант невозможен, а в 8-ми процессорной не будет связей между центральными процессорами, что резко увеличит среднее число hop-ов между процессорами, и, как следствие, сильно увеличит латентность. Автор надеется, что этот пессимистический слух не оправдается -- к тому же в других источниках прямо указано, что один из контроллеров может переключаться между режимами coherent и non-coherent Hyper Transport.

Нельзя не заметить, что 4-х и 8-ми процессорным архитектурам отчаянно не хватает пропускной способности именно межпроцессорных связей -- и с ускорением шины Hyper Transport производительность многопроцессорных систем сделает новый рывок. Но это дело уже будущих модификаций Hammer -- мы не испытываем ни малейшего сомнения, что данная архитектура еще неоднократно будет модифицироваться и улучшаться. Как очевидный вариант, к тому же косвенно подтвержденный AMD -- следующая модификация ядра Hammer будет поддерживать память DDRII (это, кстати, по оценкам автора, должно дать довольно значительный прирост производительности). Так что есть твердая уверенность в том, что данная статья об ожидаемых процессорах AMD -- не последняя :-). Теперь, когда многопроцессорная архитектура AMD озвучена, дело за рынком -- дальше именно он решит успешность/неуспех архитектуры.

Интересно, а можно ли сделать больше, нежели 8 процессоров? Оказывается, можно! Правда, теперь не удастся обойтись средствами только процессоров, необходимы еще и коммутаторы Hyper Transport. При их помощи систему можно сделать поистине гигантской…. Впрочем, судите сами:

Подобные Hyper Transport switch уже существуют и доступны (на четыре шины). Объявлены также коммутаторы на 8 шин. Осталось понять, что это за Interconnect Fabric…. Но стоп -- пора бы и остановиться :-). Тем более, что здесь самое время вспомнить, что не кто иная, как компания Cray объявила сравнительно недавно о том, что она будет строить суперкомпьютер производительностью порядка 36 TFlops на процессорах Opteron (с возможностью увеличения производительности до 54 TFlops позднее). Интересно, будет ли архитектура суперкомпьютера похожа на эту картинку? :-) Довольно долгое время мы сможем об этом только догадываться. Но возможности архитектуры действительно впечатляют. Кроме того, ходят слухи, которые автор не берется ни подтвердить, ни опровергнуть. Но слухи интересные: говорят, что для фирмы Cray AMD будет производить специальную версию Opteron -- с 4-мя линками Hyper Transport. Процессоры вроде бы будут составлять трехмерную сеть. Собственно, принципиальных сложностей для добавления 4-го линка вроде бы нет -- но тогда непонятно, в каком же форм-факторе будут производиться эти процессоры. Фото 4-х процессорной материнской платы с Opteron-ами.

6. Советы по выбору процессора Intel и AMD

Кодексы даты.

Просите у продавца кодексы даты прежде, чем Вы купите процессор. Все ЦПУ имеют дату выпуска, которая проставляется на корпусе. Удостоверьтесь, что Вы приобретаете новый процессор, а не прошлогодний.

Например A80486DX33 ( by Intel )

V74400223

V - первый символ, код завода (plant code);

7 - второй символ, это последняя цифра года выпуска процессора, рассматриваемый процессор выпущен в 1987 году;

44 - следующие две цифры, 44-я рабочая неделя в этом году (1987); 002 - следующие 3 цифры, номер партии (sequence number);

3 - код замены (change code).

Hапример E6 9433 DPD (on AMD CPUs)

E6 - версия реализации (version release);

9433 - выпущен на 33 рабочей неделе 1994 года;

DPD - шифр серии (wafer number);

Версия процессора.

Просите данные о версии процессора. Сравните версию процессора, который Вам предлагают с процессорами Intel 800-468-3548 или AMD 800-222-9323, так как более ранние версии процессоров имеют ошибки и различные дефекты.

Demo-образцы.

Никогда не платите полную цену за demo-образцы. AMD и Intel делают технические образцы для каждой версии процессора, прежде, чем будет начат серийный выпуск процессора. Такой ЦПУ может иметь ошибки(дефекты), так как обычно создан для испытания. Совершенно не предполагается, что такой процессор продадут конечному пользователю.

Hапример:

Нормальная версия (normal version): i486DX-33:

Разработка образцов (engineering samples): i486DX-33 E

Перемаркированные процессоры.

Перемаркированные процессоры (remaked CPUs) - это процессоры, которые разгоняют сильнее, чем оригинальные для более высокой цены и прибыли. Эти действия считаются незаконными. Использование такого ЦПУ всегда рискованно. Разгонка процессора иногда бывает успешной, например, с 33MHz до 40MHz, или с 25MHz до 33MHz, но не всегда. Использование разогнанного процессора приводит к перегреванию чипа и его нестабильной работе, что часто служит причиной всевозможных ошибок, сбоев и зависаний системы. Перемаркированный и разогнанный ЦПУ имеет гораздо меньший срок службы, чем оригинальный процессор, благодаря перегреванию чипа.

7. Другие фирмы-производители и некоторые процессоры этих фирм

7.1 Cyrix

6x86 - наименование процессоров Cyrix. Для оценки производительности относительно процессора Pentium использовался P-Rating, показывающий частоту, на которой пришлось бы работать процессору Pentium для достижения такой же производительности. P-Rating 6x86 составлял от 120 до 200 МГц. Кэш первого уровня - 16 Кбайт. Частота шины процессора - от 50 до 75 МГц. Разъем - Socket 5 и Socket 7.

M1 - то же, что и 6x86.

MediaGX - ответвление в семействе процессоров Cyrix. Первый процессор, сделанный по идеологии PC-on-a-chip. К ядру 5х86 были добавлены контроллеры памяти и PCI, в чип интегрирован видеоускоритель с кадровым буфером в основной памяти PC. В последних моделях используется ядро 6x86. В чипе-компаньоне реализован мост PCI-ISA и интегрирован звук. PR-рейтинг от 180 до 233 МГц, кэш-память L1 - 16 Кбайт. Производился по техпроцессу 0,5 мкм.

6x86MX - переработанный с целью достижения большей производительности вариант 6x86. Кэш-память L1 - до 64 Кбайт. В состав архитектуры ядра был добавлен блок MMX. Появилась поддержка раздельного питания. Частота шины процессора - от 60 до 75 МГц. PR-рейтинг - от 166 до 266 МГц. Процессоры 6х86MX делала и компания IBM. Их изделия 6х86MX имели рейтинг от 166 до 333 и были рассчитаны на частоту шину 66, 75, 83 МГц. Позднее, по маркетинговым соображениям, Cyrix переименовал свои процессоры в MII, а IBM до конца сотрудничества продавала их под маркой 6x86MX.

MII - последний процессор Cyrix, начал производиться в марте 1998 года. Кэш-память L1 - 64 Кбайт (единый), L2, как обычно для Socket 7, находится на материнской плате и имеет объем от 512 Кбайт до 2 Мбайт, работая на частоте системной шины. Поддерживаемые наборы инструкций - MMX. Использует PR-рейтинг. При производстве применялся техпроцесс 0,25 мкм.

Cayenne - кодовое наименование ядра, используемого в Gobi и MediaPC.

Gobi (MII+) - процессор, рассчитанный на платформу Socket 370. Поддерживаемые наборы инструкций - MMX, 3D Now!. Значительно переработан блок операций с числами с плавающей запятой. Кэш-память L1 - 64 Кбайт, кэш-память L2 - 256 Кбайт на чипе, работающие на полной частоте ядра процессора.

7.2 Rise

mP6 - первые процессоры компании Rise. Предназначены для ноутбуков, использующих Socket 7. Отличаются очень малым тепловыделением. Кэш-память L1 - 16 Кбайт (по 8 Кбайт для данных и инструкций), L2 - от 512 Кбайт до 2 Мбайт, расположена на материнской плате, работает на частоте шины процессора. Поддерживается дополнительный набор инструкций MMX. При оценке производительности своих процессоров Rise, как и Cyrix, использует PR-рейтинг, составляющий от 166 до 366 МГц.

mP6 II - процессоры, отличающиеся от своих предшественников mP6 тем, что в чип интегрирована кэш-память L2 объемом 256 Кбайт. Была обещана поддержка SSE, производительность от PR-200 и выше. Однако в августе 1999 было объявлено об отмене планов по выходу процессора из-за значительного удорожания после добавления L2 в чип.

Tiger - mP6 II для платформы Socket 370. Кэш-память L1 - 16 Кбайт, L2 - 256 Кбайт, работающая на тактовой частоте ядра процессора. Выпуск отменен.

7.3 Centaur

Winchip С6 - процессоры, ориентированные на дешевые ПК. По производительности уступают своим конкурентам. Шина - 60, 66, 75 МГц, платформа - Socket 7. Технология - 0,35 мкм. Процессоры поддерживают набор инструкций MMX. Вышел в октябре 1997 г., работал на частотах от 180 до 240 МГц.

Winchip-2 - процессоры, производимые по техпроцессу 0,25 мкм. Кэш-память L1 - 64 Кбайт (по 32 Кбайт для инструкций и данных), кэш-память L2 - 512-2048 Кбайт находится на материнской плате. Процессорами поддерживаются наборы инструкций MMX и 3DNow!. Платформа - Socket 7. От Winchip С6 отличаются значительно ускорившейся работой с числами с плавающей запятой. Появилась поддержка частоты системной шины 100 МГц. Первый процессор появился в ноябре 1998 года, частоты от 200 до 300 МГц.

Winchip-2A - процессоры Winchip-2 с исправленной ошибкой в реализации 3DNow!.

Winchip-3 - процессоры с кэш-памятью L1 объемом 64 Кбайт (по 32 Кбайт для инструкций и данных) и кэш-памятью L2 объемом 128 Кбайт на чипе, работающей на частоте ядра процессора. Кэш-память L3 - 512-2048 Кбайт, расположена на материнской плате. Планировались к выходу в первой половине 1999 г. с частотой 300 МГц и выше. В связи с покупкой Centaur фирмой VIA выход процессоров был отменен.

Winchip-4 - процессоры, выпуск которых планировался в конце 1999 г. Частоты - 400-500 МГц, а при переходе на 0,18 мкм техпроцесс - 500-700 МГц.

7.4 VIA

Samuel - кодовое наименование процессоров и ядра. Основой послужило ядро Winchip-4, доставшееся VIA в наследство от Centaur. Работают на частотах 500-700 МГц. Производятся National Semiconductors и TSMC с использованием 0,18 мкм техпроцесса. Процессоры используют набор SIMD 3D Now!. Форм-фактор - Socket-370. Кэш-память L1 - 128 Кбайт. Получили наименование Cyrix III. Тактовая частота ядра - 500-667 МГц.

C5A - то же, что и Samuel.

Samuel 2 - кодовое наименование процессоров и ядра, разработанных группой Centaur. Кэш-память L2 объемом 64 Кбайт. Тактовая частота ядра - 667-800+ МГц. Частота шины процессора 100/133 МГц, форм-фактор - Socket 370.

C5B - то же, что и Samuel 2.

Matthew - кодовое наименование интегрированных процессоров. Имеют в своем составе ядро Samuel2 с интегрированным видео и компонентами North Bridge.

Ezra - кодовое наименование процессоров и ядра. Совместная разработка групп Cyrix и Centaur. Первое действительно новое ядро VIA. Процессоры с поддержкой SSE. Кэш-память L1 - 128 Кбайт, кэш-память L2 - 64 Кбайта. Технология - 0,15 мкм c переходом на 0,13 мкм. Тактовая частота ядра - 750 МГц с последующим ростом выше 1 ГГц. TSMC подтвердила информацию о том, что она изготовила процессор Ezra с частотой 1 ГГц.

C5C - то же, что и Ezra.

Ezra-T - кодовое наименование процессоров и ядра. Совместимость по уровню сигналов с Tualatin, что позволяет их использовать в материнских платах с чипсетами, созданными под Tualatin. Технологический процесс 0,13 мкм, алюминиевые соединения. Кэш память L1 - 128 Кбайт, L2 - 64 Кбайт. Имеют меньшее, по сравнению с Ezra, энергопотребление. Поддержка MMX, 3D Now!. Тактовая частота ядра - от 800 МГц (6х133 МГц). Выпуск запланирован на конец 2001 г.

Nehemiah - кодовое наименование процессоров и ядра. Рассчитаны на работу при частотах 1,2+ ГГц. Кэш-память L1 - 128 Кбайт, кэш-память L2 - 256 Кбайт. Будут поддерживать инструкции Streaming SIMD Extensions (SSE) и 3DNow!. Конвейер в 17 стадий, напряжение питания ядра 1,2 В, техпроцесс 0,13 мкм с использованием медных соединений, площадь кристалла - 72 кв. мм. Выход запланирован на 2002 г.

C5X - то же, что и Nehemiah.

Esther - кодовое наименование процессоров и ядра. Кэш-память L1 - 128 Кбайт, L2 - 256 Кбайт. Конвейер 17 ступеней. Тактовая частота ядра 2 ГГц. Запланирован на вторую половину 2002 года.

C5Y - то же, что и Esther.

7.5 SiS

550 - базовая модель процессоров серии 550. Основой послужило ядро mP6 от Rise с интегрированным видео и компонентами чипсета.

551 - модель процессора, созданная на основе SiS 550, с поддержкой флеш-карт и шифрования.

552 - модель процессора, созданная на основе SiS 551, с поддержкой аудио- и видеозахвата.

7.6 Transmeta

Crusoe - линейка процессоров, ориентированных на мобильные системы. Состоит из моделей TM3200 (L2=0), TM5400 (L2=256 Кбайт), TM5500 (L2=256 Кбайт), TM5600 (L2=512 Кбайт), TM5800 (L2=512 Кбайт), имеющих в своем составе интегрированные компоненты North Bridge. Характеризуются низким энергопотреблением.

Astro - кодовое имя высокопроизводительных процессоров со сверхнизким уровнем энергопотребления. Рабочая частота достигнет 1,4 ГГц при 0,5 Вт. В основе 256-разрядная архитектура. Выпуск моделей запланирован на 2002 г.

7.7 Compaq

Alpha EV68 - кодовое имя высокопроизводительных процессоров с архитектурой, отличной от традиционной х86. Техпроцесс 0,18 мкм. Базируется на ядре Alpha EV6. Более 15 млн. транзисторов. Модель 1 ГГц объявлена в 2001 г.

Alpha EV7 - кодовое имя высокопроизводительных процессоров. Техпроцесс 0,18 мкм с использованием медных соединений. Базируется на ядре Alpha EV6. Более 100 млн. транзисторов, напряжение питания ядра 1,5 В, мощность тепловыделения 100 Вт, частота 1,2-1,3 ГГц, до 1,75 Мбайт L2, корпус с 1439 контактами. Возможно использование интегрированного контроллера памяти. Выпуск моделей запланирован на 2002 г. В связи с покупкой фирмой Intel в 2001 г. подразделений, патентов и технологий, связанных с процессорами Alpha EVxx, процессоры Alpha EV7 или Alpha EV8, возможно, будут последними разработками этого направления.

Alpha EV8 - кодовое имя высокопроизводительных процессоров с архитектурой, отличной от традиционной х86. Техпроцесс 0,13 мкм с использованием SOI. Более 250 млн. транзисторов, суперскалярное ядро (до 8 инструкций за 1 такт), мощность тепловыделения - 150 Вт, частота от 1,4 ГГц, кэш L2 будет составлять ориентировочно 2 Мбайт, корпус с 1800 контактами. Выпуск моделей запланирован на 2004 г. Возможно, последняя разработка этого направления.

Alpha EV9 - кодовое имя высокопроизводительных процессоров с архитектурой, отличной от традиционной х86. Техпроцесс 0,10 мкм, 500 млн. транзисторов, частота 2-3 ГГц. Выпуск моделей был запланирован на 2006 г.

Alpha EV10 - кодовое имя высокопроизводительных процессоров с архитектурой, отличной от традиционной х86. Техпроцесс 0,07 мкм, 1,5 млрд транзисторов, частота 3-4 ГГц. Выпуск моделей был запланирован на 2008 г.

QuickBlade - серверная архитектура со сверхвысокой плотностью монтажа. В основе данной архитектуры запланировано использование процессоров Intel со сверхнизким напряжением питания.

8. Разгон процессора или overclocking

Все ниже написанное приводится только в общеобразовательных целях. Автор не несет никакой ответственности за повреждения чего (кого) бы то ни было в результате действий, о которых идет речь в этом материале.

Что нужно для разгона?

Во-первых, тщательно изучить инструкцию к имеющемуся "железу". Найти перемычки/джамперы/пункты меню BIOS, отвечающие за частоту FSB, шины памяти, коэффициента умножения, делителя для PCI и AGP. По вкусу - сходить на сайт производителя за новой версией прошивки для flashBIOS. Собственно, все - можно менять параметры в разумных пределах. Не забывая об охлаждении. Ситуация с процессорами AMD заслуживает посвящению ей отдельного пункта.

Всем ли поможет overclocking?

Не обязательно. Это зависит от конкретных программ, с которыми вы работаете. Например, для графических пакетов (особенно для 3DStudio или Maya), скорее всего, будет не хватать памяти (на 64 Mбайт, может, запускаться и будет, но работать будет невозможно, 128 Mбайт - минимальный объем для таких программ), чем тактовой частоты CPU, а для игр важнее, какой 3D-ускоритель присутствует в системе (хотя слабый процессор не сможет загрузить полностью работой современную видеокарту). Но при разгоне системной шины повышается скорость работы прочих компонентов, так что иногда это неплохо помогает.

Что может случиться с системой при разгоне?

Главный враг при разгоне компьютера - это температура. Среднестатистический процессор (не разогнанный) обычно нагревается до 40-50 градусов C, если вы не играете в Quake III . При сильном повышении частоты (особенно если при этом увеличить напряжение) температура может повыситься до 60 и больше градусов, но если учесть, что максимальная t лежит в пределах 70-90, то это еще терпимо. Так или иначе, часто подвохов следует ждать от прочих компонентов. Например, стандартные делители для шины PCI - 2, 3 и 4 (66, 100 и 133 МГц на системной шине соответственно), при установке 75 МГц (практически безболезненно переносится любым процессором) частота PCI возрастает до 37,5 - в принципе, особых возражений нет. Но вот при 83 MГц на FSB она увеличивается до 41,5, что спокойно воспринимают далеко не все платы (особенно если их много). Также возрастает частота AGP - некоторые видеокарты могут не заработать. Не стоит забывать, что встроенный IDE-контроллер тоже "висит" на PCI-bus, так что возможна потеря данных на жестком диске. Следует учесть, что "не все частоты одинаково полезны". Так, например, разгон Celeron до FSB 100 МГц на плате с чипсетом ВХ есть "личное дело процессора" (если память РС100 или лучше). В то же время, если на такой же плате разгонять Р3 до FSB 150 МГц, повышенная нагрузка ляжет на все узлы системы, ибо абсолютно все они будут работать в нестандартном режиме. В последнем случае утверждать что-либо о стабильности работы невозможно.


Подобные документы

  • История развития фирмы INTEL. Развитие и выпуск процессоров INTEL. Обзор технологии ATOM. Обзор процессоров. Материнская плата Gigabyte GC230D. Ноутбуки на базе процессоров INTEL ATOM. Ноутбук MSI Wind U100-024RU, ASUS Eee 1000H, Acer One AOA 150-Bb.

    курсовая работа [233,0 K], добавлен 24.11.2008

  • История и перспективы развития производства процессоров компьютеров. Основы работы центрального процессора. Характеристика многоядерных процессоров. Ведущие производители: Intel и AMD, их планы по выпуску новых процессоров. Советы по выбору CPU.

    курсовая работа [2,8 M], добавлен 03.11.2011

  • Гнездовой или щелевой разъём центрального процессора для облегчения его установки. Стандартный слот типа Socket. История изменения и характеристики всех сокетов, используемых для установки процессоров Intel. Разработка новых интерфейсов компании Intel.

    реферат [202,4 K], добавлен 01.10.2009

  • Стратегия развития процессоров Intel. Структурная организация современных универсальных микропроцессоров. Особенности многоядерной процессорной микроархитектуры Intel Core, Intel Nehalem, Intel Westmere. Серверные платформы Intel c использованием Xeon.

    реферат [36,5 K], добавлен 07.01.2015

  • История создания и развития компьютерных процессоров Intel. Изучение архитектурного строения процессоров Intel Core, их ядра и кэш-память. Характеристика энергопотребления, производительности и систем управления питанием процессоров модельного рядя Core.

    контрольная работа [7,6 M], добавлен 17.05.2013

  • История Intel, выпуск оперативной памяти для компьютера. Главные особенности построения бренда компании. Модели процессоров, выпускаемые корпорацией Intel. Виды подложек, используемых при производстве микросхем. Краткая история процессоров Pentium.

    реферат [28,8 K], добавлен 13.02.2013

  • История развития центрального процессора. Основные проблемы создания многоядерных процессоров. Проектирование микропроцессорной системы на базе процессора Intel 8080. Разработка принципиальной схемы и блок-схемы алгоритма работы микропроцессорной системы.

    курсовая работа [467,6 K], добавлен 11.05.2014

  • История развития, устройство и назначение центральных процессоров Intel. Особенности архитектуры различных поколений ЦП. Характеристики и общая схема чипсетов материнских плат разных серий. Повышение их функциональности и уровня производительности.

    реферат [121,4 K], добавлен 08.11.2015

  • Управление взаимодействием всех устройств ЭВМ. История создания и развития производства процессора. Структура центрального процессора. Регистры общего назначения. Обозначения популярных моделей процессоров Intel и AMD. Команды центрального процессора.

    реферат [111,2 K], добавлен 25.02.2015

  • Принцип работы ядра процессора, типы архитектур ядер операционных систем. Сокет(Socket), кэш-память, контроллер ОЗУ, северный мост. Внутренняя архитектура процессоров Intel и AMD: расшифровка названий, технологии процессоров, сравнение производительности.

    реферат [214,9 K], добавлен 05.05.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.