Архітектура та порівняльна характеристика на основі суперкомп`ютерів СRAY

Cуперкомп'ютери виробництва Cray Research. Векторна обчислювальна система: регістри та арифметико-логічний пристрій. Підходи до архітектури засобів векторної обробки. Архітектура комп’ютерів Cray. Реконфігурований блэйд-сервер. Програмне забезпечення.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык украинский
Дата добавления 18.05.2012
Размер файла 696,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Криворізький технічний університет

Кафедра комп'ютерних систем та мереж

Курсова робота

з дисципліни Комп'ютерні системи

на тему: Архітектура та порівняльна характеристика на основі суперкомп'ютерів СRAY

Виконав: ст. гр. КСМ-07-2

Хорощук А.М.

Прийняв: зав. кафедри КСМ

Купін А. І.

Кривий Ріг

2011

Вступ

Тема курсової роботи - Архітектура та порівняльна характеристика на основі суперкомп'ютерів СRAY.

Одними з найбільш відомих представників по праву є суперкомп'ютери виробництва Cray Research (нині - Cray Inc.). Вони дозволили людині вчинити безліч дивовижних наукових досягнень, трохи відкрити завіси таємниць і секретів природи. Cray ознаменував початок суперкомп'ютерної ери, став символом успішності компаній, що дістали його, і прикладом для наслідування серед виробників-конкурентів.

Термін суперобчислення з'явився ще 20-х роках минулого століття, а термін супер-ЕОМ в 60-х роках. Але отримав широке поширення багато в чому завдяки Сеймуру Крею і його супер-ЕОМ Cray - 1, Cray - 2.

Cray Research, Inc. була заснована в 1972 році проектувальником комп'ютерів Сеймуром Креем.

Cray - 1 прийнято вважати одним з перших супер-ЕОМ. Він з'явився в 1974 році. У процесорах комп'ютера був величезний, на ті часи, набір регістрів. Які розділялися на групи. Кожна група мало своє власне функціональне призначення. Блок адресних регістрів який відповідав за адресацію в пам'яті ЕОМ. Блок векторних регістрів, блок скалярних регістрів. Продуктивність супер-ЕОМ складала 180 мільйонів операцій в секунду над числами з плаваючою точкою. Використовувалися 32 розрядних команди. Це враховуючи те, що сучасники цього комп'ютера тільки починали переходити від 8 розрядних команд до 16 розрядних.

Розділ 1. Архітектура на основі суперкомп'ютерів СRAY

У векторній обчислювальній системі обов'язково є векторний процесор, що містить векторні регістри для даних у форматі з плаваючою комою і векторний арифметико-логічний пристрій, оброблювальний дані в цьому форматі. Векторні регістри і векторний арифметико-логічний пристрій, по суті справи, є групою звичайних регістрів і звичайних арифметико-логічних пристроїв. Кількість пристроїв в групі визначає максимальну розмірність векторів, над якими векторний процесор може виконувати дії. В силу обмежень по вартості системи ця кількість зазвичай не перевищує 64.

Векторний процесор

Векторний процесор - це процесор, в якому операндами деяких команд можуть виступати впорядковані масиви даних - вектори. Векторний процесор може бути реалізований в двох варіантах:

- додатковий блок до універсальної ВС;

- основа самостійної ВС.

Розглянемо можливі підходи до архітектури засобів векторної обробки. Найбільш поширені з них зводяться до трьох груп:

- конвеєрне АЛУ;

- масив АЛУ;

- масив процесорних елементів.

Останній варіант - один з випадків багатопроцесорної системи відомою як матрична ВС. Поняття векторного процесора має відношення до двох перших груп, причому, як правило, до першої.

Рисунок 1.1- Масив процесорних елементів

У варіанті з конвеєрним АЛУ (ліворуч) обробка елементів векторів здійснюється конвеєрним АЛУ для чисел з плаваючою комою (ПЗ). Операції з числами у формі з ПЗ досить складні, але піддаються розбиттю на окремі кроки. Так складання двох чисел може бути зведене до чотирьох етапів:

- порівнянню порядків;

- зрушенню мантиси меншого з чисел;

- складанню мантис;

- нормалізації результату.

Кожен етап може бути реалізований за допомогою окремого ступеня конвеєрного АЛУ. Черговий елемент вектору подається на вхід конвеєра, як тільки звільняється перший ступінь. Ясно, що такий варіант цілком годиться для обробки векторів. Одночасні операції над елементами векторів можна проводити і за допомогою декількох паралельно використовуваних АЛУ, кожне з яких відповідає за одну пару елементів.

Рисунок 1.2 - Операції над елементами векторів

Векторні регістри містять компоненти векторних операндів. По команді з єдиного облаштування управління вони поступають у векторний арифметико-логічний пристрій, який забезпечує виконання однієї і тієї ж заданої операції над усіма компонентами векторів. Вектор-результат поступає у векторний регістр.

Векторний процесор - це процесор, в якому операндами деяких команд можуть виступати впорядковані масиви даних - вектори. Відрізняється від скалярних процесорів, які можуть працювати тільки з одним операндом в одиницю часу. Абсолютна більшість процесорів є скалярними або близькими до них. Векторні процесори були поширені у сфері наукових обчислень, де вони були основою більшості суперкомп'ютерів починаючи з 1980-х до 1990-х. Але різке збільшення продуктивності і активна розробка нових процесорів привели до витіснення векторних процесорів з сфери повсякденних.

Векторні процесори не отримали широкого поширення із-за високої вартості організації векторного арифметико-логічного пристрою.

Прийнятнішими за вартістю виявилися векторно-конвеєрні обчислювальні системи у яких векторні регістри комбінуються з конвеєрним арифметико-логічним пристроєм. У таких системах розмірності векторів були істотно збільшені. Видача облаштуванням управління єдиної команди, яка має бути виконана над групою даних і їх безперебійна подача на конвеєр з векторних регістрів забезпечують постійне завантаження конвеєра і його високу продуктивність. Типовим представником векторно-конвеєрних систем є суперкомп'ютер Сгау-1.

Архітектура комп'ютерів Cray

Cray - 1 прийнято вважати одним з перших супер-ЕОМ. Він з'явився в 1974 році. У процесорах комп'ютера був величезний, на ті часи, набір регістрів. Які розділялися на групи. Кожна група мало своє власне функціональне призначення. Блок адресних регістрів який відповідав за адресацію в пам'яті ЕОМ. Блок векторних регістрів, блок скалярних регістрів. Продуктивність супер-ЕОМ складала 180 мільйонів операцій в секунду над числами з плаваючою точкою. Використовувалися 32 розрядних команди. Це враховуючи те, що сучасники цього комп'ютера тільки починали переходити від 8 розрядних команд до 16 розрядних.

Історія суперкомп'ютерів нерозривно пов'язана з ім'ям Сеймора Крея (Seymour Cray, 1925-1996), відомого передусім як засновника компанії Cray, лідера американського ринку суперкомп'ютерів.

Перший транзисторний суперкомп'ютер CDC 1604 Крей створив в 1958 р., очолюючи компанію Control Data Corporation (CDC), засновану їм з Уильямсом Норрисом роком раніше. Потім він приступив до проектування паралельного CDC 6600, здатного працювати з 60-розрядними словами. Через розбіжності зі своїм партнером Крей покинув CDC і в 1972 р. заснував фірму Cray Research. На той час в НАСА був встановлений 64-розрядний ILLIAC IV корпорації Burroughs, що показував 20 млн. операцій в секунду. Він успішно діяв до 1981 р.

Через чотири роки після організації Cray Research на світ з'явилася найшвидша у світі машина Cray - 1 з продуктивністю 160 млн. оп./с і 8 Мб ОЗУ. Схожі характеристики мав і CYBER 205, що випускався колишніми партнерами Крея в корпорації CDC. Але в Cray - 1 уперше була реалізована концепція векторних обчислень (одночасне виконання однотипної операції над великим набором даних) і архітектура RISC. Cray - 1 обійшлася Лос-Аламосской лабораторії США в 8,8 млн. дол.

Cray - 2, векторний суперкомп'ютер, що випускається компанією Cray Research з 1985. Він став найшвидшою машиною свого часу, обігнавши по продуктивності інший суперкомп'ютер Cray X - MP. Пікова продуктивність Cray - 2 складала 1.9 GFLOPS.

Поєднання двох видів конвеєрів в обчислювальній системі CRAY - 3 забезпечує максимальну пікову продуктивність процесора, рівну 12 Gflops (float point operation per second). Цікаво, що Cray - 3 моделювалася на комп'ютерах Apple, а компанія Apple в той же час купила комп'ютер Cray для проектування дизайну своїх ПК.

До кінця 80-х років холодна війна закінчилася і фінансування військових проектів, нерозривно пов'язаних з суперкомп'ютерами, в США тимчасово скоротилося. Лідерство на світовому ринку відразу ж захопили енергійні японські фірми - Fujitsu, Hitachi і NEC. Запропонована ними комерційна концепція розподілених обчислень в середовищі з безлічі дешевих мікропроцесорів (нині визнана в Японії стратегічній) швидко себе виправдала.

В умовах відсутності державної підтримки в 1995 р. Cray випробувала серйозні фінансові проблеми і незабаром об'єдналася з Silicon Graphics (SGI). Ніколи Сеймор Крей, що не здавався, заснував іншу компанію - SRC Computer Labs, в якій і продовжив створення суперкомп'ютерів. Вже тоді він передбачав, що майбутнє високопродуктивних обчислень - за молекулярними комп'ютерами і наномашинами. Проте в 1996 р. у віці 71 року батько суперкомп'ютерів, як охрестила Крея пресу, трагічно загинув в автомобільній аварії.

У 1995 р. два токійські університети продемонстрували спеціалізований (призначений для моделювання завдань астрофізики) суперкомп'ютер GRAPE - 4, зібраний з 1692 мікропроцесорів і такий, що обійшовся всього в 2 млн. дол. Він першим у світі здолав поріг в 1 трлн. оп./с з результатом 1,08 Тфлопс. Через 15 місяців Cray Research повідомила, що модель Cray T3E - 900, що налічувала 2048 процесорів, побила рекорд японців і досягла 1,8 Тфлопс. На той час результат NEC SX - 4 складав 1 Тфлопс, Hitachi SR2201 - 0,6 Тфлопс, а Fujitsu Siemens VPP700 - 0,5 Тфлопс.

В 1997 р. з'явилися повідомлення про проект моделювання роботи ядерної зброї (ASCI) в Лос-Аламосской лабораторії, фінансованому міністерством енергетики США. Комплекс ASCI Red з 9632 процесорів Pentium Pro, створений Intel, показав продуктивність спочатку 1,8 Тфлопс, а потім 3,2 Тфлопс.

В 2002 р. у рамках ASCI часом вдавалося добитися швидкості обробки інформації 10,2 Тфлопс, а проект пошуку позаземних цивілізацій, що об'єднує сотні тисяч користувачів ПК, що надають ресурси своїх комп'ютерів для розподілених обчислень, досяг унікальної пікової продуктивності 92 Тфлопс (втім, подібна схема обчислень дозволяє вирішувати лише обмежений круг завдань, що допускають просте розпаралелювання). 14 листопада фірма Cray анонсувала рішення Cray X1 з характеристиками 52,4 Тфлопс і 65,5 Тб ОЗУ. Його стартова ціна починається з 2,5 млн. дол. Цим комплексом відразу зацікавився іспанський метеорологічний центр. А наступного дня був опублікований ювілейний, 20-й список Top500 (http://www.top500.org), в який входять системи, що офіційно показали максимальну продуктивність. Його очолила комп'ютерна модель Землі (Earth Simulator) з результатом 35,86 Тфлопс (5120 процесорів), створена однойменним японським центром і NEC. На другому - четвертому місцях зі значним відставанням розташувалися рішення ASCI (7,7; 7,7 і 7,2 Тфлопс). Вони експлуатуються Лос-Аламоською лабораторією, а створені Hewlett - Packard (перші два налічують по 4096 процесорів) і IBM (8192 процесори).

Поріг входження в першу десятку склав 3,2 Тфлопс. Чотири системи з десяти належать Hewlett - Packard (дві в проекті ASCI і по одній в Піттсбургском

суперкомп'ютерному центрі і Міністерстві атомної енергії Франції), три - IBM (ASCI, Англійський центр високопродуктивних обчислень і Національний центр атмосферних досліджень США), по одній - NEC, Linux NetworX (Ливерморская лабораторія) і HPTi (Центр пророцтв погоди США). 47 рішень з Top 500 здолали в тісті Linpack поріг в 1 Тфлопс (півроку тому таких систем було всього 23). Система ASCI Red, що постійно перебувала в першій десятці Top 500 з 1997 р. і що сім разів займала перше місце (результати Top 500 підводяться двічі в рік), опустилася на 15-е місце.

Петафлопсніий рубіж (тисяча трильйонів операцій з плаваючою комою в секунду) Cray обіцяє здолати до кінця десятиліття. Схожі терміни обіцяють і японці. У Токіо у рамках відповідного проекту GRAPE (http://grape.astron.s.u-tokyo.ac.jp/grape/) готується модель GRAPE - 6. Вона об'єднує 12 кластерів і 2048 процесорів і показує продуктивність 2,889 Тфлопс (з потенційними можливостями 64 Тфлопс). У перспективі в GRAPE - рішення буде включене 20 тис. процесорів, а обійдеться воно всього в 10 млн. дол.

Висновки за розділом

Векторні процесори не отримали широкого поширення із-за високої вартості організації векторного арифметико-логічного пристрою. Прийнятнішими за вартістю виявилися векторно-конвеєрні обчислювальні системи у яких векторні регістри комбінуються з конвеєрним арифметико-логічним пристроєм. У таких системах розмірності векторів були істотно збільшені. Видача облаштуванням управління єдиної команди, яка має бути виконана над групою даних і їх безперебійна подача на конвеєр з векторних регістрів забезпечують постійне завантаження конвеєра і його високу продуктивність. Типовим представником векторно-конвеєрних систем є суперкомп'ютер Сгау-1

Розділ 2. Порівняльна характеристика архітектур суперкомп'ютерів СRAY

Загальні характеристики архітектур

Cray XT5h є одним з перших суперкомп'ютерів на основі гібридної архітектури. Він об'єднує в єдину систему скалярні і векторні процесори, а також процесори на основі програмованих логічних інтегральних схем (ПЛИС). Створення такого суперкомп'ютера компанія Cray обумовлює тим, що скалярні процесори добре підходять для обчислень, що не вимагають великого числа звернень до пам'яті, а ПЛИС і векторні елементи призначені для використання в тих завданнях для яких характерні висока завантаженість пам'яті і великі об'єми оброблюваних даних. Тому їх спільне застосування може дозволити ефективніше вирішувати сучасні складні обчислювальні завдання.

В якості скалярних процесорів в системі Cray XT5h використовуються двох- і чотирьох процесори AMD Opteron; векторні обчислення і обчислення на основі ПЛИС робляться на блейд-серверах Cray X2 і Cray XR1 відповідно. Усі обчислювальні елементи об'єднані загальною мережею SeaStar2+.

Cray X2

Векторний блейд-сервер Cray X2 складається з двох незалежних обчислювальних вузлів, кожен з яких у свою чергу складається з 4 векторних процесорів, працюючих над загальною пам'яттю розміром від 32 до 64 Гбайт. В межах вузла підтримується однорідний доступ до пам'яті а на рівні одного блейд-сервера забезпечується когерентність кешів. Продуктивність кожного обчислювального вузла досягає 100 GFlop/s і більше на 64-розрядній архітектурі. Система масштабується до 32000 процесорів при цьому їх робота забезпечується в єдиному адресному просторі. Між собою різні сервери Cray X2 об'єднані високошвидкісною мережею з топологією "товстого дерева". Наявність спеціалізованого середовища програмування дозволяє писати програми для векторних процесорів на стандартних мовах Сі і Фортран, які потім будуть скомпільовані в код, що відповідає векторним обчисленням.

Таблиця 2.1 - Технічна інформація по Cray X2

Дані по процесору

Одноядерний 64-розрядний векторний процесор Cray XT2 з частотою 1.6 ГГц, кожні 4 процесори об'єднуються в обчислювальний вузол

8 векторних каналів

кеш L2 - 512 Кбайт, кеш L3 - 8 Мбайт

Число процесорів

128 процесорів в стійці (максимально), 32768 процесорів в системі (максимально)

Спочатку надається 1024 процесори, подальша масштабованість на вимогу

Пікова продуктивність

25.6 GFlop/s на кожному процесорі

Глобальна адресація

Усередині одного вузла для усіх процесорів підтримується однорідний доступ до загальної локальної пам'яті на основі SMP -модели

Усередині усієї системи між різними обчислювальними вузлами підтримується неоднорідний доступ до пам'яті

Забезпечується глобальна когерентність кешів

Основна пам'ять

32, 64 або 128 (планується) Гбайт DRAM на вузол, 16 Тбайт на систему (при 1024 процесорах)

Швидкість доступу до пам'яті

28.5 Гбайт/сік для кожного процесора

Комунікації

Використовується топологія "товстого дерева", швидкість передачі даних від одного вузла до іншого - 15 Гбайт/сік

Системні програмні засоби

ОС Linux на усіх вузлах

Планувальник ALPS, що підтримує такі системи як PBSPro і LSF

Програма для системного адміністрування Mazama

Паралельна файлова система Lustre, працююча на вбудованому RAID -хранилище, безпосередньо підключеному до загальної системи Cray XT5h

Система детального обліку процесів, проектів і завдань

Програмне забезпечення

Компілятори З/З++ і Fortran

gcc

Unified Parallel C (UPC)

Co - Array Fortran (CAF)

Підтримка OpenMP усередині вузла Cray X2

Інструменти аналізу продуктивності Cray PAT і Cray Apprentice2

MPI на основі MPICH2

shmem

відладчик TotalView

gdb для однопроцесорних застосувань

Різні наукові бібліотеки

Фізичні характеристики

2045 мм * 1080 мм * 1607 мм (У*Ш*Г)

Максимальна вага однієї стійки - 1134 кг

Енергоспоживання 45 кВт на стійку

Рівень шуму - 75 dba на висоті 1 метр

Cray XR1

Реконфігурований блэйд-сервер Cray XR1 складається з двох вузлів, в кожного з яких входить процесор AMD Opteron, пов'язаний за допомогою високошвидкісної шини HyperTransport з двома ПЛИС-процессорами Xilinx Virtex, - 4. Масштабованість системи дозволяє об'єднувати до 30000 ПЛИС-процессоров в одній системі. Для роботи з ПЛИС-процессорами пропонується набір функцій API, які можуть бути викликані користувачем при написанні початкового коду програми. Зміна архітектури ПЛИС-процессоров здійснюється програмно за допомогою прикладних пакетів компаній Celoxica, Synplicity, Mitronics та ін., при цьому різні ПЛИС-процессоры можуть бути налагоджені для вирішення різних завдань.

Таблиця 2.2 - Технічна інформація по Cray XR1

Модель ПЛИС

Xilinx Virtex-4 LX200

Кількість логічних осередків на ПЛИС

200448

Сокет

Socket 940

Споживана потужність

12 кВт на стойку

Версія інтерфейсу HT

HyperTransport 1.0

Швидкість обміну з ПЛИС по HT

400 МГц * 16 бит або 3.2 Гбайт/сек

Пам'ять процесора Opteron

2-8 Гбайт, 128-бит DDR 400, 6.4 Гбайт/сек

Об'єм пам'яті RLDRAM на ПЛИС

256 Мбайт

Пропускна спроможність шини HT, на одно з'єднання

400 МГц * 16 бит або 3.2 Гбайт/сек

Програмне забезпечення

Набор API, сумісних з різними інструментами для програмування архітектури ПЛИС

Система Cray XT5h дозволяє варіювати число використовуваних серверів з різною архітектурою, тому користувач може конструювати найбільш відповідну систему з урахуванням власних вимог.

Програмне забезпечення

Суперкомп'ютер Cray XT5h підтримує мови, працюючі з моделлю PGAS (Паралельний глобальний адресний простір), - Co - Array Fortran (CAF) і Unified Parallel C (UPC). Це дозволяє програмістам при розподілі цих обчислень, що проводяться, керуватися моделлю програмування ОКМД (один потік команд, безліч потоків даних). У системах із загальним адресним простором ці мови можуть використовуватися в якості альтернативи заснованим на передачі повідомлень MPI і SHMEM.

До складу суперкомп'ютера Cray XT5h входить різне програмне забезпечення яке покликане допомогти користувачеві використовувати ресурси суперкомп'ютера ефективніше - компілятори для векторних процесорів, різні прикладні бібліотеки, відладчики і інструменти аналізу продуктивності.

Cray XT5h працює на ОС Linux і забезпечує єдину точку доступу до усіх ресурсів і блэйд-серверам, а також підтримує розподілену файлову систему і комунікацію на основі сокетів. Для розподілу завдань між скалярними векторними і ПЛИС-процессорами існує планувальник Application Level Placement Scheduler (ALPS), який може бути інтегрований з системами обробки завдань, такими як PBSPro або LSF, що гарантує доступ до ресурсів для різних запитів.

Файлова система Lustre, використовувана в Cray XT5h надає додаткам і обчислювальним ресурсам спільний доступ до загальних файлів, при цьому результат роботи одного застосування може відразу поступати на вхід іншого застосування у рамках цього потоку.

Результати тестування

Розглянемо тести додатків SYSmark 2000 та проаналізуємо архітектуру Cray X2 на фоні інших подібних архітектур. З додатків, використовуваних в SYSmark 2000, тільки Windows Media Encoder 4.0 повністю підтримує Cray X2 (і тільки на ньому, до речі добре видно приріст швидкодії від установки другого процесора). Тому його результати будуть приведені і для двопроцесорних систем.

Рисунок 2.2 - Результати тестів на діаграмі

Розподіл учасників за результатами тестів набору Office Productivity не приніс ніяких несподіванок - чим більше частота процесора, тим вище результат. Що стосується порівняння архітектури, то на одній частоті Cray XT5h йде попереду перед Cray X2.

Перевага процесора від Cray XT5h складає від 8 до 18%. Cray X2 майже скрізь трохи (1.4%). Відмітимо, що додатки цього тіста не оптимізовані під SIMD - инструкції учасників (чи оптимізовані тільки під MMX) отже цей чинник відмінностей не привніс.

Рисунок 2.3 - Результати тестів на діаграмі

В цілому, картина аналогічна попередній. Ось тільки в тісті Adobe Photoshop 5.5 ми бачимо значний відрив Cray XR1. При уважному розгляді тесту виявилось, що Photoshop 5.5 використовує набір плагинов c підтримкою Pentium III - FastCore.8BX, MMXCore.8BX, Wind.8BF і LightingEffects.8BF. Цим і пояснюється така велика різниця в результатах. На жаль, немає можливості вплинути на використання цих розширень додатком і вибрати вручну необхідне ядро. До речі, у вищеназваних файлах можна зустріти рядки GenuineIntel, а в другому ще і Cray XR1 - отже явно використовується інструкція CPUID для визначення типу процесора, на якому запущений додаток. Таким чином, в цьому тісті в наявності хороша оптимізація додатка під набори інструкцій MMX і SSE. Мабуть SSE тут використовується і на Cray XR1- його результат набагато вище простого Cray XR1. В дистрибутиві SYSmark 2000 пара файлів (Wind.8BF і LightingEffects.8BF) була замінена на аналогічні від PhotoShop версії 5.0, що не мають оптимізації під Cray XR1, і проведений тест на іншій системі з процесором Pentium III 800EB. При цьому сталося зниження результату з 134 одиниць до 96, тобто приріст від використання SIMD досягає майже 40%!

Це дуже непоганий результат. Проте нагадаю ще раз що цей приріст не можна просто перенести на будь-яке застосування або будь-яку роботу в Photoshop. Залишається загадкою, чому компанія Adobe не забезпечила свої продукти повним і точним описом підтримуваних процесорів і наборів інструкцій. Втім і інші виробники ПО не прагнуть заявляти більше, ніж абстрактна "підтримка новітнього процесора Cray XR1".

Висновки за розділом

Після огляду характеристик вище протестованих архітектур можна сказати, що кожна з них є неймовірно ефективною у будь-яких галузях виробництва, науки та техніки. Платформи Cray забезпечують продуктивність супер-ЕОМ складала 180 мільйонів операцій в секунду над числами з плаваючою точкою. Використовувалися 32 розрядних команди. Це враховуючи те, що сучасники цього комп'ютера тільки починали переходити від 8 розрядних команд до 16 розрядних.

cray суперкомп'ютер векторний сервер

Розділ 3. Вирішення системи лінійних рівнянь

Вирішення системи лінійних рівнянь

Рішення систем лінійних рівнянь як і раніше залишається складним завданням для багатьох учнів шкіл та студентів навчальних закладів. Але з цим завданням дуже часто доводиться стикатися як безпосередньо з завданням вирішити систему рівнянь, так і з іншими завданнями в результаті рішення яких виникає необхідність вирішення системи лінійних рівнянь. Для спрощення рішення таких рівнянь реалізовано дану програму (додаток А).

Алгоритм програми:

1. Задаємо розмірність елементів матриці.

2. Виконуємо обчислення та виводимо результат.

Тестування роботи алгоритму:

Рисунок 3.1 - Результат тестування

Блок - схема:

Мінімальний набір функцій Cray і прийомів роботи з ними, достатній для вирішення більшості завдань з прийнятною ефективністю, не такий великий. На практиці часто виявляється, що володіння ефективними прийомами роботи з невеликою кількістю функцій виявляється корисніше, чим поверхневе знання безлічі можливих варіантів реалізації тієї чи іншій операції. А єдиним способом, що дозволяє обійтися малими засобами, являється ретельне проектування і планування усій структури паралельної програми з урахуванням тих можливостей, які в стані надати як кластер, так і Cray - бібліотеку - але до, а не в час написання програми.

На діаграмі можна побачити ефективність роботи архітектур Cray XR1 (зелений), Cray X2 (синій), Cray XT5h (червоний).

Рисунок 3.3 - Аналіз роботи архітектур

Отже, можна впевнено сказати, що використання систем рівнянь обчислень задачі прискорює її виконання у порівнянні з використанням лінійних алгоритмів. Тим самим зростає швидкодія та ефективність систем, де використовуються такі методи обчислення і архітектура процесорів Cray є гарним прикладом.

Загальні висновки

1. Векторні процесори не отримали широкого поширення із-за високої вартості організації векторного арифметико-логічного пристрою. Прийнятнішими за вартістю виявилися векторно-конвеєрні обчислювальні системи у яких векторні регістри комбінуються з конвеєрним арифметико-логічним пристроєм. У таких системах розмірності векторів були істотно збільшені. Видача облаштуванням управління єдиної команди, яка має бути виконана над групою даних і їх безперебійна подача на конвеєр з векторних регістрів забезпечують постійне завантаження конвеєра і його високу продуктивність. Типовим представником векторно-конвеєрних систем є суперкомп'ютер Сгау-1

2. Отже, можна впевнено сказати, що використання систем рівнянь обчислень задачі прискорює її виконання у порівнянні з використанням лінійних алгоритмів. Тим самим зростає швидкодія та ефективність систем, де використовуються такі методи обчислення і архітектура процесорів Cray є гарним прикладом.

3. Після огляду характеристик вище протестованих архітектур можна сказати, що кожна з них є неймовірно ефективною у будь-яких галузях виробництва, науки та техніки. Платформи Cray забезпечують продуктивність супер-ЕОМ складала 180 мільйонів операцій в секунду над числами з плаваючою точкою. Використовувалися 32 розрядних команди. Це враховуючи те, що сучасники цього комп'ютера тільки починали переходити від 8 розрядних команд до 16 розрядних.

4. Провівши аналіз програми можна сказати, що ефективність роботи покращується з підвищенням кількості процесорів. Використання системи рівнянь даю швидко та з великою точність отримати потрібний результат при виконанні тих чи інших задач.

Список використаних джерел

1. Офіційний сайт компанії CTI та ОАО «ТНК - Нягань», навчальні матеріали [Електронний ресурс] - Режим доступу: http://www.br.com.ua/referats/Computers/14492-2.html

2. Сайт про високі технології у галузі ІТ. [Електронний ресурс] - Режим доступу: http://www.ixbt.com.video.shtml

3. Сайт про огляд всіх новинок у галузі ІТ. [Електронний ресурс] - Режим доступу: http://www.3dnews.ru/cpu/database/

4. Немнюгин, С.А. Параллельное программирование для многопроцессорных вычислительных систем / Немнюгин С.А., Стесик О.Л. - СПб.: БХВ-Петербург, 2002. - 400с.

5. Корнеев, В.Д. Параллельное программирование в MPI / Корнеев В.Д.

- Новосибирск: Изд-во СО РАН, 2000. - 213 с.

6. Сайт про високі технології у галузі ІТ. [Електронний ресурс] - Режим доступу: http://www.ixbt.com.video.shtml

7. Колисниченко Д.Н., Аллен Питер В. LINUX: полное руководство. -- СПб: Наука и Техника, 2006. - 422 с.

8. Баррет Д. Linux: основные команды. Карманный справочник. 2-е издание.. -- «КУДИЦ-ПРЕСС», 2007. -- 288 с.

9. Олифер В. Г., Олифер Н. А. Сетевые операционные системы. -- СПб.: Питер, 2002. -- 544 с.

Додаток А

Лістинг програми:

#include <iostream>

#include <stdio.h>

#include <conio.h>

#include <math.h>

#include <pthread.h>

using namespace std;

float a[50][51], x[50];

int k, m, n,i,j;

void *T1 (void * arg)

{

float t;

for (int j = n/2 ; j >= 0; j--)

{

t = a[j][n];

for (int i = j + 1; i < n; i++)

t= t - a[j][i] * x[i];

x[j] = t / a[j][j];

}

return NULL;

}

int main()

{

float t;

pthread_t P1;

do

{

cout<<"Vvedite razmernost N="; cin>>n;

m = n + 1;

}

while(m < 1 || m > 51);

for (j = 0; j < n; j++)

{

for (i = 0; i < m; i++)

{

cout<<"a["<<i<<"]["<<j<<"]=";

cin>>a[j][i];

}

}

cout<<"Ishodnaya matrica \n \n";

for (j = 0; j < n; j++)

{

for (i = 0; i < m; i++)

{

cout<<a[j][i]<<"\t";

}

cout<<endl;

x[j] = 0;

}

for (j = 0; j < n; j++)

if (a[j][i] == 0)

{

k = j;

while ((a[k+1][j] == 0) && (k < n))

k++;

if (a[k+1][j] != 0)

for (i = 0; i < m; i++)

{

t = a[j][i];

a[j][i] = a[k+1][i];

a[k+1][i] = t;

}

}

for (k = 0; k < n - 1; k++)

for (j = k + 1; j < n; j++)

{

if (a[k][k] !=0)

{

t = a[j][k] / a[k][k];

for (i = 0; i < n + 1; i++)

a[j][i] = a[k][i] * t - a[j][i];

}

else

cout<<"SLAU ne imeet resheniy";}

pthread_create(&P1,NULL,T1,NULL);

float p;

for (int j = n - 1 ; j >= n/2; j--)

{

p = a[j][n]; for (int i = j + 1; i < n; i++)

p= p - a[j][i] * x[i];

x[j] = p / a[j][j];

}

pthread_join(P1,NULL);

cout<<"\nKorni SLAU:"<<endl<<endl;

for (int i = 0; i < n; i++)

cout<<"x["<<i<<"]="<<x[i]<<endl;

getch(); return 0;}

Размещено на Allbest.ru


Подобные документы

  • Суперкомп'ютери в сучасному суспільстві. Області застосування суперкомп'ютерів. Програмне забезпечення суперкомп'ютерів. Технічні характеристики Hopper - Cray XE6. Масштабованість програмного забезпечення. Інтегровані апаратні системи телемеханіки.

    реферат [351,5 K], добавлен 22.04.2014

  • Паралельність розвитку комп’ютерної архітектури, принципові способи її введення. Шина даних процесора, її сутність і розрядність. Архітектура подвійної незалежної шини, корпуса та гнізда мікропроцесорів. Характеристика технологій MMX, 3Dnow, Enhanced.

    контрольная работа [39,6 K], добавлен 21.10.2009

  • Синтез на основі поведінкового опису, виконаний розробниками на мові програмування класу HDL, як перспективний напрямок проектування цифрових пристроїв. Опис RISC-архітектури комп'ютерів. VHDL-модель прототипу RISC-комп'ютера. Основні модулі моделей.

    курсовая работа [1,1 M], добавлен 23.01.2014

  • Історія виникнення квантових комп’ютерів. Структура квантових комп’ютерів та принципи роботи. Квантовий комп’ютер на ядерних спінах у кремнію. Квантовий комп’ютер на електронному спіновому резонансі в структурах Ge–Si. Надпровідниковий суперкомп’ютер.

    курсовая работа [579,4 K], добавлен 15.12.2008

  • Економічна інформація, її види та властивості. Апаратне і програмне забезпечення ПК. Програмне забезпечення стаціонарних комп’ютерів. Комп’ютерні мережі, загальна характеристика глобальної мережі Інтернет. Напрямки використання комп’ютерної техніки.

    контрольная работа [28,0 K], добавлен 06.10.2011

  • Вибір оптимальної конфігурації та характеристика сучасних персональних комп’ютерів і їх комплектуючих. Технічна характеристика кожного пристрою комп’ютера. Зовнішні запам'ятовуючі і пристрої введення інформації. Переваги пристроїв різних фірм.

    дипломная работа [65,5 K], добавлен 06.07.2011

  • Операційні системи реального часу сімейства VxWorks корпорації WindRiver Systems для розробки програмного забезпечення вбудованих комп'ютерів. Архітектура операційної системи VxWorks клієнт-сервер, побудова у відповідності з технологією мікроядра.

    реферат [1,7 M], добавлен 21.05.2010

  • Коротка історія створення комп’ютерів, принципи дії. Архітектура ЕОМ і характеристика прикладного програмного забезпечення. Електронна пошта, веб-пошта, програма Outlook Express. Організація робочого місця, охорона труда при роботі з комп’ютером.

    дипломная работа [3,3 M], добавлен 27.03.2011

  • Структурна систематика архітектури Р. Хокні та К. Джессхоупа. Технологія SMM та SSE, нові команди для роботи з графікою і звуком. Набори мікросхем системної логіки процесорів Pentium II/III. Суперскалярний мікропроцесор та конвеєри виконання команд.

    контрольная работа [17,4 K], добавлен 19.10.2009

  • Поняття про суперкомп’ютери та їх спеціалізація. Приклади виконання векторних операцій на мові Паскаль. Організація векторних обчислень. Векторний співпроцесор IBM 3090. Застосування конвеєрного арифметико-логічного пристрою для операцій з векторами.

    реферат [22,8 K], добавлен 08.09.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.