Комплекс моделей енергоспоживання регіонами України

Загальна характеристика, структура та аналіз енергетичного комплексу України. Особливості застосування методів багатовимірного статистичного аналізу в моделюванні енергоспоживання регіонами України. Оцінка величини енергетичних потреб населення регіону.

Рубрика Экономико-математическое моделирование
Вид магистерская работа
Язык украинский
Дата добавления 21.06.2010
Размер файла 5,7 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Для вирішення завдань моделювання складних систем існують добре оброблені методології і стандарти. До таких стандартів відносяться методології сімейства IDEF. З їх допомогою можна ефективно відображувати і аналізувати моделі діяльності широкого спектру складних систем в різних розрізах. При цьому широта і глибина обстеження процесів в системі визначається самим розробником, що дозволяє не перенавантажувати створювану модель зайвими даними.

Idef0 - методологія функціонального моделювання. За допомогою наочної графічної мови Idef0, система, що вивчається, з'являється перед розробниками і аналітиками у вигляді набору взаємозв'язаних функцій (функціональних блоків - в термінах Idef0).

Як правило, моделювання засобами Idef0 є першим етапом вивчення будь-якої системи. При побудові Idef0 - діаграм переважно правильно відокремлювати вхідні інтерфейсні дуги від керівників, що часто буває непросто.

В даному випадку на рис. 2.1, на вході IDEF0 повинні бути присутні постачальники, ціни та обсяг енергоресурсів, а на виході те, що повинні отримати у результаті проведення моделювання: структуру та обсяг енергоспоживання регіонів.

Існує ряд чинників, що можуть впливати на моделювання енергоспоживання регіонів України, а саме: кон'юктура ринку, науково-технічний прогрес як постачальники необхідних даних, а також слід виділити діяльність галузевих(регіональних) міністерств та науково-дослідницьких організацій, адже саме вони приймають рішення відносно енергоспоживання та розробляють відповідні програми, керуючись якими регіони можуть зназити свое енергоспоживання. Необхідно загострити додаткову увагу саме на цих чинниках, бо саме вони формують сьогоденний стан української регіональної енергетики.

Рис. 2.1. IDEF модель аналізу енергоспоживання регіонами України

Кон'юктура виступає як динамічний прогрес економічних змін, що характеризується напрямом і мірою варіативної певної сукупності елементів народного господарства. Вона є постійно змінюючимся динамічним процесом. Її роль є дуже значною, бо саме вона впливає на роботу підприємств, що характеризують регіон.

Варто зауважити, що зараз існує проблема енергозбереження, яка робить науково -технічний прогрес рушійною ланкою для її вирішення. Нові розробки та дослідження дають змогу підприємствам оптимізувати затрати.

Для забезпечення використання потенціалу енергозбереження, перш за все, необхідні удосконалення нормативно-правової бази і державної політики у сфері енергозбереження, яка б спонукала енергоспоживачів до належного обліку ощадного використання. Галузеві міністерства та науково-дослідницькі центри, зазначені на рис. 2.2., сприяють впровадженню інноваційних технологій, допомагають створити необхідну базу для поліпшення умов праці.

Важливість подібних установ проявляється в працях, розроблених працівниками, та співробітництві з підприємствами не тільки в місцевій сфері діяльності інших регіонів.

Рис. 2.2. Декомпозиція комплексу моделей енергоспоживання регіонами України

Проведення аналізу є вкрай необхідним, адже для економіки сучасної України характерна дуже низька ефективність використання енергетичних ресурсів. Таке положення справ є наслідком ряду причин, зокрема, структури промислового виробництва з переважанням енергоємних галузей чорної металургії і хімічної промисловості, а також що збереглася, в основному, ще з радянських часів виробничо-технічної бази, орієнтованої на тодішні низькі внутрішні ціни на нафту і газ. До недавнього часу Україна могла отримувати недорогий природний газ, що не стимулювало його економне використання. У нас також великі втрати енергоресурсів при транспортуванні чи розподілі і саме для того щоб дослідити загальне становище України шляхом використання методів поділу регіонів на групи, забражених на рис.2.3.

Рис.2.3. Декомпозиція моделі аналізу енергоспоживання регіонами України

В результаті проведення моделювання можна отримати необхідне для виявлення особливо енергозатратних регіонів, що потребують втручання держави у разі не спроможності самостійно подолати зайві витрати ресурсів, або власноруч, через заміну обладнання та впровадження інновацій.

В результаті виникнення необхідності розробляти оптимальний баланс підприємства або енергосистеми, тобто планувати витрати кожного виду палива в певний проміжок часу з метою здобуття необхідного навантаження з мінімальними витратами в умовах швидких змін технологічної, економічної і інших ситуацій. полягає в тому, що теоретичні узагальнення, основні положення і виводи дисертаційного дослідження можуть бути використані в діяльності органів законодавчої і виконавчої влади України, а саме: при розробці концепції розвитку паливно-енергетичного комплексу країни, розвитку її нафто- та газотранспортної системи і проведенні зовнішньоекономічної політики України, спрямованої на посилення її енергетичної безпеки.

аргументовано вести політику відносно вибору і реалізації оптимального плану з метою забезпечення зниження додаткових витрат, що виникли від вжитку додаткових одиниць енергоресурсів;

понизити витрати на виробництво продукції і як наслідок зменшити ціну собівартості і продажу, тобто стати привабливішим для потенційних замовників.

Побудова моделей для отримання у висновку аналітичних значень, дає можливість дізнатися про роботу підприємств та ЖКГ, що представляють основні енергоємні регіони України.

В даному випадку оптимізація є завершальною об'єднуючою ланкою, яка включає в себе як структуру так і отримані дані кластеризації.

В результаті проведення моделювання отримані дані можна використовувати для оперативного і тактичного управління споживання енергоресурсів, що дозволяють підвищити ефективність їх виробництва і розподілу і, як наслідок, стримувати зростання цін, добиватися відносного зниження тарифів.

В результаті проведення моделювання шляхом дискримінантного аналізу та кластерного розбиття на групи, можно проаналізувати стан регіонів вцілому та кожного окремо.Кластерізація дозволить будучому користувачу моделей(інвестору або державному службовцю) визначити доцільність співпраці з регіональніми представниками та масштаб виконання необхідних дій. А налізуючи на прикладі Харківської області енергоспоживання на душу населення можно розробити комплекс заходів відносно його оптимізації, тоб то більш ефективного використання таких енергоресурсів як вугілля, газ, нафта та електроенергія.

Дані оцінки дозволяють, хоча і в першому наближенні, виявити ступінь гостроти економічних та екологічних проблем територій регіону і виділити їх у типологічні групи.

2.2 Застосування методів багатовимірного статистичного аналізу в моделюванні енергоспоживання

Одним з найбільш дієвих інструментів аналізу є кластерний аналіз. Його основне достоїнство полягає в тому, що він дозволяє об'єднувати об'єкти в однорідні за кількома показниками групи (кластери). Алгоритм його застосування складається з наступних кроків:

формування матриці «об'єкт - ознака», де в якості об'єктів можуть виступати регіони, міста і т.д., а ознаками є значимі характеристики пов'язані з енергоспоживанню;

вибір заходи схожості або міри відстані, на основі якої буде будуватися класифікація;

визначення зв'язку між об'єктами на основі побудови матриці схожості або відстаней, симетричної вихідної матриці;

виявлення груп та інтерпретація отриманих результатів.

При визначенні пріоритетних напрямків комплексного енергоспоживання регіону кластерний аналіз може використовуватися в кількох аспектах. Перша область застосування - це виявлення проблем, формування переліку регіонів з високими показниками споживання ресурсів, наявності великих родовищ, заводів, які визначають загальні витрати енергоресурсів. Другим аспектом аналізу є оцінка потенціалу та відбір регіонів, які можуть стати «локомотивами» споживання, на основі вивчення розподілу ресурсів, виробничих потужностей і т.д.

Для таких об'єктів в подальшому можуть створюватися інвестиційні проекти розвитку, що фінансуються повністю або частково за рахунок бюджетних коштів. Крім того, проведення кластерного аналізу за одним і тим же об'єктам і показниками за даними різних часових зрізів дає уявлення про динаміку розвитку регіонів, їх рух щодо сформованих груп, що надає вихідну інформацію для прогнозування.

Використання кластерного аналізу не вичерпується узагальненням великих масивів кількісних даних. Він також застосовується для зіставлення об'єктів за якісними характеристиками. У стратегічному управлінні методики багатовимірних угруповань можуть використовуватися для агрегування експертних оцінок поточного або прогнозованого рівня розвитку об'єктів та їх підсистем.

Об'єднання або метод деревовидної кластеризації використовується при формуванні кластерів несхожості або відстані між об'єктами. Ці відстані можуть визначатися в одновимірному або багатовимірному просторі. Наприклад, якщо ви повинні кластеризувати типи їжі в кафе, то можете взяти до уваги кількість калорій, що містяться в ній, ціну, суб'єктивну оцінку смаку і так далі. Найбільш прямий шлях обчислення відстаней між об'єктами в багатовимірному просторі полягає в обчисленні відстаней Евкліда.

На першому кроці, коли кожен об'єкт є окремим кластером, відстані між цими об'єктами визначаються вибраною мірою. Проте коли зв'язуються разом декілька об'єктів слід визначити відстані між кластерами.

Іншими словами, потрібне правило об'єднання або зв'язку для двох кластерів. Тут є різні можливості: наприклад, ви можете зв'язати два кластери разом, коли будь-які два об'єкти в двох кластерах ближче один до одного, ніж відповідна відстань зв'язку. Іншими словами, ви використовуєте "правило найближчого сусіда" для визначення відстані між кластерами; цей метод називається методом поодинокого зв'язку. Це правило будує "волокнисті" кластери, тобто кластери, "зчеплені разом" тільки окремими елементами, що випадково виявилися ближче за інших один до одного. Як альтернативу ви можете використовувати сусідів в кластерах, які знаходяться далі за усі інші пари об'єктів один від одного. Цей метод називається метод повного зв'язку. Існує також безліч інших методів об'єднання кластерів, подібних тим, що були досліджені.

Метод кластеризації к -середніх істотно відрізняється від таких агломеративных методів, як об'єднання (деревовидна кластеризація) і двувходове об'єднання. Припустимо, ви вже маєте гіпотези відносно числа кластерів (за спостереженнями або по змінних). Ви можете вказати системі утворити рівно три кластери так, щоб вони були настільки різні, наскільки це можливо. Це саме той тип завдань, які вирішує алгоритм методу K середніх. У загальному випадку метод K середніх будує рівно K різних кластерів, розташованих на можливо великих відстанях один від іншого.

З обчислювальної точки зору ви можете розглядати цей метод, як дисперсійний аналіз "навпаки". Програма починає з K випадково вибраних кластерів, а потім змінює приналежність об'єктів до них, щоб мінімізувати мінливість усередині кластерів, і максимізувати мінливість між кластерами. Цей спосіб аналогічний методу "дисперсійний аналіз (ANOVA) навпаки" в тому сенсі, що критерій значущості в дисперсійному аналізі порівнює міжгрупову мінливість з внутрішньогрупової при перевірці гіпотези про те, що середні в групах відрізняються один від одного. У кластеризації методом K середніх програма переміщає об'єкти (тобто спостереження) з одних груп (кластерів) в інші для того, щоб отримати найбільш значущий результат при проведенні дисперсійного аналізу.

Зазвичай, коли результати кластерного аналізу методом K середніх отримані, можна розрахувати середні для кожного кластера по кожному виміру, щоб оцінити, наскільки кластери розрізняються один від одного. У ідеалі ви повинні отримати середні, що сильно розрізняються, для більшості, якщо не для усіх вимірів, використовуваних в аналізі. Значення F -статистики, отримані для кожного виміру, є іншим індикатором того, наскільки добре відповідний вимір дискримінує кластери.

Функціонування енергетики в Україні відбувається у специфічних умовах ринкової моделі розвитку економіки. Тому застосування сучасного математичного апарату, що дозволяє визначати стан енергетичного комплексу за ступенем кризи, є необхідною ланкою в досягненні сталого розвитку як регіону, так і держави в цілому. Фактори, що впливають на стан енергетіческогот комплексу, достатньо тісно пов'язані між собою. Дослідження показують, що підхід до визначення факторів, що впливають передбачає поетапне перетворення матриці вихідних даних з результатом стиснення інформації. Це дозволяє виявити найбільш значимі властивості, що впливають на стан енергетичного комплексу в умовах використання мінімуму вихідної інформації. Надмірно великий обсяг інформації може призвести до того, що ступінь показності вибірки виявиться обернено пропорційній розмірності простору факторів, що, в кінцевому рахунку, може не тільки не поліпшити, а й навіть погіршити якість бажаного результату. Основною метою побудови моделі є підвищення адекватності оцінки стану енергетичного комплексу, що дозволяє встановити ступінь кризи в регіоні.

Для оцінки стану енергетичного комплексу регіону в якості основного методу застосований дискримінантний аналіз.

Спочатку за допомогою експертизи визначається ряд регіонів-зразків, що характеризують нормальний рівень функціонування енергетичного комплексу. До регіонів - зразків відносимо ті регіони, у яких найбільша узгодженість думок експертів (узгодженість думок оцінюємо за допомогою коефіцієнта конкордації). За даними регіонів, у яких найбільша узгодженість думок експертів, здійснюється формування двох матриць. За допомогою дискримінантного аналізу виробляємо класифікацію залишилися районів на дві групи: нормальну і анормальну. Регіони, які потрапили в анормальну групу, знову даємо на експертизу, за результатами якої поділяємо їх на дві групи: регіони з кризовою і з передкризової ситуацією.

За допомогою дискримінантного аналізу виробляємо класифікацію залишилися регіонів на дві групи з передкризової і кризовою ситуацією.

Перш ніж приступити до розгляду алгоритму аналізу дискримінанта, звернемося до його геометричної інтерпретації. На рис. 2.1. зображені об'єкти, що належать двом різній множини М1 і М2.

Рис. 2.1. Геометрична інтерпретація дискримінантних функцій та дискримінантних змінних

Адаптований алгоритм розрахунку коефіцієнтів дискримінантної функції представленої у третьому розділі дозволить поетапно стежити за виконанням розрахунків.

Кожен об'єкт характеризується в даному випадку двома змінними і . Якщо розглядати проекції об'єктів (точок) на кожну вісь, то ці множини перетинаються, тобто по кожній змінній окремо деякі об'єкти обох великих кількостей мають схожі характеристики. Щоб якнайкраще розділити дві дані множини, треба побудувати відповідну лінійну комбінацію змінних і . Для двовимірного простору це завдання зводиться до визначення нової системи координат. Причому нові осі L і З мають бути розташовані так, щоб проекції об'єктів, що належать різним множинам на вісь L, були максимально розділені. Вісь С перпендикулярна осі L і розділяє дві "хмари" точок якнайкраще, Тобто щоб множини виявилися по різні сторони від цієї прямої. При цьому вірогідність помилки класифікації має бути мінімальною. Сформульовані умови мають бути враховані при визначенні коефіцієнтів і наступною:

F(x) = +

Функція F(x) називається канонічною функцією дискримінанта, а величини і - змінними дискримінантів.

Позначимо - середнє значення j -ої ознаки у об'єктів i -ої великої кількості (класу). Тоді для множини М1 середнє значення функції буде рівне:

(x) = +;

Для множини М2 середнє значення функції рівне:

(x) = +;

Геометрична інтерпретація цих функцій - дві паралельні прямі, що

Рис. 2.2. Центри великих кількостей, що розділяються, і константа дискримінації

Функція дискримінанта може бути як лінійною, так і нелінійною. Вибір її виду залежить від геометричного розташування класів, що розділяються, в просторі змінних дискримінантів. Для спрощення викладень надалі розглядається лінійна функція дискримінанта. Коефіцієнти функції дискримінанта визначаються так, щоб значення функцій якомога більше розрізнялися між собою, тобто щоб для двох множин (класів) було максимальним вираження:

Основними проблемами дискримінантного анализу являються, по-перше, знахедження дискримінантних змінних, по-друге, вибір виду дискримінантной функції. Існують різноманітні критерії послідовного відбіру змінних, що дозволяють отримати найкращі відмінності у множин. Також можна скористатися алгоритмом поступового дискримінантного анализу, котрий в літературі описаний дуже добре.

2.3 Метод аналізу із застосуванням карт Кохонена

Аналізуючи найбільш відомі на даний час розробки нейромереж, слід зазначити, що самим поширеним варіантом архітектури є багатошарові мережі зазначені на рис. 2.3. Нейрони в даному випадку об'єднуються у прошарки з єдиним вектором сигналів входів. Зовнішній вхідний вектор подається на вхідний прошарок нейронної мережі (рецептори). Виходами нейронної мережі є вихідні сигнали останнього прошарку (ефектори). Окрім вхідного та вихідного прошарків, нейромережа має один або декілька прихованих прошарків нейронів, які не мають контактів із зовнішнім середовищем.

Таким чином, звичайні нейронні мережі виявляють закономірності між вхідними даними і прогнозованою величиною. Якщо такі закономірності є, то нейромережа їх виділить, і прогноз буде успішним.

Рис. 2.3. Багатошаровий тип з'єднання нейронів

Мережі прямого поширення відносять до статичних, так як на задані входи нейронів надходить не залежний від попереднього стану мережі вектор вхідних сигналів. Рекурентні мережі вважаються динамічними, тому що за рахунок зворотних зв'язків (петель) входи нейронів модифікуються в часі, що приводить до змін станів мережі.

Оригінальність нейромереж, як аналога біологічного мозку, полягає у здібності до навчання за прикладами, що складають навчальну множину. Процес навчання нейромереж розглядається як налаштування архітектури та вагових коефіцієнтів синаптичних зв'язків відповідно до даних навчальної множини так, щоб ефективно вирішити поставлену задачу. Виділяють варіанти контрольованого та неконтрольованого навчання.

Величезна більшість рішень отримана від нейромереж з контрольованим навчанням, де біжучий вихід постійно порівнюється з бажаним виходом. Ваги на початку встановлюються випадково, але під час наступних ітерації коректуються для досягнення близької відповідності між бажаним та біжучим виходом. Створені методи навчання націлені на мінімізації біжучих похибок всіх елементів обробки, яке створюється за якийсь час неперервною зміною синаптичних ваг до досягнення прийнятної точності мережі.

Перед використанням, нейромережа з контрольованим навчанням повинна бути навченою. Фаза навчання може тривати багато часу, зокрема, у прототипах систем, з невідповідною процесорною потужністю навчання може займати декілька годин. Навчання вважається закінченим при досягненні нейромережею визначеного користувачем рівня ефективності. Цей рівень означає, що мережа досягла бажаної статистичної точності, оскільки вона видає бажані виходи для заданої послідовності входів. Після навчання ваги з'єднань фіксуються для подальшого застосування. Деякі типи мереж дозволяють під час використання неперервне навчання, з набагато повільнішою оцінкою навчання, що допомагає мережі адаптуватись до повільно змінюючихся умов.

Навчальні множини повинні бути досить великими, щоб містити всю необхідну інформацію для виявлення важливих особливостей і зв'язків. Але і навчальні приклади повинні містити широке різноманіття даних. Якщо мережа навчається лише для одного прикладу, ваги старанно встановлені для цього прикладу, радикально змінюються у навчанні для наступного прикладу. Попередні приклади при навчанні наступних просто забуваються. В результаті система повинна навчатись всьому разом, знаходячи найкращі вагові коефіцієнти для загальної множини прикладів. Наприклад, у навчанні системи розпізнавання піксельних образів для десяти цифр, які представлені двадцятьма прикладами кожної цифри, всі приклади цифри "сім" не доцільно представляти послідовно. Краще надати мережі спочатку один тип представлення всіх цифр, потім другий тип і так далі.

Головною компонентою для успішної роботи мережі є представлення і кодування вхідних і вихідних даних. Штучні мережі працюють лише з числовими вхідними даними, отже, необроблені дані, що надходять із зовнішнього середовища повинні перетворюватись. Додатково необхідне масштабування, тобто нормалізація даних відповідно до діапазону всіх значень. Попередня обробка зовнішніх даних, отриманих за допомогою сенсорів, у машинний формат спільна для стандартних комп'ютерів і є легко доступною.

Якщо після контрольованого навчання нейромережа ефективно опрацьовує дані навчальної множини, важливим стає її ефективність при роботі з даними, які не використовувались для навчання. У випадку отримання незадовільних результатів для тестової множини, навчання продовжується. Тестування використовується для забезпечення запам'ятовування не лише даних заданої навчальної множини, але і створення загальних образів, що можуть міститись в даних.

Неконтрольоване навчання може бути великим надбанням в майбутньому. Воно проголошує, що комп'ютери можуть самонавчатись у справжньому роботизованому сенсі. На даний час, неконтрольоване навчання використовується мережах відомих, як самоорганізовані карти (self organizing maps), що знаходяться в досить обмеженому користуванні, але доводячи перспективність самоконтрольованого навчання. Мережі не використовують зовнішніх впливів для коректування своїх ваг і внутрішньо контролюють свою ефективність, шукаючи регулярність або тенденції у вхідних сигналах та роблять адаптацію згідно навчальної функції. Навіть без повідомлення правильності чи неправильності дій, мережа повинна мати інформацію відносно власної організації, яка закладена у топологію мережі та навчальні правила.

Алгоритм неконтрольованого навчання скерований на знаходження близькості між групами нейронів, які працюють разом. Якщо зовнішній сигнал активує будь-який вузол в групі нейронів, дія всієї групи в цілому збільшується. Аналогічно, якщо зовнішній сигнал в групі зменшується, це приводить до гальмуючого ефекту на всю групу.

Конкуренція між нейронами формує основу для навчання. Навчання конкуруючих нейронів підсилює відгуки певних груп на певні сигнали. Це пов'язує групи між собою та відгуком. При конкуренції змінюються ваги лише нейрона-переможця.

Оцінка ефективності навчання нейромережі залежить від декількох керованих факторів. Теорія навчання розглядає три фундаментальні властивості, пов'язані з навчанням: ємність, складність зразків і обчислювальна складність. Під ємністю розуміють, скільки зразків може запам'ятати мережа, і які межі прийняття рішень можуть бути на ній сформовані. Складність зразків визначає число навчальних прикладів, необхідних для досягнення здатності мережі до узагальнення. Обчислювальна складність напряму пов'язана з потужністю процесора ЕОМ.

У загальному використанні є багато правил навчання, але більшість з цих правил є деякою зміною відомого та найстаршого правила навчання, правила Хеба. Дослідження різних правил навчання триває, і нові ідеї регулярно публікуються в наукових та комерційних виданнях. Представимо декілька основних правил навчання.

Правило Хеба з'явилося у його книзі "Організація поведінки" у 1949 р. "Якщо нейрон отримує вхідний сигнал від іншого нейрону і обидва є високо активними (математично мають такий самий знак), вага між нейронами повинна бути підсилена". При збудженні одночасно двох нейронів з виходами (хj, уі) на k-тому кроці навчання вага синаптичного з'єднання між ними зростає, в інакшому випадку - зменшується, тобто

D Wij(k)=r xj (k) yi (k),

де r - коефіцієнт швидкості навчання.

Правило Хопфілда є подібним до правила Хеба за винятком того, що воно визначає величину підсилення або послаблення. "Якщо одночасно вихідний та вхідний сигнал нейрона є активними або неактивними, збільшуємо вагу з'єднання оцінкою навчання, інакше зменшуємо вагу оцінкою навчання".

Правило "дельта". Це правило є подальшою зміною правила Хеба і є одним із найбільш загально використовуваних. Це правило базується на простій ідеї неперервної зміни синаптичних ваг для зменшення різниці ("дельта") між значенням бажаного та біжучого вихідного сигналу нейрона.

DWij= xj (di - yi).

За цим правилом мінімізується середньоквадратична похибка мережі. Це правило також згадується як правило навчання Відрова-Хофа та правило навчання найменших середніх квадратів.

У правилі "дельта" похибка отримана у вихідному прошарку перетворюється похідною передатної функції і послідовно пошарово поширюється назад на попередні прошарки для корекції синаптичних ваг. Процес зворотного поширення похибок мережі триває до досягнення першого прошарку. Від цього методу обчислення похибки успадкувала своє ім'я відома парадигма FeedForward BackPropagation.

При використанні правила "дельта" важливим є невпорядкованість множини вхідних даних. При добре впорядкованому або структурованому представленні навчальної множини результат мережі може не збігтися до бажаної точності і мережа буде вважатись нездатною до навчання.

Правило градієнтного спуску. Це правило подібне до правила "дельта" використанням похідної від передатної функції для змінювання похибки "дельта" перед тим, як застосувати її до ваг з'єднань. До кінцевого коефіцієнта зміни, що діє на вагу, додається пропорційна константа, яка пов'язана з оцінкою навчання. І хоча процес навчання збігається до точки стабільності дуже повільно, це правило поширене і є загально використовуване.

Доведено, що різні оцінки навчання для різних прошарків мережі допомагає процесу навчання збігатись швидше. Оцінки навчання для прошарків, близьких до виходу встановлюються меншими, ніж для рівнів, ближчих до входу.

На відміну від навчання Хеба, у якому множина вихідних нейронів може збуджуватись одночасно, при навчанні методом змагання вихідні нейрони змагаються між собою за активізацію. Це явище відоме як правило "переможець отримує все". Подібне навчання має місце в біологічних нейронних мережах. Навчання за допомогою змагання дозволяє кластеризувати вхідні дані: подібні приклади групуються мережею відповідно до кореляцій і представляються одним елементом.

При навчанні модифікуються синаптичні ваги нейрона-переможця. Ефект цього правила досягається за рахунок такої зміни збереженого в мережі зразка (вектора синаптичних ваг нейрона-переможця), при якому він стає подібним до вхідного приклада. Нейрон з найбільшим вихідним сигналом оголошується переможцем і має можливість гальмувати своїх конкурентів і збуджувати сусідів. Використовується вихідний сигнал нейрона-переможця і тільки йому та його сусідам дозволяється коректувати свої ваги з'єднань.

DWij (k+1)= Wij(k)+r [xj - Wij(k)].

Розмір області сусідства може змінюватись під час періоду навчання. Звичайна парадигма повинна починатись з великої області визначення сусідства і зменшуватись під час процесу навчання. Оскільки елемент-переможець визначається по найвищій відповідності до вхідного зразку, мережі Коxонена моделюють розподіл входів. Це правило використовується в самоорганізованих картах.

Розглядаючи карти Кохонена забражені на рис. 2.4., перш за все необхідно пригадати, що будь-яка нейронна мережа, перш за все, має бути виучена. Процес навчення полягає в підстроюванні внутрішніх параметрів нейромережі під конкретне завдання.

Рис. 2.4. Мережа Кохонена

При вченні «класичної» багатошарової нейромережі на вхід подаються дані або індикатори, а вихід нейромережі порівнюється з еталонним значенням (з так званим «вчителем»). Різниця цих значень називається помилкою нейронної мережі, яка і мінімізується в процесі вчення.

Таким чином, звичайні нейронні мережі виявляють закономірності між вхідними даними і прогнозованою величиною. Якщо такі закономірності є, то нейромережа їх виділить, і прогноз буде успішним [26].

В процесі навчання карт Кохонена на входи також подаються дані і індикатори, але при цьому мережа підстроюється під закономірності у вхідних даних, а не під еталонне значення виходу. Таке вчення називається вченням «без вчителя». Вчення при цьому полягає не в мінімізації помилки, а в підстроюванні внутрішніх параметрів нейромережі (вагів) для великого сов падіння з вхідними даними. Після вчення така нейромережа візуально відображує багатовимірні вхідні дані на плоскості нейронів.

Маючи таке представлення даних, можна дуже наочно побачити наявність або відсутність взаємозв'язку у вхідних даних. Для великої зручності візуальної вистави нейрони карти Кохонена розташовують у вигляді двомірної матриці і розфарбовують цю матрицю залежно від аналізованих параметрів нейронів

При роботі із звичайними нейромережами, операція картами Кохонена складається з декількох послідовних етапів.

Першим з них є етап визначення складу входів.Для хорошого вчення звичайної нейромережі потрібно вибрати таку безліч входів, яка найсильніше впливає на вихідні (прогнозовані) значення. Якщо ми вгадали, і входи дійсно впливають на виходи, то нейромережа працюватиме і даватиме відмінні прогнози. Проте підібрати правильні входи дуже складно. Зазвичай це робиться методом проб і помилок, тобто простим перебором різних комбінацій індикаторів і даних [27].

Входи нейромережі, що виучується «без вчителя», визначаються іншим чином, і перед такою нейромережею ставиться інша мета - виявлення закономірностей між будь-якими вхідними даними і індикаторами, які і подаються на вхід карти.

Архітектура карт Кохонена, на відміну від багатошарової нейромережі, дуже проста і є один-єдиним шаром нейронів, який організований у вигляді двомірної матриці. Користувачеві необхідно визначити лише розмір цієї матриці, тобто кількість нейронів по ширині і кількість нейронів по висоті.

Карти Кохонена дають візуальне відображення багатовимірних вхідних даних. У картах Кохонена аналізуються не тільки виходи нейронів (як у віпадку звичайної нейромережі), але також ваги нейронів і розподілу прикладів по нейронах. Оскільки карта Кохонена організована у вигляді двомірних грат, у вузлах якої розташовуються нейрони, то її дуже зручно відображувати на плоскості у вигляді «карти» з розфарбовуванням, залежним від величини аналізованого параметра нейрона.Саме за схожість такого типу зображення нейромережі з топографічними картами вони отримали назву карт Кохонена.

Таким чином, карти Кохонена, що самоорганізующиеся, є одним з видів нейронних мереж. Принципи роботи і вчення такої нейромережі були сформульовані фінським ученим Тойво Кохоненом в 1982 році. Основною ідеєю Т. Кохонена є введення в правило вчення нейрона інформації про його розташування. По Кохонену, нейромережу має один вхідний шар, з числом нейронів, рівним числу входів, і єдиний прихований (вихідний) шар нейронів, створюючий одновимірні (лінія) або двомірні (прямокутник) грати. По аналогії з топографічними картами таку нейромережу також називають картою Кохонена [28].

Для цієї парадигми вчення проводиться без «вчителя», тобто в процесі вчення немає порівняння виходів нейронів з еталонними значеннями.

В процесі навчання на вхід такої нейромережі поступово подаються навчальні приклади. Після подачі чергового прикладу визначається найбільш схожий нейрон, тобто нейрон, у якого скалярний добуток вагів і поданого на вхід вектора мінімально. Такий нейрон вважається переможцем і покликаний бути центром при підстроюванні вагів у сусідніх нейронів.

Правило вчення, запропоноване Кохоненом, передбачає змагання з врахуванням відстані нейронів від «нейрона-переможця.

Для нейрона-переможця функція сусідства дорівнює 1 і потім плавно (по лінійному або експоненціальному закону) зменшується при видаленні від нього. Таким чином, в процесі вчення підстроювання вагів відбувається не лише в одному нейроні - нейроні-переможцеві, але і в його околицях.

Після закінчення процесу вчення карта Кохонена класифікує вхідні приклади на групи схожих один з одним. Вся сукупність нейронів у вихідному шарі точно моделює структуру розподілу повчальних прикладів в багатовимірному просторі. Унікальність технології карт, що самоорганізующихся, полягає в перетворенні N-мерного простори в двух- або одновимірне. Єдине, що треба пам'ятати, - таке перетворення зв'язане з деякими помилками. Дві крапки, близько лежачі на карті Кохонена, будуть близькі і в N-мерном вхідному просторі, але не навпаки.

Для кращого розуміння надається приклад, що роз'яснює спільні підходи до аналізу карт, що самоорганізующихся. Подамо на два входи карти (розміром 50х50 нейронів) набір випадкових чисел від 0 до 50 спільним числом 500 прикладів.

Після проведення вчення такої карти Кохонена все сімейство карт матиме вигляд, змальований на малюнку. Карта частот має рівномірний розподіл прикладів по поверхні карти, що пояснюється рівномірним розподілом вхідних прикладів і якістю вчення карти.

Для нас в даному прикладі представляє інтерес розфарбовування карти входів. Розфарбовування кожною з них лінійна і постійна по одній з граней карти. Причому обидві карти входів мають однакове розфарбовування, але розгорнені один відносно одного на 90 градусів. Як це можна трактувати? При значенні 1- го входу, рівного 0 (темно-синя смуга на першій карті), 2-й вхід може приймати весь спектр значень від 0 (темно-синій) до 50 (темно-червоний). Це відповідає вхідному розподілу даних (пара незалежних, рівномірно розподілених величин). Таким чином, карта, що самоорганізующаяся, змогла правильно відображувати взаємний розподіл двох входів карти.

Виходи нейронів карти Кохонена нагадують топографічну карту. Координати цієї карти визначають положення одного нейрона. Наприклад, координати 12:34 описують нейрон, що знаходиться на пересіченні 12 стовпця з 34 поруч в матриці нейронів. Величина виходу нейрона по аналогії з географічними картами трактується як висота крапки.

Карти Кохонена, так само як і географічні карти, можна відображувати або в двомірному, або тривимірному вигляді. У двомірному вигляді карта розфарбовується відповідно до рівня виходу нейрона.

Для вищих значень зазвичай використовуються світлі тони, а для низьких значень - темні.

Карта виходів є головною картою в аналізі карт Кохонена. Саме на неї проектується взаємне розташування досліджуваних даних. Схожі вхідні дані утворюють на карті кластери - замкнуті області, що складаються з нейронів з однаковими значеннями виходів. Як правило, яскраво виражені кластери в даних мають чіткі кордони з іншими областями карти. У тривимірному вигляді це виглядає як крутий схил горба.

Після завершення вчення кожен вхідний приклад потрапляє в «свій» нейрон. При цьому в деякі нейрони не попаде жодного прикладу, а в деяких попаде декілька прикладів. Розподіл повчальних прикладів по нейронах дуже показово і відображується на карті частот.

У спільному випадку вхідні приклади рівномірно розподіляються по карті. Але якщо в даних є яскраво виражені групи, то приклади розподіляються нерівномірно, утворюючи кластери. Кластером може бути або відособлена група з декількох нейронів, в яку попало деяке число вхідних прикладів, або окремий нейрон, в який попало велике число вхідних прикладів.

Як говорилося вище, при аналізі карт Кохонена проводиться оцінка не лише виходів нейронів, але також і вагів нейронів.

Для кажного входу нейрона складається своя карта, яка розфарбовується у відповідності зі значенням відповідної нейрона. У нейронної мережі, навчаємої зі вчителем, ваги нейронів не мають фізичного сенсу і не використовуються в аналізі. При вченні ж без «вчителя» ваги нейронів підстроюються під точні значення вхідних змінних і відображають їх внутрішню структуру. Для ідеально вивченої нейронної мережі вага нейрона рівна відповідною компоненті вхідного прикладу. Зазвичай аналізують одночасно декілька карт входів. Спочатку на одній карті виділяють області однакового кольору. У цій області групуються вхідні приклади, що мають однакове значення відповідного входу. Далі нейрони з цієї області вивчаються на інших картах на предмет колірного розподілу.

При роботі з картами Кохонена важливо розуміти, що всі розглянуті вище карти - не більше ніж розфарбовування одних і тих же нейронів. При цьому кожен навчальний приклад має одне і те ж розташування на кожній з розглянутих карт.

В результаті проведення аналізу методів, що можуть бути примінені в сфері енергоспоживання, були виділені методи багатомірного статистичного аналізу для оцінки регіонального споживання енергоресурсів, а токож карти Кохонена для проведення кластеризації.

При визначенні пріоритетних напрямів комплексного енергоспоживання регіону кластерний аналіз може використовуватися в декількох аспектах. Перша сфера застосування - це виявлення проблем, формування переліку регіонів з високими показниками споживання ресурсів, наявності великих родовищ, заводів, які визначають загальні витрати енергоресурсів. Другим аспектом аналізу є оцінка потенціалу і відбір регіонів, які можуть стати "локомотивами" споживання, на основі вивчення розподілу ресурсів, виробничих потужностей.

Для того щоб оцінити регіони по їх енергоспоживанню була обрана модель дискримінантного аналізу, що дасть змогу при спостереженні великих статистичних сукупностей, як у даному випадку з регіонами, розділити неоднорідну сукупність на однорідні групи (класи). Таке розчленовування надалі при проведенні статистичного аналізу дає кращі результати моделювання залежностей між окремими ознаками.

Розділ 3. Моделювання та аналіз енергоспоживання регіонами України

3.1 Моделі аналізу регіонів України за енергоспоживанням

Для вирішення завдання аналізу використаємо інструмент багатовимірного статистичного аналізу такий як кластерний аналіз. Його основна перевага полягає в тому, що він дозволяє об'єднувати об'єкти в однорідні за декількома показниками групи (кластери). Формування матриці "об'єкт - ознака", вказаної на рис. 3.1., є одним з етапів побудови такої моделі, де об'єктами в даному випадку виступають регіони, а ознаками є значущі характеристики що відносяться до енергоспоживання.

Рис.3.1.Дані необхідні для розрахунків

Вказані змінні є показниками витрат енергоресурсів регіонами України зазначні у одиницях виміру toe, а саме: Х1 - обсяги споживання природнього газу; Х2 - обсяги споживання електроенергії; Х3 - обсяги споживання нафти та нафтопродуктів; Х4 - обсяги споживання вугілля; Х5 - обсяги споживання альтернативних джерел енергії.

При визначенні пріоритетних напрямів комплексного енергоспоживання регіону кластерний аналіз може використовуватися в декількох аспектах. Перша сфера застосування - це виявлення проблем, формування переліку регіонів з високими показниками споживання ресурсів, наявності великих родовищ, заводів, які визначають загальні витрати енергоресурсів. Другим аспектом аналізу є оцінка потенціалу і відбір регіонів, які можуть стати лідерами в ефективному енергоспоживанні, на основі вивчення розподілу ресурсів, виробничих потужностей.

Для більш повного аналізу регіонального споживання енергоресурсів необхідно використати декілька методів кластеризації починаючи з побудови дерева зазначеної на рис. 3.2.:

Рис. 3.2. Вибір метода кластеризації

Оберемо дані з рис. 3.3. та у пункті кластеру зазначимо «Cases» ,щоб створювати умови, за яких регіони увійдуть чи будуть виключені з даного кластеру.

Рис. 3.3. Вибір змінних та шляху

В результаті отримаємо наступні результати зазначені на рис. 3.4.:

Рис. 3.4. Вікно з результатами

З рисунку бачимо, що зазначена кількість змінних для проведення кластеризації дорівнює 5, евклідова відстань не стандартизована, отже можна виконувати наступний крок, а саме розрахунок цих відстаней, зазначений на рис. 3.5.:

Рис. 3.5. Матриця евклідових відстаней

Зазначені вище результати дозволяють перейти до графічного зображення результатів кластерного аналізу на рис. 3.6.:

Рис. 3.6. Графічне зображення побудови кластерів

З діаграми побудованого дерева видно, що був виконаний поділ на 3 класи, що визначає поділ регіонів на енергоємні, середні та мало споживаючі групи.

Метод Уорда зазначений на рис. 3.7. відрізняється від усіх інших методів, оскільки він використовує дисперсійний аналіз підходу до оцінки відстаней між кластерами. Коротше кажучи, цей метод намагається мінімізувати суму квадратів (SS) будь-яких двох (гіпотетичних) кластерів, які можуть бути сформовані на кожному кроці.

Рис. 3.7. Використання методу Уорда

Отримуємо таблицю евклідових відстаней зазначену на рис. 3.8.:

Рис. 3.8. Матриця евклідових відстаней

Зазначені вище результати дозволяють перейти до графічного зображення результатів кластерного аналізу на рис 3.9.:

Рис. 3.9. Графічне зображення побудови кластерів

З діаграми побудованого дерева видно, що був виконаний поділ на 3 класи, що визначає поділ регіонів на енергоємні, середні та мало споживаючі групи.

Використання методу к-середніх одного з найбільш популярних методів кластеризації зазначене на рис. 3.10. Алгоритм є модифікацією EM -алгоритму для розподілу. Він розбиває множину елементів векторного простору на заздалегідь відоме число кластерів k , як зазначено на рис. 3.11. Дія алгоритму така, що він прагне мінімізувати дисперсію на точках кожного кластера.

Рис. 3.10. Вибір метода кластеризації

Основна ідея полягає в тому, що на кожній ітерації перерозраховується центр мас для кожного кластера, отриманого на попередньому кроці, потім вектори розбиваються на кластери знову відповідно до того, який з нових центрів виявився ближче по выбраной метриці. Алгоритм завершується, коли на якійсь ітерації не відбувається зміни кластерів.

Рис. 3.11. Задання числа кластерів

В результаті отримали вікно з результатами зазначене на рис. 3.12. де видно, що попередньо було задано 3 кластери та 5 змінних:

Рис. 3.12. Вікно з результатами

Цей метод кластеризації дозволяє також отримати додаткову інформацію стосовно середніх значень по об'єктах ,які зазначені на рисунку 3.13. та евклідової відстані між центрами кластерів зазначеної на рисунку 3.14.:

Рис. 3.13. Результати середніх значень по об'єктах

Рис. 3.14. Евклідова відстань між центрами кластерів

З приведених результатів бачимо, що кластеризація виконана вірно, бо значення евклідової відстані та кластеризації суттєво відрізняються. Як видно з рис. 3.15., якість кластеризації задовольняє, окрім показників Х5 та Х2:

Рис. 3.15. Результати якості кластеризації

Графічне зображення середніх по факторам на рис. 3.16., дає змогу сказати, що кластери 2 та 3 розділені дуже тонкою гранню, а отже регіони, що потрапили до останнього повинні вдосконалити своє споживання енергоресурсів для того щоб не понести додаткові збитки. Тобто є необхідність введення додаткових іноваційних технологій та обрати шляхи оптимізації.

Рис. 3.16. Графічне зображення середніх по факторам

З рис.3.17. бачимо, що в результаті побудови моделі аналізу енергоспоживання регіони були поділені на 3 кластери ,як і було вказано вище, по 5, 7 та 14 відповідно. Це, перш за все, вказує на те що Україна має як регіони з низким рівнем споживання так і наділена дуже енергозатратними.

Рис. 3.17. Результати статистики по кластерам

На рис. 3.18. представлені більш розгорнуті результати відносно кластерів, а саме які регіони до якої групи належать з зазначенням відстаней до центрів:

Остаточні результати поділу регіонів на групи зазначені на рис. 3.19.

Рис. 3.19. Результати поділу регіонів на групи

Наступним методом, який дасть змогу охарактеризувати регіони є кластерний аналіз за допомогою карт Кохонена.

Призначень у використання карт Кохонена досить багато, одне з найвагоміших є те, що підприємства можна розбивати по рівню споживання електроенергії. Приведені в рис. 3.20. дані, є відображенням статистики енергоспоживання регіонів та міста Київ, які визначені у відповідних еквівалентах.

Для побудови моделі були використані дані споживання енергоресурсів підприємств-представників, ЖКГ та іншими споживачами енергоресурсів. Проведення досліджень з такими даними, адже вони приведені до одних одиниць виміру, що в даному випадку виступає нафтовий еквівалент.

Як і при роботі із звичайними нейромережами, операція з картами Кохонена складається з декількох послідовних етапів. Першим з них є етап знаходження складу входів. Для нормального навчання звичайної нейромережі треба вибрати таку множину входів, яка найбільш сильно впливає на вихідні (прогнозовані) значення. Якщо ми вгадали, і входи дійсно впливають на виходи, то нейромережа буде працювати і давати відмінні прогнози.

Рис. 3.20. Статистичні дані регіонального енергоспоживання

Алгоритм функціонування карт (Self Organizing Maps - SOM), що самоорганізуються, є одним з варіантів кластеризації багатовимірних векторів. Процес вибору типу обробки даних зображений і задаємо, як зображено на рис. 3.20. вхідні змінні, а також їх типи.

В процесі навчання карт Кохонена на входи також подаються дані і індикатори, вказані на рис. 3.21., але при цьому мережа підстроюється під закономірності у вхідних даних, а не під еталонне значення виходу.

Рис. 3.21. Задання вхідних змінних та їх типів

Розбиваємо вихідну множину даних на навчальне і тестове (співвідношення 90% до 10%), як на рис. 3.22. Задаємо конфігурацію сітки (шестикутна), а також кількість нейронів в мережі. Для якнайкращих результатів рекомендується, щоб кількість вічок складала до 50% від об'єму даних.

Рис. 3.22. Розбиття вихідну множину на підмножини

Налагоджуємо параметри зупинки навчання (мінімальна помилка менше 0,15, кількість епох - 1000) і задаємо фіксовану кількість кластерів, рівну трьом.

Рис. 3.23. Задання параметрів навчання карт Кохонена

Запускаємо побудову карт Кохонена і вибираємо ті карти і таблиці, на які хочемо звернути увагу, відображені на рис. 3.24. - 3.26.

Рис. 3.23. Запуск процеса побудови

Рис. 3.24. Вибір способів відображення

Рис. 3.25. Вибір відображення карт та їх настройки

Для кожного входу нейрона складається своя карта, яка розфарбовується у відповідності зі значенням відповідної нейрона. У нейронної мережі, навчаємої зі вчителем, ваги нейронів не мають фізичного сенсу і не використовуються в аналізі.

У спільному випадку вхідні приклади рівномірно розподіляються по карті. Але якщо в даних є яскраво виражені групи, то приклади розподіляються нерівномірно, утворюючи кластери, відображені на рис. 3.28.

Провівши попередні кроки, отримали карти, на яких можна побачити до якого кластера відноситься те або інше значенняпоказника.

Правило навчання, запропоноване Кохоненом, передбачає змагання з врахуванням відстані нейронів від нейрона-переможця. Це вимагає побудови матриці відстаней, зображеній на рис. 3.29.

Матриця відстаней (уніфікована матриця відстаней, U-matrix) - застосовується для візуалізації структури кластерів, отриманих в результаті навчання карти. Елементи матриці визначають відстань між ваговими коефіцієнтами нейрона і його найближчими сусідами. Велике значення говорить про те, що даний нейрон сильно відрізняється від тих, що оточують і відноситься до іншого класу.

Матриця помилок квантування, відображена на рис. 3.30. - відображує середню відстань від розташування прикладів до центру вічка. Приклад розташовується в багатовимірному просторі, де кількість вимірів дорівнює числу вхідних полів. Центр вічка - точка простору з координатами, рівними вагам нейрона. Відстань вважається як евклідова відстань. Матриця помилок квантування показує, наскільки добре вивчена нейромережа. Чим менше середня відстань до центру вічка, тим ближче до неї розташовані приклади і тим краще побудована модель.

Матриця щільності попадання, відображена на рис. 3.31. - відображає кількість прикладів, що попали у вічко.

Кластери, зображені на рис. 3.32. - відображують групи векторів, відстань між якими менше, ніж відстань до сусідніх груп. Іншими словами, всі елементи карти, що попали в область одного кольору (кластер), мають схожі ознаки.

Проекція Самсона, зображена на рис. 3.33. - матриця, що є результатом проектування багатовимірних даних на плоскість. При цьому дані, розташовані поруч у вихідній багатовимірній вибірці, будуть розташовані поруч і на плоскості.

За допомогою карт Кохонена підприємства були розбиті по рівню споживання електроенергії. Розділення можна вважати досить хорошим, оскільки при максимальній помилці 0,15 рівнів розпізнавання в тестовій і перевірочній множині 99,11 і 91,67% відповідно.

Рис. 3.34. Відображення значень аналізу

Результати даної роботи, вказані на рис. 3.34, можуть бути використані для оцінки енергоспоживання регіонами України при заданому наборі показників.

Недоліком є те, що в моделі враховані лише кількісні ознаки. А вони не можуть повною мірою описати енергоспоживання регіонів України, адже існує безліч якісних які і можуть дати бів полне уявлення про стан енергоспоживання.

Як висновок можна сказати, що сформована класифікація регіонів за основними характеристиками і складовими елементами енергоефективності, що дозволяє провести диференціацію регіонів по наявності і ефективності використання енергетичних ресурсів.

Аналізуючи регіони за основними характеристиками, що формують енергоспоживання, треба зауважити, що існують системи з надлишком або нестачею енергоресурсів, інфраструктури їх генерації і передачі, а також здатності споживачів сплатити їх, способу дослідження початкових матеріальних (паливних і інших) ресурсів.

Як видно з таблиці усі регіони були розподілені по групах, що дає змогу проводити подальші аналізи відносно доцільності введення додаткових заходів типу нових енергозберігаючих програм та технологій.

Рис. 3.36. Порівняння результатів кластеризації

На рис. 3.36. видно, що у результаті проведення розбиття на групи по енергоспоживанню, обидва використані методи розподілили регіони майже однаково. Неспівпадання викликане лише тим, що деякі регіони знаходяться по показникам дуже близько один від одного, а отже межи як такої майже немає. Існує необхідність в остаточному поділі на класи і дослідивши становище в Україні взагалом у сфері енергетики, пропоную віднести всі неспівпадаючі значення до груп з більшим енергоспоживанням, адже так у підприємств та інших користувачів буде мотивація на знаження потреб за рахунок пошуку нових шляхів.

3.2 Моделі оцінки регіонального енергоспоживання

При спостереженні великих статистичних сукупностей часто з'являється необхідність розділити неоднорідну сукупність на однорідні групи (класи). Таке розчленовування надалі при проведенні статистичного аналізу дає кращі результати моделювання залежностей між окремими ознаками.

Змінні дискримінантів мають бути лінійно незалежними. Ще одним припущенням при аналізі дискримінанта є нормальність закону розподілу багатовимірної величини, тобто кожна із змінних дискримінантів усередині кожного з даних класів має бути підпорядкована нормальному закону розподілу. У разі, коли реальна картина у вибіркових сукупностях відрізняється від висунених передумов, слід вирішувати питання про доцільність використання процедур аналізу дискримінанта для класифікації нових спостережень, оскільки в цьому випадку утруднюються розрахунки кожного критерію класифікації.


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.