Экспериментальное исследование статистических характеристик телетрафика
Существующие подходы к построению моделей телетрафика. Использование формулы Полячека-Хинчина и ее аналогов для определения характеристик СМО. Способы построения имитационных программ. Этапы и цели имитационного моделирования на языке GPSS World.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 06.03.2014 |
Размер файла | 1,4 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Введение
телетрафик имитационный моделирование программа
Актуальность работы
Внедрение новых систем связи требует совершенствования методов теории телетрафика и массового обслуживания, так как только на такой основе становится возможным адекватный прогноз числа пользователей и расчет обеспечения качества связи.
Другими словами, прогноз числа пользователей для конкретного региона представляет собой необходимый элемент выполнения любого проекта, относящегося к рынку услуг связи. Изучение распределения времени обслуживания абонентов по продолжительности для городов РК [4] показало, что трафик сотовой связи в Казахстане обладает существенными особенностями: относятся к распределениям с «тяжелым хвостом» и обладают бесконечной дисперсией. Это делает неприменимыми некоторые основные положения теории телетрафика для прогноза характеристик работы СМО, и обеспечения качества обслуживания абонентов, а расчет по классическим формулам приводит к некорректным результатам.
В настоящей работе развиваются методы, позволяющие осуществить прогнозирование статистических распределений, необходимых для оценки качества обслуживания системами связи, предложена конкретная аппроксимация, позволяющая описать наблюдаемые на опыте распределения однопараметрическими зависимостями.
На кафедре автоматической электросвязи АИЭС в настоящее время разрабатывается новое научное направление в области теории телетрафика, направленное на разработку методов, позволяющих определять статистическое распределение времени обслуживания абонента сетями сотовой связи, и построение соответствующей математической модели. Однако, экспериментальные результаты, ранее полученные в рамках данного научного направления, относились к Южным регионам РК, преимущественно г. Алматы. Представляет значительный интерес возможности применения ранее развитых подходов к другим регионам.
А именно, целью данной работы является выявление статистических закономерностей, характеризующих телетрафик на примере г. Павлодар и сопоставление результатов, полученных для данного города с полученными ранее для г. Алматы.
Выбор цели работы обуславливается следующими соображениями. Как известно [1,2], телетрафик считаться полностью охарактеризованным при условии, что известно два статистических распределения. Одно из них отвечает статистическим свойствам потока заявок по отношению к их распределению во времени. Другое относится к распределению по длительности обслуживания абонентов, данный показатель отвечает продолжительности телефонного разговора.
Как отмечалось в [4,8] второе из основных статистических распределений теории телетрафика изучено недостаточно полно. В [4,8] данная задача решена только частично, так как были использованы данные только для ограниченного числа регионов и ограниченного по продолжительности интервала наблюдений. На данном этапе исследований требуется выяснить, насколько общий характер имеют результаты, ранее полученные в цитированных работах.
Соответственно, достижение поставленной цели потребовало решения следующих задач:
- получение статистических выборок, позволяющих отыскать статистическое распределение длительности обслуживания абонентов на основании экспериментальных данных по г. Павлодар
- выявление соответствия ранее построенной математической модели рассматриваемого статистического распределения по экспериментальным данным, относящимся к г. Павлодар
- анализ основных следствий, вытекающих из полученного вида статистического распределения
- доказательство возможности использования указанного статистического распределения для выполнения прогнозов и оценки качества обслуживания абонентов
Научная новизна
Научная новизна работы состоит в том, что в ней впервые
- показано, что полученные ранее результаты, в частности, теоретическая модель [4], не зависят от выбора конкретного города на территории РК.
- показано, что модель [4] может быть сведена к однопараметрическому распределению телефонных разговоров по продолжительности.
- показано, что параметр, описывающий данное распределение зависит от конкретного города, хотя сам вид кривой остается неизменным.
- установлено, что данный параметр можно рассматривать как одну из характеристик экономической ситуации в конкретном населенном пункте.
- даны практические рекомендации по методике прогнозирования потребности в услугах связи на основе экспериментальных данных
Апробация
Результаты работы докладывались на VI региональной научной конференции студентов, магистрантов и молодых ученых вузов Алматинского региона, которая проходила в АИЭС 29 мая 2009 г.
1. Обзор литературы
В данном разделе анализируются существующие подходы к построению моделей телетрафика и их классификация. Рассматривается вопрос, поднятый в последнее время в работах [4,8,9], где доказывается, что до настоящего времени не существует адекватных подходов к решению задачи о построении теории статистических распределений продолжительности времени обслуживания абонентов (п.1.1). Рассматриваются существующие подходы к вычислению продолжительности времени ожидания обслуживания в СМО (п.1.2). Описываются основы моделирования средствами языка GPSS (п.1.3.), где рассматриваются способы построения программ имитации поведения СМО.
1.1 Существующие подходы к построению моделей телетрафика
Как отмечалось во введении, а также в имеющихся работах [1,4], для моделирования статистических распределений, характеризующих поток заявок (вызовов) применяются различные подходы и различные разновидности модельных функций. Так широкое применение получила классификация Кендалла [1], в которой используемая модель системы массового обслуживания (СМО) отражается в соответствии с записью:
(a/b/c): (d/e/f) (1.1)
где, первые три - основные обозначения, оставшиеся три - дополнительных могут обозначать особенности системы
а - распределение времени между заявками во входном потоке,
b - распределение времени между моментами конца обслуживания в выходном потоке,
c - число параллельно заданных узлов обслуживания в выходном потоке,
d - дисциплина очереди,
e - максимально допустимое число заявок, принимаемых СМО,
f - число одиночных источников заявок в подсистеме генератора заявок.
Часто классификация Кендалла также использует запись вида:
А/В/N
В этой записи символ А обозначает вид модели, используемой для описания статистических свойств потока заявок по времени их поступления на СМО, символ В относится к виду модели, описывающей статистику времени обслуживания заявок, N - количество серверов.
Например, обозначение М/М/1 говорит о том, что входной поток системы - марковский (пуассоновский), время обслуживания в сервере имеет экспоненциальное распределение и в системе один такой сервер. Общепринятыми являются следующие обозначения, наиболее часто встречающиеся:
· М - марковская модель (экспоненциальное распределение интервала времени);
· D - детерминированная величина интервала времени;
· Е - эрланговское распределение k-го порядка;
· U - равномерное (uniform) распределение интервала времени;
· С - произвольное (general) распределение интервала времени;
· fBM - фрактальное броуновское движение как модель для числа событий в единицу времени;
· fGN - фрактальный гауссовский шум.
Ниже приведены наиболее часто встречающиеся дополнительные условные обозначения компонентов и примеры условных обозначений СМО:
a/b/c: Loss - система с нулевой длиной очереди (полными потерями);
a/b/c/:k - система с максимальным размером очереди, равным k;
G/G/1 - система с произвольным законом распределения интервала времени между входными требованиями (обычно задается функцией плотности вероятности), с произвольным временем обслуживания требования (обычно задается функцией плотности вероятности) и одним сервером. Размер входного накопителя предполагается неограниченным;
fBM/D/1 - система с входным потоком, описываемым самоподобным процессом типа фрактального броуновского движения и единственным сервером с постоянным временем обслуживания требований.
Через Х ниже будет обозначать неопределенный вид модели.
В учебной литературе подробно описываются результаты для некоторых конкретных разновидностей распределений [1,6,7]. Показано, что для наиболее простых случаев, таких как М/М/1 могут быть проведены прямые аналитические расчеты основных характеристик СМО. Однако, даже в последнем пособии [1] практически не затрагивается вопрос о том, почему именно избранные распределения отвечают характеристикам потока заявок в различных конкретных случаях.
Так, например, при рассмотрении стохастических сетей СМО предполагают, что обслуживание каждого прибора распределено экспоненциально. В свою очередь стохастические сети бывают замкнутые и разомкнутые. Замкнутыми СМО называют системы, в которых число заявок циркулирующих в ней остается постоянным. В замкнутых сетях можно выделить источник заявок и узел уничтожения этих заявок.
Для описания разомкнутых сетей используют теорему Джексона:
P(k1, k2, …, kn)=P(k1)· P(k2)·… P(kn) (1.2)
т.е., вероятность нахождения по каждому узлу k - заявок равняется произведению вероятности в каждом узле. Для таких сетей, где каждый узел в сети представляет собой систему M/M/1. В общем случае полный входящий поток не является пуассоновским.
Теорема Гордона - Ньюэла рассматривает вариант замкнутой сети для теоремы Джексона. Число заявок в этой сети будет постоянным и возникает зависимость
(1.3)
где, k - общее число заявок в сети,
N - число узлов.
Число различных состояний (количество заявок в узле), равно числу способов размещения k - требовании по N - узлам, т.е. биноминальному коэффициенту.
(1.4)
где, ,
mi - количество приборов в i-том узле.
Исключение составляет анализ самоподобного трафика (т.е. число событий на заданном временном интервале может зависеть от числа событий, поступивших в весьма отдаленные от него интервалы времени). В текущей научной литературе [2-4] значительное внимание уделяется исследованию случая fBM/Х/х. Так в работе [2] разработаны аналитические модели, позволяющие получить параметры характеризующие функционирование мультисервисного (самоподобного) трафика.
Исследования последних лет доказало, что реальный сетевой трафик является самоподомным (фрактальным) процессом. Считают, что на самоподобность трафика влияют поведение пользователей, структура данных, объединение трафика и ограниченность сетевых ресурсов и т.д.
Авторами [2] были получены решения для оценки показателей качества функционирования СМО с коммутацией пакетов с фиксированной и экспоненциальной длины при обслуживании мультисервисного трафика.
В условиях высокой загрузки узлов коммутации и пачечности трафика требуемый объем буфера для удовлетворения соглашения по трафику значительно превышает средний размер очереди. Для вывода формул также используется метод инвариантов.
Выше были перечислены возможные причины возникновения самоподобия, а, следовательно, и долговременной зависимости. В работе [3] показано, что долговременная зависимость возникает в процессе преобразования битового потока в поток ячеек. Процесс преобразования сопровождается появлением распределений с «тяжелыми хвостами».
Для количественного анализа преобразования битового потока в поток ячеек. Были сделаны несколько допущений: если ограничится фиксированной длиной пакета L, трафик описывается распределением длительности и интервалов времени между передаваемыми пакетами. Длительность интервала ф определяется временем накопления информации в буфере, достаточном для образования пакета заданной длины L0:
(1.5)
где, L0 - определяется как произведение среднего значения скорости передачи на интервал ф;
, при малых значениях длины пакета с небольшой погрешностью ;
Тогда можно записать,
(1.6)
Данная функциональная зависимость дает возможность определить закон распределения g(ф) непрерывной случайной величины ф, как функций одного случайного аргумента r, если известен закон его распределения f®.
Отличительной особенностью зависимости между случайными величинами r и ф является инвариантность по отношению к замене местами функции и аргумента. Это зависимость выражается через . Таким образом, закон распределения приобретает вид обратного преобразования:
(1.7)
В соответствии с последним выражением были построены гистограммы для реальных законов распределения [4]. Гистограммы отражают сравнение реальных законов распределения, Рэлея и экспоненциального, с преобразованными в соответствий с полученными формулами. Кривые показывают, что распределения с «тяжелыми хвостами» возникают при преобразовании битового потока в поток пакетов, а также что его появление не зависит от закона распределения исходного преобразуемого битового потока.
В частности авторами [3] доказано, что связь между долговременной зависимостью и распределениями «тяжелого хвоста» возникает тогда, когда производится преобразование исходного битового потока в поток пакетов.
В последние годы в структуре трафика произошедшие изменения, потребовали определения входного потока способами отличными от классической. В работе [5] сделаны предположения относительно регулярности воспроизведения типовых информационных процессов (ИПТ), рассмотрены две крайние ситуаций: когда начало реализации ИПТ определяется начальным моментом предыдущей реализации и когда начало реализации ИПТ, происходит по расписанию.
В цитированных работах также представлены аргументы в пользу возможности использования моделей самоподобного трафика в прикладных целях.
Интерес к рассмотрению случая fBM/Х/х вполне объясним, так как в данном случае существует возможность получить конкретные результаты, оставаясь в рамках собственно теории телетрафика или теории систем массового обслуживания.
С помощью телекоммуникационных систем на рынок поставляется вполне определенная разновидность услуг, причем продолжительность телефонных переговоров однозначно связана со стоимостными показателями. Востребованность данных услуг связана далеко не только с техническими характеристиками систем, но, строго говоря, во многом определяется также и покупательной способностью населения. С этой точки зрения продолжительные телефонные разговоры представляют собой услугу со сравнительно высокой стоимостью, и наоборот. Можно утверждать, что продолжительность телефонных разговоров лимитируется именно стоимостными факторами.
1.2 Использование формулы Полячека-Хинчина и ее аналогов для определения характеристик СМО
Модель Марковского входного потока является достаточно хорошим приближением, которым можно пользоваться для первичных оценок характеристик СМО. Другим преимуществом этой модели является возможность получения аналитических формул для ряда важных случаев.
В частности, с ее помощью удается рассчитать параметры СМО для случая, отвечающего обозначению M/G/1 в классификации Кендалла. Для определения среднего значения времени ожидания обслуживания в такой системе используют формулу Полячека-Хинчина, которая широко используется в теории СМО. Однако, как будет показано в основной части, область применимости данной формулы является весьма ограниченной, точнее, существуют аргументы [8], показывающие, что ею нельзя пользоваться как раз для статистических распределений того вида, который реализуется на практике.
В виду необходимости критики формулы Полячека-Хинчина, а точнее, методов ее применимости, дадим ее подробный вывод. Это позволит преодолеть ряд парадоксов, возникающих при анализе СМО с использованием экспериментально полученных статистических распределений.
Обозначение M/G/1 отвечает системам, для которых входной поток остается пуассоновским, тогда как время обслуживания в сервере может описываться случайной величиной с произвольным заданным распределением.
Необходимо подчеркнуть, что для таких систем удается провести вывод формул до конца, только если они содержат ровно один сервер, что и отвечает символу 1 в обозначении Кендалла M/G/1. Будем считать, что на вход системы поступает пуассоновский поток со средней интенсивностью л, то есть плотность вероятности для интервала времени между поступлениями заявок на входе описывается формулой:
. (1.8)
Распределение времени обслуживания в сервере будем описывать через функцию плотности вероятности Pe. Данная функция определена на правой полуоси и должна удовлетворять условию нормировки
(1.9)
Среднее значение времени обслуживания заявки соответственно дается записью
. (1.10)
Работа СМО в самом общем случае характеризуется интенсивность поступающего трафика (поступающей нагрузки) л, которая имеет размерность частоты, и коэффициентом загруженности сервера [1]. Последний показатель можно также трактовать как время, затрачиваемое на обработку требований
. (1.11)
В среднем каждая заявка, поступившая в систему, будет ожидать обслуживания в течение времени обслуживания всех находящихся в очереди и пришедших ранее заявок, а также времени освобождения сервером последней из заявок. Поэтому, среднее время ожидания в очереди можно будет описать соотношением:
(1.12)
здесь, - средняя незавершенная работа, т.е. время, которое должно пройти до полного ухода всех требований из системы с момента прекращения поступлений требований на её вход, - среднее число заявок в системе, которое можно рассчитать по формуле [1]
(1.13)
В соответствии с формулой Литтла [1]:
(1.14)
(1.15)
откуда
(1.16)
Для определения средней незавершенной работы в системе рассмотрим, как она изменяется стечением времени. Очевидно, что с течением времени незавершенная работа линейно убывает, пока сервер обрабатывает заявку, и скачком увеличивается с поступлением каждой новой заявки на сервер.
Для определения среднего значения незавершенной работы достаточно проинтегрировать эту функцию и разделить полученную величину на длину интервала интегрирования. Имеем:
(1.17)
Из этой формулы определяется среднее значение времени ожидания обслуживания в системе M/G/1, известная как формула Полячека-Хинчина:
(1.18)
Таким образом, по формуле Полячека-Хинчина можно определить среднее время ожидания в очереди, а также среднее время пребывания заявки в системе:
. (1.19)
Как видно из полученной формулы, даже для простейшей системы M/G/1, среднее время пребывания заявок зависит не только от величины средней интенсивности поступающего трафика, но и от вида распределения времени обслуживания. Действительно, при одном и том же потоке и одном и том же времени обслуживания заявки, величина будет разной для разных статистических распределений.
Таким образом, анализ даже самого простого случая показывает, что для адекватного времени ожидания заявки в очереди требуется знать вид статистического распределения.
1.3 Основы моделирования средствами языка GPSS. Способы построения имитационных программ для моделирования поведения СМО
Компьютерное имитационное моделирование является методом прогнозирования поведения, как новых систем, так и существующих систем, в которые вносятся некоторые изменения. Оно имеет более широкий спектр применения, нежели математические методы, и в течение многих лет сэкономило пользователям значительные средства. При этом имитационному моделированию поддаются даже самые сложные системы реального мира. Фактически список возможностей для применения компьютерного имитационного моделирования огромен и регулярно пополняется.
В настоящее время имитационные модели строятся в виде программ, разрабатываемых на обычных языках программирования или на специализированных языках и в специализированной визуальной среде.
Наиболее простым и исторически первым из таких специализированных языков является GPSS (General Purpose Simulation System).
GPSS World сочетает в себе функции дискретного и непрерывного моделирования. Возможность перехода из дискретной фазы моделирования в непрерывную фазу и обратно обеспечивает тесную связь с непрерывным моделированием. В непрерывной фазе могут быть установлены пороговые значения, управляющие созданием транзактов в дискретной фазе. И наоборот, блок INTEGRATION и команда INTEGRATE управляют процессом непрерывного моделирования.
Язык GPSS осуществляет моделирование с точки зрения событий, т.е. изменений, происходящих в системе. Работа модели представляется как движение требований, называемых в GPSS транзакциями, через различные блоки, описываемые операторами языка. Каждый блок программы, выполняет присущее ему действие только в тех случаях, когда через него проходит транзакция. Поскольку в системе в каждый момент времени могут присутствовать несколько транзакций, следующих по разным маршрутам, процесс моделирования можно представить как многопоточное псевдопараллельное исполнение кода, описывающего модель. Но это обстоятельство не создает трудностей при написании программы в виду того, что язык GPSS является специализированным, учитывающим особенности построения подобных моделей и автоматический управляющим различными аспектами параллельного исполнения программы.
В данной работе будем пользоваться версией GPSS World [1,14], которая позиционируется как объектно-ориентированная версия моделирующей среды программирования. Поддерживается четыре типа объектов: Model Objects, Simulation Objects, Report Objects, Text Objects.
Объект первого типа создается в виде последовательности инструкций языка GPSS, называемых блоками. Состав и последовательность записи этих блоков определяют способ и порядок обработки событий - транзакций в моделируемой системе. Модель всегда содержит источники и обработчики транзакций. Объект типа Model предназначен для описания моделируемой системы и условий моделирования. Модель системы состоит из последовательности управляющих и исполняемых выражений. Исполняющие выражения называются блоками, описывают логику потока транзакций в ходе моделирования. Только когда на входе в блок появляется транзакция, в модели происходят изменения. Блок может содержать до четырех полей: label, operator, operand, comment. Крайнее левое поле предназначается для поля label, которое ставится при необходимости организовать ветвление. Поле operator располагается справа от метки и каждый из них определяет вид действий. Далее расположен поле operand, их количество и тип каждого из них зависят от назначения блока. Поле comment описывает комментарий к блоку.
Объект типа Simulation появляется при запуске транслятора среды GPSS World. Этот объект является интерпретируемым кодом и может быть запушен на исполнение несколько раз, с целью получения достаточного для понимания объема статистической информации о моделируемой системе.
В процессе исполнения будет порожден третьи объект типа - Report. Этот объект содержит типичную для анализа систем массового обслуживания информацию.
Объекты четвертого типа (Text) не являются обязательными при выполнении моделирования и используются при описании особо сложных моделей и получения исходного кода для архивирования и переноса.
Анализ результатов в GPSS World очень прост. Окно «Journal» («Журнал») записывает действия, связанные с объектом «Процесс моделирования». Автоматическая система нумерации отчетов гарантирует сохранение каждого стандартного отчета. Основной анализ результатов этих экспериментов осуществляется автоматически и выводится в окно «Journal» («Журнал»).
GPSS World, которая создает объекты «Процесс моделирования». Перед включением в объект «Процесс моделирования» все операторы модели проходят трансляцию. Точно так же интерактивные операторы транслируются в глобальной области видимости прежде, чем они будут переданы существующему объекту «Процесс моделирования».
GPSS World отличается высоким уровнем визуализации выполняющегося процесса моделирования. Для наблюдения и взаимодействия с процессом моделирования используются двадцать различных окон, соответствующих большей части объектов GPSS. Для получения, сохранения и печати визуального представления состояния процесса моделирования не требуется дополнительных усилий, кроме операций с окнами. Тогда как кадры состояния процесса моделирования представляют собой единовременное статическое отображение быстроизменяющегося объекта, окна процесса моделирования обновляются оперативно, динамически изменяясь, с целью соответствовать изменяющемуся состоянию выполняющегося процесса моделирования. Хотя динамические окна показывают изменяющееся состояние объектов, что весьма полезно при моделировании, следует помнить, что их использование приводит к снижению производительности.
2. Экспериментальная часть
Основываясь на ранее полученный результат, в частности, теоретическую модель [4], позволяющую отыскать статистическое распределение заявок по времени обслуживания, можно сделать вывод о том, что характер данного распределения не зависит от выбора конкретного города на территории РК. Поэтому особый интерес представило выявление статистических закономерностей, характеризующих телетрафик на примере г. Павлодар и сопоставление результатов, данного города с полученными ранее для г. Алматы.
Верификация данной модели требует сопоставления с экспериментальными данными, точнее со статистическими распределениями, полученными на основе опытных данных.
Методика экспериментального получения таких распределений, доказательство их релевантности и первичный анализ полученных результатов, рассматриваются в данной главе.
2.1 Методика получения экспериментальных статистических распределений заявок по времени обслуживания
Для отыскания статистических распределений времени обслуживания абонентов сотовой связи используется метод, который был уже подробно описан в работе [4]. Суть данной методики заключается в следующем: для получения исследуемого статистического распределения, в принципе, подходит любая выборка звонков, лишь бы только она содержала достаточное число событий (что обеспечивает необходимую точность) и относилась к неизменным условиям (что обеспечивает сопоставимость используемых данных).
Каждый звонок рассматривается как оказанная услуга (в экономическом смысле), при этом нет необходимости осуществлять привязку к конкретным телефонным узлам. Следовательно, данные могут быть собраны безотносительно к району расположения базовых станций, обеспечивающих мобильную связь.
Для получения наиболее обобщенных результатов, описывающих характер распределения трафиков сотовой связи, сбор данных проводился у абонентов различных операторов связи, пользователей всевозможных тарифных планов и в течение достаточно продолжительного времени.
Наблюдения, использованные в данной работе, проводились по городу Алматы в период с 06 декабря 2008 г. По 31 января 2009 г., по г. Павлодар - с 15 марта по 11 апреля 2009 года. Каждая серия наблюдений относится небольшому промежутку времени, что позволяет исключить влияние сезонных вариаций. Продолжительность исходящих звонков регистрировались в секундах, использовались сведения, заносимые в память аппаратов мобильной связи. Было опрошено 300 человек различного социального статуса в г. Алматы и 200 человек по г. Павлодар. Общее количество звонков абонентов мобильной связи по городу Алматы, а также по г. Павлодар используемой выборке составило порядка 2000 звонков.
Выбор городов осуществлен с учетом существенно отличающей социально-экономической обстановки, в том числе, покупательной способности населения в данных населенных пунктах.
Характер собираемых сведений отражает таблица 2.1. В ней показано несколько случаев из используемой выборки, где отражалась информация о времени и длительности сделанного телефонного звонка.
2.2 Первичный анализ гистограмм, отражающих статистику продолжительности телефонных разговоров
По полученным данным были построены гистограммы, для городов Алматы и Павлодар, пример которых показан на рисунках 2.1 и 2.2. По оси абсцисс отложена продолжительность звонка в секундах, по оси ординат - число звонков из данной выборки, имеющих соответствующую продолжительность.
Видно, что полученные гистограммы в достаточной степени зашумлены, что обусловлено малой длительностью отрезков, на которые разбивается исследуемый интервал продолжительности звонка. Переход к более протяженным интервалам разбиения эквивалентен сглаживанию полученной кривой по методу скользящих средних. Соответствующие кривые также показаны на рисунках 2.1 и 2.2. Видно, что сглаживание с протяженностью окна усреднения 9 с уже дает достаточно гладкие кривые. Погрешность полученных значений рассчитывалась по методу стандартной методике.
Рисунок 2.1 - Гистограмма, отвечающая распределению числа звонков по их продолжительности (г. Алматы)
А именно, при расчете погрешности использовалась основная идея метода скользящих средних. В соответствии с нею, предполагается, что при изменении текущей переменной на величину, равную протяженности окна усреднения, значение функции в приемлемом приближении можно считать неизменным. Тогда, точки, относящиеся к данному положению окна усреднения, можно считать измерениями одной и той же величины.
Рисунок 2.2 - Гистограмма, отвечающая распределению числа звонков по их продолжительности (г. Павлодар)
Применительно к данному случаю, это означает, что можно считать, что каждое значение, относящееся к сглаженной кривой, измерялось 9 раз.
Соответственно, расчет погрешности для каждой точки можно проводить по формуле, записанной для погрешности измерений некоторой физической величины, полученной по девяти отклонениям от среднего значения. Данная формула имеет вид:
(2.1)
где - среднее значение для данной точки, полученное по методу скользящих средних
Таблица 2.1 - Пример регистрации сведений для получения статистических выборок
№ |
время поступления |
продолжительность, с |
№ |
время поступления |
продолжительность, с |
№ |
время поступления |
продолжительность, с |
|
1 |
20:39 |
6 |
30 |
14:45 |
194 |
59 |
10:55 |
10 |
|
2 |
17:54 |
168 |
31 |
14:41 |
219 |
60 |
11:05 |
50 |
|
3 |
17:51 |
51 |
32 |
12:50 |
36 |
61 |
21:34 |
115 |
|
4 |
15:01 |
19 |
33 |
12:07 |
12 |
62 |
20:31 |
32 |
|
5 |
14:57 |
99 |
34 |
11:30 |
72 |
63 |
21:03 |
7 |
|
6 |
22:38 |
69 |
35 |
14:56 |
11 |
64 |
21:10 |
34 |
|
7 |
16:45 |
58 |
36 |
14:18 |
515 |
65 |
21:30 |
397 |
|
8 |
14:20 |
18 |
37 |
23:23 |
71 |
66 |
21:45 |
898 |
|
9 |
19:23 |
62 |
38 |
19:39 |
2 |
67 |
23:26 |
17 |
|
10 |
10:23 |
44 |
39 |
8:29 |
20 |
68 |
21:03 |
10 |
|
11 |
15:46 |
25 |
40 |
15:08 |
10 |
69 |
18:51 |
20 |
|
12 |
9:28 |
1 |
41 |
21:36 |
1 |
70 |
17:35 |
516 |
|
13 |
21:54 |
43 |
42 |
8:00 |
32 |
71 |
17:30 |
126 |
|
14 |
20:15 |
62 |
43 |
22:07 |
9 |
72 |
16:17 |
28 |
|
15 |
15:45 |
24 |
44 |
22:18 |
25 |
73 |
13:30 |
31 |
|
16 |
14:21 |
25 |
45 |
15:19 |
69 |
74 |
20:36 |
43 |
|
17 |
13:56 |
230 |
46 |
22:10 |
22 |
75 |
12:33 |
26 |
|
18 |
23:56 |
60 |
47 |
20:09 |
6 |
76 |
10:30 |
60 |
|
19 |
11:19 |
57 |
48 |
21:18 |
6 |
77 |
10:55 |
197 |
|
20 |
11:45 |
7 |
49 |
7:32 |
31 |
78 |
11:17 |
10 |
|
21 |
11:40 |
44 |
50 |
21:03 |
9 |
79 |
13:11 |
17 |
|
22 |
16:48 |
12 |
51 |
18:22 |
20 |
80 |
15:13 |
53 |
|
23 |
16:30 |
17 |
52 |
12:31 |
23 |
81 |
16:23 |
43 |
|
24 |
9:50 |
20 |
53 |
9:30 |
317 |
82 |
21:17 |
90 |
|
25 |
14:55 |
13 |
54 |
21:20 |
600 |
83 |
14:37 |
12 |
|
26 |
22:48 |
213 |
55 |
20:14 |
384 |
84 |
9:10 |
33 |
|
27 |
20:09 |
51 |
56 |
10:41 |
55 |
85 |
11:27 |
76 |
|
28 |
20:00 |
54 |
57 |
17:40 |
123 |
86 |
17:36 |
153 |
|
29 |
23:01 |
194 |
58 |
15:03 |
77 |
87 |
21:08 |
7 |
Целесообразность полученных статистических выборок уже была рассмотрена [4] с точки зрения экономической структуры общества, где было выявлено, что социальный статус абонентов не оказывает заметного влияния на характер статистического распределения продолжительности телефонных переговоров.
Данный вывод можно интерпретировать, отталкиваясь также от существующих представлений о природе информационного общества [10,11]. А именно, вовлеченность индивида в коммуникационную среду не является имущественным признаком, соответственно для определенных групп населения расходы на связь относятся к предметам (товарам, услугам) первой необходимости, для других - наоборот.
3. Теоретическое моделирование статистических характеристик времени обслуживания абонентов и анализ применимости формулы Полячека-Хинчина
В работах [4,8,9] уже поднимался вопрос об адекватности использования формулы Полячека-Хинчина и ее аналогов. Был найден конкретный вид статистического распределения времени обслуживания абонентов сотовой связи. Доказано на примере Южного региона РК, что такие распределения обладают формально бесконечной дисперсией.
На примере полученного распределения по г. Павлодар выясним, насколько общий характер имеют результаты, полученные ранее. В работе проверим, совпадают ли выводы, сделанные раннее в [4,8] об ограниченной применимости формулы Полячека-Хинчина.
3.1 Установление вида статистического распределения обслуживания заявок по продолжительности
Как было показано в Главе 1, адекватное описание статистического распределения продолжительности времени обслуживания абонентов невозможно дать без анализа поведения потребителей на рынке услуг связи.
В [4] была сформулирована гипотеза, призванная описать асимптотику функций, описывающих частоту приобретения товаров, в области больших значений стоимости.
Математически, данная гипотеза формулируется как существование пропорциональной связи между производной от числа потребленных товаров (рассматривается фиксированная группа покупателей) по стоимости товара и самим числом потребленных товаров:
(3.1)
где - функция, описывающая число товаров данной категории, приобретенных данной группой покупателей в фиксированный промежуток времени. Более корректно, однако, использовать вероятностную функцию , имеющую смысл плотности вероятности того, что товар, обладающий стоимостью , будет приобретен покупателями из выделенной группы. Т.е. определяется через вероятность того, что товар, обладающий стоимостью из интервала от до , будет приобретен:
(3.2)
Предположение (1) в терминах плотности вероятности, очевидно, записывается полностью аналогичным образом:
(3.3)
Знак минус отвечает условию, что потребление сходных по характеру товаров уменьшается по мере увеличения их стоимости.
Наибольший интерес представляет смысл коэффициента . Очевидно, данный коэффициент тем выше, чем выше покупательная способность данной группы, причем, поскольку рассматривается товар, имеющий стоимость выше заданной, то целесообразно рассматривать «остаточную» покупательную способность. Под остаточной покупательной способностью можно понимать, в первом приближении, количество средств, выделяемых на приобретение товаров данной группы за вычетом средств, истраченных на приобретение товаров той же группы, но имеющей стоимость, меньшую . Считая средства, выделяемые данной группой покупателей на приобретение товаров выделенной категории фиксированной, можно записать:
(3.4)
При этом величина определяется как:
(3.5)
что позволяет определить коэффициент остаточной покупательной способности по данной группе товаров как
(3.6)
Таким образом, сделанные предположения позволяют записать следующее интегро-дифференциальное уравнение на распределение вероятности потребления товаров сходного характера по стоимости:
, (3.7)
где - феноменологический параметр.
Уравнение (7) преобразуется к виду:
(3.8)
(3.9)
В записи (9) учтено, что дифференцирование ведется по нижнему пределу интегрирования. Дифференцируя (9), имеем:
(3.10)
Откуда получаем искомое дифференциальное уравнение
(3.11)
Данное уравнение допускает понижение порядка. Примем производную за новую неизвестную функцию:
, (3.12)
а саму функцию за новую переменную. Тогда
(3.13)
Подставляя (12) и (13) в (11), имеем:
(3.14)
Перейдем к новой неизвестной функции . Тогда
(3.15)
Рассмотрим выражение:
(3.16)
Видно, что если использовать , то первые два слагаемых уравнения (15) можно преобразовать к виду:
(3.17)
(3.18)
Как и выше, предполагается, что на исследуемом интервале функция не обращается в ноль. Решение рассматриваемого уравнения, очевидно, имеет вид:
(3.19)
где - произвольная постоянная. Возвращаясь к функции , имеем:
(3.20)
В итоге, уравнение первого порядка на искомую функцию может быть записано как
(3.21)
Данное уравнение представляет собой уравнение с разделяющимися переменными и можно записать:
(3.22)
Напомним, что задача состоит в отыскании асимптотики поведения исследуемой функции в области больших значений , где функция является достаточно быстро спадающей. Соответственно, можно выделить два случая:
1.
2. , точнее
Случай можно исключить из рассмотрения, так как при выполнении этого условия существует такое значение , при котором имеет место расходимость, что невозможно из физических соображений.
В первом из этих случаев соотношение (22) приобретает простой вид
(3.23)
Во втором случае в области достаточно больших значений будет выполняться неравенство:
(3.24)
и соотношение (22) для исследования асимптотики также резко упрощается:
(3.25)
Решение уравнения (23) имеет вид:
(3.26)
где из физических соображений в (23) выбран знак минус. Легко видеть, что полученное решение в асимптотической области соответствует квадратичному (т.е. относительно медленному) спаду исследуемой функции
(3.27)
Последнее приближенное равенство в (27) также записано для больших значений .
Случай 2 приводит к экспоненциальному, т.е. намного более быстрому спаду исследуемой функции, действительно, выбирая в (25) из физических соображений знак минус, получаем:
(3.28)
Этот случай, как ни удивительно соответствует экспоненциальной модели распределения вывозов по продолжительности, часто используемой в теории телетрафика.
Как было доказано в [4], экспериментальные данные преимущественно нужны для того, чтобы осуществить обоснованный выбор между двумя гипотезами, предложенными выше.
3.2 Сопоставление с экспериментальными данными
На рисунках 3.1 и 3.2 вновь представлены сглаженные гистограммы, отражающие статистическое распределение продолжительности телефонных переговоров по мобильной связи в городах Алматы и Павлодар, соответственно. Для наглядности последующего сопоставления с данными теоретического исследования, в отличие от рисунков 2.3 и 2.4, погрешности показаны только схематически. Видно, что характер кривых является сходным.
Указанные кривые допускают прямое сопоставление с функцией , рассмотренной выше, так как в первом приближении можно считать, что продолжительность телефонного разговора линейно зависит от его стоимости, по крайней мере, это справедливо для продолжительных переговоров, где уже не имеется нелинейных шкал тарификации. Т.е. по отношению к асимптотической области можно считать, что при сравнении результатов теоретического и экспериментального исследования переменная может быть заменена переменной с точностью до постоянного множителя.
Для описания полученных экспериментальных результатов в настоящей работе предложена следующая аппроксимация:
, (3.29)
где А и ф некоторые постоянные величины, имеющие определенное значение для каждого из городов, t - текущая переменная времени (продолжительность разговора).
Для сведения зависимости (29) к однопараметрической выразим значение нормировочного коэффициента А как:
, (3.30)
где x - безразмерная переменная. Существенно, что выражение, стоящее в знаменателе, представляет собой константу, не зависящую от года, сезона и т.д. Используя численное интегрирование, было получено значение = 0,784896.
Подставляя формулу (30) в (29), получаем однопараметрическую зависимость, характеризующую распределение телефонных звонков по продолжительности для городов РК:
, (3.31)
Видно, что экспериментальные точки, отвечающие продолжительным переговорам, лежат существенно выше данной аппроксимации. Иначе говоря, традиционно используемая зависимость адекватно описывает тело статистического распределения, но не описывает его хвостовую часть. По терминологии, используемой в теории управления рисками, данное статистическое распределение обладает «тяжелым хвостом». Его учет, несмотря на кажущееся малое влияние на характеристики системы в целом, тем не менее, является существенным, так как указанные события отвечают большим временам обслуживания.
Пренебрежение поведением хвостовой части распределения является не оправданным ни с точки зрения оценки среднего времени обслуживания абонентов, ни с точки зрения стоимостных показателей. Более того, как будет ясно из дальнейшего именно «тяжелый хвост» заставляет говорить об ограниченной применимости формулы Полячека-Хинчина.
Видно, что в области больших значений полученные кривые действительно ведут себя как константы. Более точно их поведение описывается аппроксимацией вида (29). Данная аппроксимация также отвечает квадратичному спаду исследуемых кривых в асимптотической области. Видно, что предложенная аппроксимация хорошо описывает экспериментально полученные распределения.
Таким образом, гистограммы, полученные на опыте, позволяют утверждать, что асимптотическое поведение кривых, описывающих статистические распределения продолжительности времени обслуживания абонентов, действительно удовлетворительно описывают экспериментальные данные.
Для выявления особенностей полученного статистического распределения на рисунке 3.8 и 3.9 показаны зависимости величины от номера . При условии, что дисперсия рассматриваемого статистического распределения является конечной, указанная величина при стремлении к бесконечности должна стремиться к определенному конечному пределу. Как показывают рисунки 3.8, 3.9, в действительности этого не происходит, при достаточно больших полученная зависимость растет как линейная функция.
Такое поведение величины означает, что полученные статистические распределения в действительности представляют собой «распределения с тяжелым хвостом» и бесконечной дисперсией.
Для таких распределений дисперсия равна бесконечности и соответственно, формула Полячека-Хинчина, а равно и другие результаты, полученные в теории телетрафика для распределений с конечной дисперсией, оказываются не применимыми.
Основываясь на полученные ранее результаты можно еще раз подчеркнуть, что упомянутая выше формула описывает только частный случай системы массового обслуживания, тем не менее ее применение оказываются под вопросом при использовании реальных статистических распределений, отражающих трафик беспроводной связи в РК.
Таким образом, сопоставление зависимостей, полученных для нескольких городов РК, показывает, что результаты, полученные ранее в [4], также справедливы и для города Павлодар, что позволяет утверждать, что они носят достаточно общий характер.
Этот результат является прямым доказательством перспективности междисциплинарного подхода для решения задач теории телетрафика.
4. Имитационное моделирование на языке GPSS World
Для дальнейшего анализа экспериментальных данных необходимо обработать их с помощью программы имитационного моделирования, для этого воспользуемся программой GPSS World. Экспериментальные данные, собранные по г. Павлодар, сравним с моделью M/M/1. Данный статический анализ позволит нам исследовать зависимость среднего времени ожидания обслуживания от интенсивности входного потока, так же будут получены фазовые портреты исследуемых зависимостей и их аппроксимации.
4.1 Моделирование системы с потерями (без накопителя) для случая M/M/1 и M/G/1
При построении программы имитации поведения для данных видов системы программировалось цепочка событий, начиная от входных требований, поступающих в случайные моменты времени, занятия и освобождение серверов в соответствии со случайным характером длительности обработки каждого требования, помещения и чтения событий из очереди в соответствии с доступностью сервера [14,15]. В итоге программирования получаем статистический отчет о процессах в системе. Поскольку интерес представляют усредненные характеристики (например, получение значений среднего времени нахождения заявок в системе), то для получения устойчивых статистических оценок требуется проимитировать большое количество рабочих циклов моделируемой системы. В рассматриваемом случае модельное время составляет 100000000, что соответствует 115,7 суткам реального времени и является достаточным для получения адекватных оценок.
На рисунке 4.1 представлено окно модели с формулированным описанием вероятностного распределения по экспоненциальному закону обслуживания.
Для сбора данных, которые необходимы для гистограммы длительности переговоров требуется команда TABLE. В соответствии с экспериментальными данными занесли операнды команды, а точнее в сохраняемой величине Х2 накапливается значения интервалов времени между поступлениями транзактов. Таблица имеет начальное нулевое значение с шагом 1 и числом интервалов 240.
Рисунок 4.1 - Листинг программы, описывающий экспоненциальное распределение времени обслуживания в модели типа M/M/1
В блоке GENERATE генерируется транзакт, который расщепляясь в блоке SPLIT, имитирует входящий поток и организует сбор статистики. Транзакт входит в блок ADVANCE, который генерирует экспоненциальное распределение (Exponential) времени обслуживания с помощью встроенной библиотеки процедур. При входе транзакта в блок SAVEVALUE, в первом случае, значение сохраняемой величины увеличивается на значение величины С1, во втором случае уменьшается на значение функции Х1, в третьем - снова увеличивается на значение С1. Блок TABULATE вносит данные в таблицу ТР, которая была определена ранее в команде TABLE. Когда транзакт входит в блок TERMINATE, он удаляется из процесса моделирования. А счетчик завершения процесса моделирования, который устанавливается командой START, уменьшается на 1. Процесс моделирования не завершается до тех пор, пока счетчик завершения не достигается нуля.
Таким образом, по данной программе в нулевой момент времени в модель вводится транзакт. Этот транзакт в блоке ADVANCE задерживается на экспоненциально распределенный промежуток времени. Блок SPLIT создает копию транзакта и направляет его на блок с меткой SDFG, исходный транзакт поступает в модель.
В результате моделирования экспоненциального распределения получили гистограмму (при использовании оператора START 100000000), отражающую функцию распределения случайной величины (рисунок 4.2.).
Теперь построим модель, с помощью которой определим вероятности отказа в обслуживании в системах с потерями.
Как было показано в главе 2, в результате сбора данных были получены статистическое распределение продолжительности переговоров по их продолжительности. Будем оперировать полученным видом статистического распределения для описания системы. Чтобы смоделировать заданную непрерывную функцию воспользуемся командой FUNTCTION, определяющие правила поиска значения функции в таблице.
Рисунок 4.2 - Гистограмма экспоненциально распределенного времени обслуживания
Для определения функции в GPSS проведем несколько действий. Меткой присваиваем имя функции FGH, зададим аргументы функции RN1, т.е. аргументом является ссылка на генератор случайных чисел, используемый для розыгрыша в соответствии с распределением, заданным функцией. В GPSS World количество генератора случайных чисел не ограничено, а выдаваемые ими значения 0…0,99999. Далее, задаем тип функции С, так как функция является непрерывной, и число крайних точек, на единицу больше числа отрезков, составляющих функцию. Задаем соответствующие значения функции (координаты крайних точек функции), т.е. полученное статистическое распределение.
Оператор задания координат точек i, задается значениями Xi Yi, разделяются запятой, последовательные наборы координат разделяются знаком «/» и пара координат не должны разрываться. Также особенностью оператора описания координат функции является необходимость удовлетворения следующих неравенств:
Значение функции является его стандартным числовым атрибутом. Способ ссылки на этот атрибут зависит от того, как задано имя функций.
Последующие используемые блоки для моделирования системы не отличаются от предыдущей модели кроме блока ADVANCE, генерирует в отличие от предыдущего не экспоненциальное распределение, а полученное статистическое распределение обслуживания заявок по их продолжительности для г. Павлодар. На рисунках 4.3 и 4.4 приведены листинг программы и полученная гистограмма соответственно.
Рисунок 4.3 - Листинг модели полученного статистического распределения длительности обслуживания для г. Павлодар
По данным гистограмм видно, что длительности обслуживания дополнительно доказывает выводы, сделанные в главе 3 (п.3.2) о неоправданности не учета влияния «хвостовой части» распределения на процесс обслуживания вызовов в сотовой связи.
Рисунок 4.4 - Гистограмма, отвечающая распределению числа звонков по их продолжительности обслуживания для г. Павлодар
Не смотря на то, что узлы обработки информации ТКС и системах как правила обладают буфером, было произведено сравнение модели с экспоненциальным обслуживанием и обслуживанием с найденным экспериментальным распределением.
Проанализируем систему массового обслуживания типа М/М/1 без накопителя, т.е. с потерями, так как поступившая заявка в случае занятности сервера теряется. По классификации Кендалла ясно, что входной поток является пуассоновским распределение времени обслуживания в серверах - экспоненциальное, а число серверов будем считать равным - 1. Так как входной поток ординарный, то в каждый момент времени может добавиться только одна заявка; поскольку сервер один, то каждый момент времени может быть обслужена лишь одна заявка. Моделирование описанной системы в среде GPSSW приведен в листинге (рисунок 4.5).
Рисунок 4.5 - Модель системы массового обслуживания типа М/М/1
Оператор VERIABLE определяет арифметическую переменную, т.е. при обращении к арифметической переменной FG ее значение вычисляется как алгебраическое деление (результатом операции является целая часть частного) значений X2 на X1. Числовые атрибуты Х1, Х2, Х3 дают значения соответствующей сохраняемой величине. Все сохраняемые величина инициализируются с помощью оператора INITIAL.
Модель генерирует входящий поток, распределенный по экспоненциальному закону. Задаем различные интенсивности для анализа длительности среднего времени ожидания в системе.
Транзакт передается в МЕТ1, если это сделать не удается, транзакт пытается перейти в блок МЕТ2. Если транзакт не сможет перейти ни к тому, ни к другому, то он остается в блоке TRANSFER и при каждом просмотре списка текущих событий, будет повторять в том же порядке попытки перехода до тех пор, пока не сможет выйти из блока TRANSFER (режим BOTH).
Если устройство свободно, транзакт может войти в блок. Вход транзакта в блок вызывает выполнение подпрограммы обработки этого блока. Состояние устройства изменяется со свободного на занятое. Событие «занятие устройства» реализуется блоком SIZE (занять).
Подобные документы
Язык моделирования GPSS World, его особенности и версии. Разработка заданий для обучения основным и специальным приемам создания имитационных моделей на языке GPSS World. Разработка программной документации. Разработка и написание методических указаний.
дипломная работа [4,4 M], добавлен 07.07.2012Понятие компьютерной модели и преимущества компьютерного моделирования. Процесс построения имитационной модели. История создания системы GPSS World. Анализ задачи по прохождению турникета на стадион посредством языка имитационного моделирования GPSS.
курсовая работа [291,3 K], добавлен 11.01.2012Разработка имитационной модели функционирования кладовой на промышленном предприятии с использованием имитационного метода в среде GPSS World. Экспериментальное исследование результатов моделирования. Выработка предложений по оптимизации работы системы.
курсовая работа [183,1 K], добавлен 27.08.2012Особенности систем массового обслуживания и сущность имитационного моделирования с использованием GPSS. Структурная схема модели системы и временная диаграмма. Сравнение результатов имитационного моделирования и аналитического расчета характеристик.
курсовая работа [214,2 K], добавлен 23.06.2011Понятие компьютерной и информационной модели. Задачи компьютерного моделирования. Дедуктивный и индуктивный принципы построения моделей, технология их построения. Этапы разработки и исследования моделей на компьютере. Метод имитационного моделирования.
реферат [29,6 K], добавлен 23.03.2010Обзор средств компьютерного имитационного моделирования по созданию веб-приложения для визуализации имитационных моделей. Система имитационного моделирования AnyLogic, Arena, SimuLab. Серверная, клиентская часть. Модель работы отдела банка и участка цеха.
дипломная работа [3,3 M], добавлен 25.05.2015Принципы работы в системе имитационного моделирования GPSS World. Анализ количества транзактов, вошедших в блок с момента последней трансляции. Характеристика команд Window/Simulation, Window/Block, Command/Creat Simulation. Образец системы Sample 1.
лабораторная работа [343,3 K], добавлен 29.03.2015Автоматизация технологических процессов. Написание имитационных моделей систем с дискретными событиями. Модели систем массового обслуживания в общецелевой системе GPSS. Логическая схема алгоритмов и схема программы. Математическая модель и ее описание.
курсовая работа [1,4 M], добавлен 29.06.2011Особенности моделирования работы сборочного участка цеха, которая состоит из трех этапов: сборка, предварительная обработка и регулировка деталей. Понятие среды имитационного моделирования GPSS World - программного комплекса, работающего под Windows.
контрольная работа [39,5 K], добавлен 04.06.2011Основы систематизации языков имитационного моделирования, моделирование систем и языки программирования. Особенности использования алгоритмических языков, подходы к их разработке. Анализ характеристик и эффективности языков имитационного моделирования.
курсовая работа [1,4 M], добавлен 15.03.2012