Статистический анализ химизма подземных вод с целью определения их пригодности для хозяйственно-бытового водоснабжения

Определение закона распространения компонентов в подземных водах района для минерализации Na, Ca. Анализ параметров статистического распределения компонентов в поземных водах района. Корреляционный и регрессионный анализ компонентов подземных вод.

Рубрика Геология, гидрология и геодезия
Вид курсовая работа
Язык русский
Дата добавления 13.10.2012
Размер файла 210,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru

Содержание

Введение

1. Определение закона распространения компонентов в подземных водах района

2. Анализ параметров статистического распределения компонентов в поземных водах района

3. Корреляционный анализ компонентов подземных вод

4. Регрессионный анализ компонентов подземных вод района

Заключение

Список использованной литературы

Введение

Наблюдение какого-либо явления происходящего при определенных условиях, в теории вероятности называется испытанием. Результат испытания является событием.

Раздел математики, посвященный методам сбора, анализа и обработки статистических данных для научных и практических целей, называется математической статистикой.

Целью статистического исследования является обнаружение и исследование соотношений между статистическими данными, и их использование для изучения, прогнозирования и принятия решений.

Статистические данные представляют собой данные, полученные в результате обследования большого числа объектов или явлений.

Математическая статистика подразделяется на две основные области: описательную и аналитическую статистику. Описательная статистика охватывает методы описания статистических данных, представления их в форме таблиц, распределений и т.д. Аналитическая статистика или теория статистических выводов ориентирована на обработку на данных, полученных в ходе эксперимента, с целью формулировки выводов, имеющих прикладное значение для самых различных областей человеческой деятельности, в том числе охраны окружающей среды.

По охвату статистической совокупности исследование может быть сплошное или не сплошное. При сплошном статистическом исследовании группа наблюдения формируется путем полного охвата всех единиц изучаемого явления. Множество всех единиц наблюдения, охватываемых таким сплошным наблюдением, называется генеральной совокупностью.

Основным методом не сплошного наблюдения является выборочный метод. Если интересующая нас совокупность слишком многочисленна, либо ее элементы малодоступны, а также, если имеются другие причины (организационные, финансовые, физические и т.п.), не позволяющие изучать сразу все ее элементы, прибегают к изучению какой-то части этой совокупности. Это выбранная для полного исследования группа элементов называется выборкой или выборочной совокупностью. Задача выборочного метода состоит в том, чтобы сделать правильные выводы относительно всего собрания объектов, их совокупности. Конечной целью изучения выборочной совокупности является получение информации о генеральной совокупности.

1. Определение закона распространения компонентов в подземных водах района

Все параметры статистического распределения компонентов случайной величины опираются на знание закона ее распределения F(x). Однако, для практических задач такое знание - редкость. Здесь закон распределения обычно не известен или известен с точностью до некоторых неизвестных параметров. В результате на практике сведения о законе распределения случайной величины получают независимыми многократными повторениями опыта, в котором измеряются значения интересующей исследователей случайной величины (варианты). На основе информации из полученной выборки можно построить приблизительные значения для функций распределения и других характеристик случайной величины.

Выборочной (эмпирической) функцией распределения случайной величины, построенной по выборке маленькими x1, x2, ..., xn, называется функция Fn(x), равная доле таких xi, что xi ? x, i=1,...,n.

Другими словами есть частота события xi ? x в ряду x1, x2, ..., xn. Связь между эмпирической функцией распределения и теоретической функцией распределения такая же, как связь между частотой события и ее вероятностью: Fn(x) > F(x), при n > ?.

Для построения выборочной функции распределения весь диапазон изменения случайной величины X разбивают на ряд интервалов одинаковой ширины. Число интервалов обычно выбирают не менее 5 и не более 15. Затем определяют число значений случайной величины Х попавших в каждый интервал. Поделив эти числа на общее количество наблюдений n, находят относительную частоту попадания случайной величины Х в заданные интервалы. По найденным относительным частотам строят гистограммы выборочных функций распределения. Если соответствующие точки относительных частот соединить ломаной линией, то полученная диаграмма будет называться полигоном частот. Кумулятивная прямая будет получена, если по оси абсцисс откладывать интервалы, а по оси ординат число или доли элементов совокупности, имеющих значение, меньшее или равное заданному. При увеличении до бесконечности размера выборки выборочные функции распределения превращаются в теоретические: гистограмма превращается в график плотности распределения, а кумулятивная прямая - в график функции распределения.

В курсовой работе определен закон распределения для минерализации Na, Ca. Для этого выборка по каждому компоненту была отсортирована по возрастанию и были удалены «ураганные значения». Для нахождения величины интервала разницы между минимальными и максимальными значениями была поделена на количество интервалов (6). Затем посчитано количество вариант выборки попадающей в каждый из интервалов. Поделив эти значения на величину выборки мы получим относительные частоты, а сложением соответствующих относительных частот рассчитаны накопительные частоты. На основе относительных частот построены гистограммы частот для каждого компонента (рисунки 1, 3, 5), а по значениям накопительных частот построены кумулятивные кривые (рисунки 2, 4, 6) каждого компонента с указанием закона распределения и величины достоверности аппроксимации, показывающей, насколько полученные законы распределения соответствуют действительности.

По рисункам 1 - 6 можно сделать вывод, что в подземных водах данного района величина минерализации, концентрации Na, Са распределены по логнормальному закону.

Находим фоновые и аномальные значения величин показателей и концентраций компонентов в подземных водах, полученные данные сводим в таблицу 1.

Рисунок 1. - Гистограмма частот минерализации.

Рисунок 2. - Кумулятивная кривая минерализации.

Рисунок 3. - Гистограмма частот концентрации натрия.

Рисунок 4. - Кумулятивная кривая концентрации натрия.

Рисунок 5. - Гистограмма частот концентрации хлора.

Рисунок 6. - Кумулятивная кривая концентрации хлора.

подземный вода компонент

Размещено на http://www.allbest.ru

Таблица 1. - Фоновые и аномальные значения.

М

pH

Жесткость

Na

Ca

Mg

Cl

SO4

Fe2

Zn

Sr

Li

Br

B

F

Cu

Mn

Cфон.

4,24

7,64

19,22

1108

203,73

106,06

1522

829

0,15

0,09

11,51

0,10

3,34

0,22

0,30

0,07

0,36

у

3,57

0,26

9,21

1226

96,64

56,90

2034

424

0,14

0,11

15,98

0,07

3,00

0,19

0,24

0,05

0,17

Cфон + 3 у

14,9

8,42

46,84

4786

493,66

276,77

7624

2102

0,56

0,43

59,44

0,32

12,33

0,80

1,02

0,21

0,89

Cфон - 3 у

-6,46

6,87

-8,40

-2571

-86,19

-64,64

-4581

-445

-0,26

-0,26

-36,42

-0,12

-5,65

-0,36

-0,41

-0,07

-0,16

Количество аномальных значений по верхнему пределу

2

3

3

2

1

2

2

2

3

1

1

2

2

1

2

0

0

Количество аномальных значений по нижнему пределу

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

Количество аномальных значений

2

3

3

2

1

2

2

2

3

1

1

2

2

1

2

0

0

Размещено на http://www.allbest.ru

2. Анализ параметров статистического распределения компонентов в поземных водах района

Замена теоретической функции распределения F(x) на её выборочный аналог Fn(x) в определении математического ожидания, дисперсии, стандартного отклонения и т.п. приводят к выборочному среднему, выборочной дисперсии, выборочному стандартному отклонению и т.д. Выборочные характеристики являются оценками соответствующих характеристик генеральной совокупности.

Среди выборочных характеристик выделяют показатели, относящиеся к центру распределения (меры положения), показатели рассеяния вариант (меры рассеяния) и меры формы распределения.

К показателям, характеризующим центр распределения, относят различные виды средних (арифметическая, геометрическая и т.п.) показателей, а также моду и медиану.

Простейшим показателем, характеризующим центр выборки, является мода. Мода - это элемент выборки с наиболее часто встречающимся значением (наиболее вероятная величина). В экологических исследованиях моду используют в качестве геохимического фона, если неизвестен закон распределения компонента.

Средним значением выборки или выборочным аналогом математического ожидания называется величина . Среднее арифметическое значение используется в качестве геохимического фона при нормальном распределении компонента.

Основными показателями рассеяния вариант являются интервал, дисперсия выборки, стандартное отклонение и стандартная ошибка.

Интервал (амплитуда или вариационный размах) - это разница между максимальным и минимальным значениями элементов выборки. Интервал является простейшей и наименее надёжной мерой вариации или рассеяния элементов в выборке.

Более точно отражают рассеяние показатели, учитывающие не только крайние, но и все значения элементов выборки.

Дисперсией выборки или выборочным аналогом дисперсии называется величина =. Дисперсия выборки - это параметр, характеризующий степень разброса элементов выборки относительно среднего значения. Чем больше дисперсия, тем дальше отклоняются значения элементов выборки от среднего значения. При анализе экологических данных дисперсия характеризует неоднородность геохимического поля. Высокое значение дисперсии свидетельствует о наличии аномалий.

Выборочным стандартным отклонением (средним квадратичным отклонением) называется величина . Это параметр, также характеризующий степень разброса элементом выборки относительно среднего значения. Чем больше среднее квадратичное отклонение, тем дальше отклоняются значения элементов выборки от среднего значения. Параметр аналогичен дисперсии и используется в тех случаях, когда необходимо, чтобы показатель разброса случайной величины выражался в тех же единицах, что и среднее значение этой случайной величины. В курсовой работе среднеквадратичное отклонение используется для расчёта аномальных значений (см. табл. 1).

Показателями, характеризующими форму распределения, являются выборочные эксцесс и асимметрия.

Эксцесс - это степень выраженности «хвостов» распределения, т.е. частоты появления удалённых от среднего значений.

Асимметрия - величина, характеризующаяся несимметричностью распределения элементов выборки относительно среднего значения. Принимает значения от -1 до 1. В случае симметричного распределения асимметрия равна нулю.

Часто значения асимметрии и эксцесса используют для проверки гипотезы о том, что данные выборки принадлежат к определённому теоретическому распределению, например для нормального распределения асимметрия равна нулю, а эксцесс - трём.

В курсовой работе посчитаны основные параметры статистического распределения компонентов в подземных водах района (табл. 2).

Кроме того, расчитаны контрастность максимального, среднего и минимального значений концентраций загрязняющих веществ к их ПДК (рисунок 7).

Размещено на http://www.allbest.ru

Таблица 2. - Параметры статистического распределения компонентов в подземных водах района

М

pH

Жесткость

Na

Ca

Mg

Cl

SO4

Fe2

Zn

Sr

Li

Br

B

F

Cu

Mn

Cсред..

4,24

7,64

19,22

1107,64

203,73

106,06

1521,8

829

0,15

0,09

11,5

0,10

3,34

0,22

0,30

0,07

0,36

Cmin

0,60

6,90

1,58

68,90

27,80

0,40

39,20

48,1

0,00

0,00

0,63

0,00

0,00

0,00

0,00

0,02

0,20

Cmax

53,20

8,90

69,52

18234

1197

470,30

30459

2600

1,00

2,40

83,4

0,42

38,70

1,70

1,50

0,14

0,70

Дисперсия

69,12

0,15

190,93

8461908

31220

8186

24096741

308455

0,04

0,12

730

0,01

39,22

0,09

0,11

0,00

0,04

у

3,57

0,26

9,21

1226,11

96,64

56,90

2034,2

424,4

0,14

0,11

16

0,07

3,00

0,19

0,24

0,05

0,17

Мода

1,9

7,6

#Н/Д

462,00

165,20

#Н/Д

104,6

#Н/Д

0,10

0,00

#Н/Д

0,00

0,00

0,00

0,20

#Н/Д

#Н/Д

ПДК

1

7

100

100

200

200

350

500

0,30

1

2

0,03

0,20

0,50

1,50

5

0,20

Размещено на http://www.allbest.ru

Рисунок 7. - Контрастность максимального, среднего и минимального значений концентраций загрязняющих веществ к ПДК

Проанализировав совместно таблицу 2 и рисунок 7 можно сделать следующие выводы: в исследуемых водах при относительно малых значениях минерализации средние концентрации Na, Cl, Br, Sr и SO4 не значительно превышают значения ПДК. Так как Na, Cl и SO4 являются макрокомпонентами, то необходимо провести очистку и только после этого воду можно использовать в хозяйственно-бытовых целях.

3. Корреляционный анализ компонентов подземных вод

Корреляционный анализ служит для выявления взаимосвязей между выборками.

Одна из наиболее распространённых задач статистического исследования состоит и в изучении связи между некоторыми наблюдаемыми переменными. Знания взаимозависимостей отдельных признаков даёт возможность решать одну из кардинальных задач любого научного исследования: возможность предвидеть, прогнозировать развитие ситуации, при изменении конкретных характеристик объекта исследования.

Обычно взаимосвязь между выборками носит нефункциональный, а вероятностный характер. В этом случае нет строгой, однозначной зависимости между величинами. При изучении таких зависимостей различают регрессию и корреляцию.

Регрессионный анализ устанавливает формы зависимости между случайной величиной Y и значениями одной или нескольких переменных величин.

Корреляционный анализ состоит в определении степени связи между двумя случайными величинами X и Y. В качестве меры такой связи используется коэффициент корреляции, который оценивается по выборке объёма n связанных пар наблюдений (xi, yi) из совместной генеральной совокупности X и Y.

Существует несколько типов коэффициентов корреляции, применение которых зависит от предположений о совместном распределении величин X и Y. Для оценки степени взаимосвязи наибольшее распространение получил коэффициент линейной корреляции (Пирсона), предполагающий нормальный закон распределения наблюдений.

Коэффициент корреляции - параметр, характеризующий степень линейной взаимосвязи между двумя выборками. Коэффициент корреляции изменяется от -1 (строгая обратная линейная зависимость) до 1 (строгая прямая пропорциональная зависимость). При значении 0 линейной зависимости между выборками нет.

Выборочный коэффициент линейной корреляции между двумя случайными величинами X и Y рассчитывается по формуле

.

На практике коэффициент корреляции принимает некоторые промежуточные значения между 1 и -1. Для оценки степени взаимосвязи можно руководствоваться следующими правилами:

Если коэффициент корреляции (r) по абсолютной величине больше, чем 0,95, то между параметрами существует практически линейная зависимость (прямая - при положительном r и обратная - при отрицательном r).

Если коэффициент корреляции |r| лежит в диапазоне от 0,8 до 0,95, то существует сильная степень линейной связи между параметрами.

Если 0,6<|r|<0,8, то говорят о наличии линейной связи между параметрами.

При |r|<0,4 считается, что линейная взаимосвязь между параметрами отсутствует.

При большом числе наблюдений, когда коэффициенты корреляции необходимо последовательно вычислять из нескольких рядов числовых данных, для удобства получаемые коэффициенты сводят в таблицы, называемые корреляционными матрицами.

Матрица парной корреляции или корреляционная матрица - это квадратная или прямоугольная таблица, в которой на пересечении соответствующих: строки и столбца находится коэффициент корреляции между соответствующими параметрами.

В курсовой работе построена матрица парной корреляции компонентов в подземных водах (табл. 3).

Среди полученных данных выявлены парой компонентов, образующих различную степень линейной зависимости:

|r| > 0.9 выделено жирным - M-Na, M-Cl, Na-Cl, M-Sr, Na-Sr, Cl-Sr, M-Cu, Na-Cu, Cl-Cu, Fe2-Cu, Sr-Cu, L -Cu, Br-Cu, F-Cu.

0.8< |r| <0.9 выделено подчеркиванием - M-Ca, Жесткость-Ca, Жесткость-Mg, Fe2-Li, Sr-Br, Жесткость-Cu, Ca-Cu, Mg-Cu.

0.5 < |r| <0.9 выделено курсивом - M- Жесткость, Na-Ca, pH-Mg, Жесткость-Cl, Ca-Cl, Mg-SO4, Mg-Zn, Жесткость-Sr, Жесткость-Ca, Жесткость-Mg, M-Li, Na-Li, Cl-Li, Li-Br, Sr-Li.

Размещено на http://www.allbest.ru

Таблица 3. - Матрица парной корреляции компонентов в подземных водах.

pH

Жесткость

Na

Ca

Mg

Cl

SO4

Fe2

Zn

Sr

Li

Br

B

F

Cu

М

0,08

0,59

1,00

0,80

0,17

1,00

-0,17

0,12

0,03

0,99

0,77

0,41

0,01

-0,07

0,99

pH

-0,43

0,15

-0,16

-0,62

0,13

-0,54

0,18

-0,20

-0,59

0,14

-0,14

-0,12

0,17

-0,60

Жесткость

0,52

0,89

0,81

0,52

0,57

-0,10

0,43

0,78

0,06

0,06

-0,14

-0,26

0,90

Na

0,75

0,08

1,00

-0,25

0,14

-0,01

0,99

0,78

0,42

0,02

-0,04

0,99

Ca

0,46

0,76

0,23

-0,16

0,20

0,79

0,05

0,01

-0,08

-0,24

0,89

Mg

0,09

0,78

0,02

0,57

0,74

0,06

0,11

-0,16

-0,17

0,90

Cl

-0,25

0,12

-0,01

0,99

0,75

0,43

0,03

-0,06

0,99

SO4

-0,08

0,45

-0,26

-0,29

-0,21

-0,22

-0,08

-0,52

Fe2

0,09

0,43

0,82

0,42

-0,18

-0,02

1,00

Zn

0,07

0,01

0,05

-0,12

-0,13

0,05

Sr

0,71

0,90

-0,08

0,44

0,98

Li

0,71

-0,03

0,17

1,00

Br

-0,10

0,00

0,96

B

-0,19

F

1,00

Размещено на http://www.allbest.ru

4. Регрессионный анализ компонентов подземных вод района

Регрессия используется для анализа воздействия на отдельную зависимую переменную значений одной или более независимых переменных.

Регрессионный анализ устанавливает формы зависимости между случайной величиной Y (зависимой) и значениями одной или нескольких переменных величин X (независимых), причем значения последних считаются точно заданными. Такая зависимость обычно определяется некоторой математической моделью (уравнение регрессии), содержащей несколько неизвестных параметров. В ходе регрессионного анализа на основании выборочных данных находят оценки этих параметров, определяются статистические ошибки оценок или границы доверительных интервалов и проверяется соответствие принятой математической модели экспериментальных данных.

В линейном регрессионном анализе связь между случайными величинами предполагается линейной. В самом простом случае в линейной регрессионной модели имеются две переменные X и Y. Требуется по n парам наблюдений (Xi Yi) построить прямую линию, называемую линией регрессии, которая максимально приближает наблюдаемые значения. Уравнение этой линии Y=aX+b является регрессионным уравнением. С помощью регрессионного уравнения можно предсказать ожидаемое значение величины Y, соответствующее заданному значению независимой переменной X.

Мерой эффективности регрессионной модели является коэффициент детерминации (величина достоверности аппроксимации) R2 , который определяет, с какой степенью точности полученное регрессионное уравнение описывает исходные данные.

В курсовой работе для пар компонентов, имеющих значимые коэффициенты парной корреляции, построены графики зависимости (рисунки 8-16). Найденные для этих пар уравнения регрессии и величины достоверности аппроксимации сведены в таблице 4.

Таблица 4. - Сводная таблица уравнений регрессии.

Пара компонентов или показателей

Уравнение регрессии

Величина достоверности аппроксимации

M-Na

y=348,29x - 367,64

R2=0,9909

M-Cl

y=587,67x - 967,39

R2=0,9907

M-Ca

y=16,972x+131,85

R2=0,6377

Жесткость-Ca

y=11,137x - 14,145

R2=0,786

Жесткость-SO4

y=23,065x+385,41

R2=0,3293

pH-SO4

y=-785,86x+9833,3

R2=0,2917

SO4-Mg

y=0,1217x+0,6418

R2=0,6098

Cl-Na

y=0,5921x+206,61

R2=0,9983

Cl-Ca

y=0,0272x+162,3

R2=0,5722

Анализ рисунков 8 - 16 позволяет сделать следующий вывод: в ходе проведенных исследований было выявлено, что в подземных водах района при небольшой минерализации воды имеют хлоридно-натриевый состав. В связи с чем, необходимо провести дополнительные исследования для установления генезиса такого состава.

Рисунок 8. - График зависимости содержания Na от величины минерализации.

Рисунок 9. - График зависимости содержания Cl от величины минерализации.

Рисунок 10. - График зависимости содержания Ca от величины минерализации.

Рисунок 11. - График зависимости содержания Ca от величины жесткости.

Рисунок 12. - График зависимости содержания SO4 от величины жесткости.

Рисунок 13. - График зависимости содержания SO4 от величины pH.

Рисунок 14. - График зависимости содержания Mg от содержания SO4.

Рисунок 15. - График зависимости содержания Na от содержания Cl.

Рисунок 16. - График зависимости содержания Ca от содержания Cl.

Заключение

В курсовой работе методами математической статистики проведен анализ химического состава подземных вод конкретного района с целью определения их пригодности для хозяйственно-бытового водоснабжения.

В процессе выполнения курсовой работы определены законы распределения отдельных компонентов и показателей в подземных водах района (минерализация, хлор, натрий); определены параметры статистического распределения компонентов в водах; проведен корреляционный анализ компонентов и построена матрица парной корреляции; проведен регрессионный анализ и найдены уравнения линейной регрессии. Также в работе проанализирована контрастность максимальных, минимальных и средних значений концентраций загрязняющих веществ к их ПДК. Сделан вывод о возможности использования подземных вод района в хозяйственно бытовых целях после дополнительной очистки. Анализ показал, что вода при незначительной минерализации имеет хлоридно-натриевый состав и для дальнейшего использования необходимо провести ряд исследований с целью установления генезиса, такого состава подземных вод района.

Список использованной литературы:

Гельман В. Я. Решение математических задач средствами Excel: Практикум. - СПб: Питер, 2003. - 237с.

Додж М., Стинксон К. Эффективная работа: Microsoft Excel 2002.- СПб Питер, 2003.

1. Размещено на www.allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.