close

Вход

Забыли?

вход по аккаунту

?

712

код для вставкиСкачать
М. Я. ЕПИФАНЦЕВА
ЛАБОРАТОРНЫЙ ПРАКТИКУМ
ПО СТАТИСТИКЕ
ЧАСТЬ 1
Омск 2014
Министерство транспорта Российской Федерации
Федеральное агентство железнодорожного транспорта
Омский государственный университет путей сообщения
__________________________________________________
М. Я. Епифанцева
ЛАБОРАТОРНЫЙ ПРАКТИКУМ
ПО СТАТИСТИКЕ
Часть 1
Утверждено редакционно-издательским советом университета
в качестве методических указаний к лабораторным работам для студентов,
обучающихся по специальностям «Информационная безопасность автоматизированных систем», «Информационная безопасность телекоммуникационных
систем», «Информационно-аналитические системы безопасности»
Омск 2014
УДК 519.2(075.8)
ББК 22.17я73
Е67
Лабораторный практикум по статистике. Часть 1: Методические указания к лабораторным работам / М. Я. Епифанцева; Омский гос. ун-т путей
сообщения. Омск, 2014. 39 с.
Лабораторный практикум по статистике содержит методические указания по выполнению двух лабораторных работ по дисциплине «Теория вероятностей и математическая статистика», теоретический материал и примеры выполнения двух типовых задач статистики: построение закона распределения
случайных величин по выборке и нахождение доверительных интервалов для
неизвестных параметров распределения. Для выполнения каждой работы студенты затратят не более четырех часов.
Предназначены для студентов 3-го курса специальностей 090302
(10.05.02), 090303 (10.05.03), 090305 (10.05.04), а также могут быть использованы при изучении раздела «Статистика» курса «Математика» дневной, заочной и дистанционной форм обучения.
Библиогр.: 3 назв. Табл. 7. Рис. 8. Прил. 3.
Рецензенты: доктор техн. наук, профессор В. А. Нехаев;
канд. физ. мат. наук, доцент Л. Н. Романова.
__________________________
© Омский гос. университет
путей сообщения, 2014
ОГЛАВЛЕНИЕ
Введение…………………………………………………………………………
Лабораторная работа 1. Построение закона распределения случайной
величины по выборке…………………………………..……………………….
1.1. Построение статистического ряда ………………………………………
1.2. Графическое представление статистического ряда ……………………
1.3. Построение эмпирической функции распределения …………………..
1.4. Числовые характеристики статистического распределения
(оценки) ……………………………………………………………….......
1.5. Выравнивание статистических рядов ……………………………..……
1.6. Статистическая проверка гипотез ………………………………………
1.7. Индивидуальные задания ………………………………………..……....
1.8. Контрольные вопросы ……………………………………………..……
Лабораторная работа 2. Интервальные оценки для неизвестного
математического ожидания и дисперсии……………………………….……
2.1. Интервальные оценки………………………………………………….
2.2. Построение доверительного интервала для неизвестного
математического ожидания при известном σ ……………………………….
2.3. Построение доверительного интервала для неизвестного математического ожидания при неизвестном σ………………………………………..
2.4. Построение доверительного интервала для дисперсии……………...
2.5. Индивидуальные задания………………………………………….…...
2.6. Контрольные вопросы………………………………………………….
Библиографический список…………………………………………………...
Приложение 1. Таблица значений функции Ф(х)…………………………...
Приложение 2. Критические точки распределения c2……..……………......
Приложение. 3. Критические точки распределения Стьюдента…………...
4
5
6
6
9
11
12
15
18
21
21
22
23
23
25
28
31
34
34
35
37
38
ВВЕДЕНИЕ
Лабораторный практикум по статистике, написанный в соответствии с действующей программой по теории вероятностей и математической статистике,
предназначен для студентов, обучающихся по направлению (специальностям)
информационной безопасности, а именно «Информационная безопасность телекоммуникационных систем», 090302 (100502), 090303 (10.05.03), 090305
(10.05.04). Практикум может быть использован студентами при изучении раздела «Статистика» курса «Математика» дневной, заочной и дистанционной
форм обучения, а также лицами, желающими приобрести навыки решения типовых задач статистики, но не имеющими повседневной квалифицированной
помощи преподавателя.
В каждой из двух лабораторных работ практикума содержатся краткие теоретические сведения, необходимые для решения задачи, примеры решения. В
приложениях приведены таблицы значений функций, использующих при
вычислениях. Каждая лабораторная работа имеет 16 однотипных вариантов
заданий, список контрольных вопросов.
Автор признательна рецензентам: доктору техн. наук, профессору В. А.
Нехаеву; канд. физ. мат. наук, доценту Л. Н. Романовой за сделанные замечания, устранение которых способствовало улучшению первоначальной редакции.
5
Лабораторная работа 1
ПОСТРОЕНИЕ ЗАКОНА РАСПРЕДЕЛЕНИЯ
СЛУЧАЙНОЙ ВЕЛИЧИНЫ ПО ВЫБОРКЕ
Ц е л ь р а б о т ы: по выборке объема 200 чисел построить закон распределения случайной величины (СВ).
Последовательность выполнения работы
1. Упорядочить выборку, т. е. ее элементы расположить в порядке возрастания.
2. Построить статистический ряд.
3. Построить гистограмму (полигон).
4. Построить эмпирическую функцию распределения.
5. Найти точечные оценки: m*x, D*x, σ*x, оценку моды, медианы, асимметрии и эксцесса.
6. Высказать гипотезу о виде распределения СВ.
7. Используя метод моментов и наибольшего правдоподобия, определить параметры распределения.
8. Проверить гипотезу, используя критерий χ2 Пирсона (уровень значимости α = 0,01).
При выполнении лабораторных работ целесообразно использовать
электронные таблицы пакета Microsoft Office.
Оформить лабораторные работы на листах формата А4.
После выполнения работы необходимо ее защитить у преподавателя
письменно или устно.
1.1. Построение статистического ряда
Пусть Х – некоторый признак изучаемого объекта (разряд рабочего, вес,
диаметр шарика и т. д.). Признак X может быть дискретным, т. е. значения отличаются на конечную, заранее известную величину (год рождения, число
людей), или непрерывным, т. е. его значения отличаются на сколь угодно малую величину (время, вес, объем, стоимость). Генеральной совокупностью яв6
ляется множество всех значений признака, а результаты n наблюдений над
признаком X дадут нам выборку объема n.
Упорядочиваем (ранжируем) выборку. Ранжированный вариационный
ряд получают, если расположить варианты xi, где i = 1,2,K, n , в порядке возрастания значений, т. е. x1 £ x2 £ K £ x j £ K £ xn .
Строим статистический (вариационный) ряд. Статистический ряд для
дискретного признака X принято представлять в виде таблицы, в первой строке
которой указаны k различных значений xi изучаемого признака, а во второй стротi
, где i = 1,2,K , k .
п
Частотой mi в случае дискретного признака X называют число одинаковых вариантов xi, содержащихся в выборке. В ранжированном вариационном ряду одинаковые варианты расположены подряд:
*
ке – соответствующие этим значениям частоты рi =
n 44444444
6444444447
8
x1 , x1 ,K, x1 ,K, xi , xi ,K, xi ,K, xk , xk ,K, xk .
1
4243
14243
142
4 43
4
m1
mi
mk
k
k
i =1
i =1
Очевидно, что сумма относительных частот равна единице: å pi* = å
Дискретный вариационный ряд приведен в табл. 1.1.
mi
= 1.
n
Т а б л и ц а 1.1
Дискретный ряд
Х
p*
x1
p1*
x2
p 2*
xk
pk*
…
…
Полученная в результате статистического наблюдения выборка из n значений (вариант) изучаемого количественного признака X образует вариационный (статистический) ряд. Первоначальные статистические данные – x1, х2,
…, хn (не сгруппированные данные).
Пример 1. Необходимо проанализировать тарифные разряды 50 рабочих, построить дискретный вариационный ряд. Разряды имеют значение от
одного до шести включительно. Статистический ряд тарифных разрядов представлен в табл. 1.2.
Т а б л и ц а 1.2
Статистический ряд тарифных разрядов
Х
mi
p*
1
3
0,06
2
3
0,06
3
8
0,16
7
4
8
0,16
5
21
0,42
6
7
0,14
Если имеем дело с непрерывной случайной величиной или объем выборки велик (несколько сотен значений), принято строить интервальный статистический ряд. Для определения числа разрядов интервального статистического ряда используют формулу Старджеса: k » 1+ 3,32 lg n , где k – количество
разрядов, n – объем выборки. Полученное значение k следует округлить до
целого.
Интервальным рядом называют таблицу, в первой строке которой указаны k интервалов значений изучаемого признака X вида (xi–1 – xi), а во второй
m
*
приведены относительные частоты pi = i , где i = 1,2,K, k . Сумма относиn
k
k
i=1
i =1
*
тельных частот равна единице: å pi =å
mi
= 1 . Интервальный статистиn
ческий ряд представлен в табл. 1.3.
Т а б л и ц а 1.3
Интервальный ряд
I
x0 – x1
x1 – x2
…
xk–1 – xk
p i*
p1*
p *2
…
pk*
Пример 2. Имеем выборку 200 чисел.
-6,494800
-5,994428
-5,836652
-5,601567
-5,512752
-5,428586
-5,349983
-5,050319
-4,997349
-4,811224
-4,758517
-4,705463
-4,618203
-4,553404
-4,55044
-4,530531
-4,514566
-4,425937
-4,382975
-4,321433
-4,277443
-4,268194
-4,113700
-4,075339
-4,067679
-4,061593
-4,059783
-3,964371
-3,918586
-3,901247
-3,829269
-3,703463
-3,679801
-3,675197
-3,673168
-3,668436
-3,636871
-3,599102
-3,585594
-3,452130
-3,433609
-3,395910
-3,384936
-3,332409
-3,080500
-3,073993
-3,069145
-3,051094
-2,998576
-2,997916
-2,833681
-2,827838
-2,818733
-2,813894
-2,808581
-2,770877
-2,768299
-2,765723
-2,765065
-2,675361
-2,674374
-2,632572
-2,627395
-2,596582
-2,544070
-2,524888
-2,441000
-2,416983
-2,402624
-2,366187
-2,320645
-2,300490
-2,300346
-2,234383
-2,188912
-2,160863
-2,151434
-2,147675
-2,116989
-2,085880
-2,078936
-2,071770
-2,064422
-2,032146
-2,003660
-2,001403
-1,994490
-1,952031
8
-1,919300
-1,887937
-1,874870
-1,837236
-1,816638
-1,803419
-1,772165
-1,763805
-1,747332
-1,678694
-1,677551
-1,676332
-1,676184
-1,671627
-1,611521
-1,604894
-1,571842
-1,548919
-1,510494
-1,490503
-1,465037
-1,443523
-1,400613
-1,388612
-1,374359
-1,372545
-1,348301
-1,345956
-1,338393
-1,324986
-1,312840
-1,304344
-1,303247
-1,302584
-1,151082
-1,064739
-1,057474
-1,036484
-1,015783
-1,011576
-0,968719
-0,940501
-0,915063
-0,914783
-0,845950
-0,813900
-0,799110
-0,797580
-0,744480
-0,719190
-0,686580
-0,683101
-0,673290
-0,654450
-0,625870
-0,474330
-0,465930
-0,421040
-0,397680
-0,363178
-0,332470
-0,328080
-0,325760
-0,305370
-0,290590
-0,28325
0,068400
0,122500
0,139100
0,209000
0,288200
0,361500
0,400801
0,463200
0,506000
0,520700
0,525900
0,582800
0,600200
0,607600
0,656400
0,670902
0,675600
0,748600
0,760700
0,853700
0,882000
0,892100
-4,205398
-4,141052
-4,116419
-3,299709
-3,266719
-3,090628
-2,522614
-2,468399
-2,463587
-1,949819
-1,932279
-1,930942
-1,437532
-1,432437
-1,405320
-0,857020
-0,854101
-0,852757
0,015055
0,045998
0,056901
1,310800
1,427100
2,329500
Построим интервальный статистический ряд: упорядочим выборку по
возрастанию, определим количество разрядов, после округления k = 10, вычислим шаг h = (xmax – xmin )/k, где xmax и xmin – максимальное и минимальное
значения признака, подсчитаем количество значений, попадающих в каждый
разряд, полученные результаты представим в табл. 1.4.
Т а б л и ц а 1.4
Интервальный статистический ряд
I
m
[-7;-6) [-6;-5) [-5;-4) [-4;-3) [-3;-2) [-2;-1)
i
pi *
[-1;0)
[0;1)
[1;2)
1
7
22
24
41
48
29
25
3
0,005
0,035
0,11
0,12
0,205
0,24
0,145
0,125
0,015
1.2. Графическое представление статистического ряда
Полигон – графическое изображение дискретного ряда. Полигон относительных частот – ломаная линия, отрезки которой соединяют точки с координатами (xi,.pi). Для построения полигона на оси X откладывают значения
xi, на оси У – соответствующие им частоты. Точки с координатами (xi,.pi) соединяют отрезками.
Пример. Построим полигон тарифных разрядов для выборки из 50 разрядов рабочих (рис. 1.1).
Рис. 1.1. Полигон тарифных разрядов рабочих
9
Полигон частот обеспечивает наглядность представления данных и позволяет сделать предположение о близости распределения конкретному закону
распределения.
Гистограмма – графическое изображение интервального ряда. Гистограмма относительных частот есть ступенчатая фигура, состоящая из прямоугольников, основания которых – интервалы длиной hi , а высоты – плотноpi*
сти относительных частот
. Здесь в общем случае hi = xi - xi -1 , однако на
hi
практике чаще всего полагают величину h одинаковой для всех интервалов:
h = h = ( x - x ) k , где i = 1,2,Kk. Площадь гистограммы есть сумма площадей ее
i
k
0
k
k
m
k
прямоугольников: Sотн.ч = å S = å h ´ i = 1 ´ å n = 1 , таким образом, плоi=1 i i=1 n × h n i=1 i
щадь гистограммы относительных частот S отн.ч равна единице. В теории вероятностей гистограмме относительных частот соответствует график плотности
распределения вероятностей f (x). Поэтому гистограмму можно использовать
для подбора закона распределения генеральной совокупности. На рис. 1.2
приведена гистограмма для примера 2.
Рис. 1.2. Гистограмма относительных частот
10
1.3. Построение эмпирической функции распределения
Статистическим аналогом графика функции распределения является
кривая накопленных частот, или эмпирическая функция распределения.
Эмпирической функцией распределения называют функцию F * ( x ) ,
определяющую для каждого значения x относительную частоту события X < х.
F * ( x ) = P * ( X < x ) = m x / n , где m x – число наблюдений, при которых отмечалось
значение признака, меньше x, n – общее число наблюдений (объем выборки).
Графическое изображение относительных накопленных частот в виде ступенчатой (ломаной) линии дает эмпирическую функцию.
Для построения эмпирической функции на оси абсцисс X откладывают
интервалы признака на оси ординат Y – F * ( x ) , которые являются высотой
прямоугольников. В отличие от эмпирической функции распределения выборки функцию распределения F (x) генеральной совокупности называют теоретической функцией распределения. Различие между эмпирической и теоретической функциями состоит в том, что теоретическая функция F (x) определяет вероятность события X < х, а эмпирическая функция F * ( x) определяет относительную частоту этого же события.
На рис. 1.3 представлена эмпирическая функция распределения случайной величины примера 2.
Рис. 1.3. Эмпирическая функция распределения
11
1.4. Числовые характеристики статистического распределения (оценки)
Эмпирическая функция распределения F*(х), гистограмма (полигон) дают представление об общем виде распределения. Однако в ряде случаев исследователю достаточно знать частичную информацию о случайной величине,
её несут оценки числовых характеристик.
*
Найдем точечные оценки: m x , Dx*, σx*, оценку моды, медианы, асим-
метрии, эксцесса. Оценка математического ожидания (статистическое среднее
или среднее
):
n
X = т = åx ,
n
*
х
2
i
i =1
(1.1)
где n – объем выборки; xi – значение признака.
Оценка дисперсии:
n
*
D
x
=
å ( xi - m*x)
n
2
i =1
=
åx
n
2
i
i=1
n
- m*2 .
х
(1.2)
Оценка среднего квадратичного отклонения:
s х = D*
х.
(1.3)
Формулы (1.2), (1.3) характеризуют разброс случайной величины около
математического ожидания. В теории вероятностей для нормального закона
доказывается правило «трех сигма» P (‫׀‬X - mx ‫ ≤ ׀‬ε) = 0,997, которое приблизительно выполняется для всех унимодальных законов. По выборке можно
сделать заключение о симметричности или несимметричности закона распределения.
Оценка начального момента:
n
v
*
k
= M *(xk ) =
12
å
i =1
n
x ik
.
(1.4)
Оценка центрального момента:
n
m
*
k
=
å ( xi - m*x)
i =1
n
k
..
(1.5)
Асимметрия определяется по формуле:
m
=
a
s*
*
3
x
3
(1.6)
.
x
Если распределение симметрично относительно математического ожидания, то ax = 0. Если а1 > 0, то кривая плотности вероятности имеет скос с левой стороны (рис. 1.4,а), если ax < 0, то – с правой стороны (рис. 1.4, б).
а
б
Рис. 1.4. Кривая плотности распределения в зависимости от ах
Коэффициент эксцесса:
m
e = *
s
*
4
x
Для нормального закона распределения
4
x
- 3,
(1.7)
e x = 0 . Величина e x характеризует
крутость кривой плотности вероятности по сравнению с кривой Гаусса. Для
островершинных кривых
e x > 0 (рис. 1.5, а), для пологих e x < 0 (рис.1.5,б).
Медиана – это серединное значение признака X. Медиана ( Mе) находится по данным упорядоченного вариационного ряда. По определению:
1
F * (xMе ) =
.
2
13
Me = x Me =
x j + x j +1
, если n = 2j – четное;
(1.8)
Me = хМе = хj+1 , если n = 2j+1 – нечетное.
(1.9)
2
Рис. 1.5. «Крутость» кривой плотности вероятности
по сравнения с кривой Гаусса
Мода – наиболее часто встречающееся значение признака X. Мода ( M 0* )
по данным упорядоченного интервального вариационного ряда с равными интервалами вычисляется по формуле:
M 0* = xo +
mMo - mMo-1
´h,
(mMo - mMo-1 ) + (mMo - mMo+1 )
(1.10)
где xo – начало модального интервала; mMo-1 – частота интервала, предшествующая модальному; mMo – частота модального интервала; mMo +1 – частота интервала, следующего за модальным; h – ширина модального интервала.
Приведем значения оценок для примера 2. Оценка математического
ожидания: – 2,007641, оценка дисперсии: 2,842081, оценка среднеквадратичного отклонения: 1,685847, оценка центрального момента третьего порядка:
– 0,828348, оценка асимметрии: – 0,172885, оценка эксцесса: – 0,399905.
14
Мода:
Mo* = -2 +
0,24 - 0,205
´1 = -1,7.
(0,24 - 0,205) + (0,24 - 0,145)
1.5. Выравнивание статистических рядов
Во всяком статистическом распределении присутствуют элементы случайности, связанные с тем, что число наблюдений ограничено. Только при
большом числе наблюдений эти элементы случайности сглаживаются и случайное явление обнаруживает в полной мере присущую ему закономерность.
Поэтому при обработке статистического материала приходится решать вопрос
о том, как подобрать для данного статистического ряда теоретическую кривую
распределения, наилучшим образом ее описывающую. Такая задача называется задачей выравнивания (сглаживания) статистических рядов.
Как правило, принципиальный вид теоретической кривой выбирается
заранее из соображений, связанных с существом задачи, а в некоторых случаях просто с внешним видом статистического распределения.
Аналитическое выражение выбранной кривой распределения зависит от
некоторых параметров, и задача выравнивания статистического ряда переходит в задачу рационального выбора тех значений параметров, при которых соответствие между статистическим и теоретическим распределениями оказывается наилучшим.
Вернемся к примеру 2 (см. рис. 1.2). Более всего гистограмма на рис. 1.2
напоминает нормальный закон распределения, который определяется двумя
параметрами; сделаем предположение, что эта случайная величина распределена по нормальному закону. Рассмотрим методы для определения параметров выбранной зависимости.
1.5.1. Метод моментов. Предположим, что нами выбрана функция f(x),
с помощью которой мы хотим выровнять данное статистическое распределение; в выражение этой функции входит несколько параметров – а, b, ... , требуется подобрать эти параметры так, чтобы функция f(x) наилучшим образом
описывала данный статистический материал. Используя метод моментов,
определим параметры распределения.
Согласно методу моментов параметры а, b, ... выбираются с таким расчетом, чтобы несколько моментов теоретического распределения были равны
15
соответствующим статистическим характеристикам. Например, если теоретическая кривая f(x) зависит от двух параметров – а и b, эти параметры выбираются так, чтобы математическое ожидание m(x) и дисперсия D(x) теоретического распределения совпадали с соответствующими статистическими характеристиками m*(x) и D*(x). Если кривая f(х) зависит от трех параметров, можно
подобрать их так, чтобы совпали первые три момента, и т. д.
Пример. В соответствии с методом моментов примем для примера 2
М(x)теор= M * (x ) = - 2 ,007641 , σ(x)теор= s * ( x) = D * ( x) = 1,685847 . Построим кривую нормального закона с заданными параметрами, выберем в качестве x середины интервалов статистического ряда (табл. 1.5).
f(х) вычисляем по формуле для расчета плотности нормального распределения, график которой представлен на рис. 1.6:
1
f ( x) =
×e
s 2p
-( x-mx )2
2s 2
(1.11)
.
Таблица 1.5
Плотность нормального распределения в серединах интервалов
x
f (x)
-6,5
-5,5
-4,5
-3,5
-2,5
-1,5
-0,5
0,5
1,5
1
0,007 0,028 0,079 0,160 0,227 0,226 0,159 0,078 0,027 0,011
0,3
0,25
0,2
0,15
0,1
0,05
0
1
2
3
4
5
6
7
8
9
10
Рис. 1.6. Кривая нормального закона с расчетными параметрами и
ее гистограмма
1.5.2. Метод наибольшего правдоподобия. Метод наибольшего правдоподобия точечной оценки неизвестных параметров заданного распределения
сводится к отысканию максимума функции одного или нескольких оценивае16
мых параметров θ. Имеем выборку Х={x1,x2,…xn}, задан закон распределения
случайной величины X. Метод применяется как для дискретных, так и для непрерывных СВ.
Рассмотрим метод для непрерывной СВ, которая задана своей плотностью f(x1,x2…xn,θ) = f(x1,θ) f(x2,θ)…f(xn,θ) =
f(xi,θ)= L(x1,x2…xn,θ), где
L(x1,x2 …xn,θ) – функция правдоподобия. Для нахождения максимума функции необходимо взять частную производную по каждому из неизвестных
параметров и приравнять ее к нулю. Получим систему уравнений, которую
нужно решить относительно неизвестных параметров ∂L/∂θ1 = 0; ∂L/∂θ2 =
= 0, ∂L/∂θ k = 0. Часто функцию L логарифмируют, функции L и ln L имеют
один и тот же максимум. L называют логарифмической функцией правдоподобия. Рассмотрим пример.
Пример 3. Имеем дело с СВ, распределенной по экспоненциальному
закону:
ìle - lx , при x ≥ 0;
f ( x) = í
при х < 0.
î0,
(1.12)
Имеем выборку X = {х1,х2,…,хn}. Необходимо определить неизвестный
параметр экспоненциального закона λ. Составим функцию правдоподобия
L(x1,x2…xn,λ) =
(1.13)
Найдем логарифм выражения (1.13) lnL(х1,х2,…,хn,λ)=nlnλ–λ
Дифференцируя полученное выражение по λ, получим:
= 0.
Выразим из формулы (1.14
тель и знаменатель дроби на n:
(1.14)
,
далее поделим числи(1.15)
Дифференцируя выражение (1.14) еще раз по х, получим
.
Видим, что вторая производная по λ отрицательна, следовательно, λ = можно
17
принять в качестве оценки неизвестного параметра, найденного по методу
наибольшего правдоподобия.
1.6. Статистическая проверка гипотез
Слово гипотеза обозначает предположение. В статистике это предположение о виде закона распределения, о значениях параметров закона. При
статической проверке гипотезы нужно ответить на вопрос, согласуются ли результаты наблюдений с гипотезой. В результате проверки возможны два ответа: выборочные данные не противоречат высказанной гипотезе, поэтому ее
можно принять в качестве одного из возможных решений, либо противоречат,
тогда гипотезу нужно отвернуть.
Н0 – статическая гипотеза, которая проверяется, ее называют основной
или нулевой гипотезой. Н1 – гипотеза, которая противостоит основной, ее
называют атернативой, альтернативной или конкурирующей.
Нулевая гипотеза Н0 может быть отвергнута, но на самом деле она
справедлива, при этом совершается ошибка первого рода, ее вероятность
называют уровнем значимости и обозначают α. Возможно принимается Н0, но
верна Н1, при этом совершается ошибка второго рода, ее вероятности обозначаются β.
Уровень значимости α имеет стандартные знания (0,1; 0,05; 0,01; 0,001).
Проверка статистических гипотез осуществляется с помощью статистического критерия. Значения критерия могут попасть либо в область допустимых значений (область принятия гипотезы Н0), либо в критическую область
(область принятия гипотезы Н1). Проверка статистических гипотез осуществляется с помощью статистического критерия.
1.6.1. Критерий согласия Пирсона ( χ2 Пирсона). Для проверки гипотез о
виде распределения служат специальные критерии – критерии согласия. Для
определения меры расхождения между предполагаемым и эмпирическим распределением служит статистика χ2 Пирсона. Нулевая гипотеза проверяется с
помощью критерия согласия.
Критерий c2 («хи-квадрат») Пирсона – наиболее часто употребляемый
критерий, может применяться для проверки гипотезы о любом законе распределения.
18
( mi - npi ) 2
c =å
,
npi
i =1
2
I
(1.16)
где mi – количество значений, попавших в i разряд; n – объем выборки; pi –
теоретическая вероятность попадания в i разряд. Для каждого закона своя
формула расчета вероятности pi .
Рассчитав теоретические вероятности, находят χ2выч. Из таблицы критических точек распределения c 2 по заданному уровню значимости a и числу
2
степеней свободы k находят c крит
(a, k) – границу правосторонней критиче-
ской области (прил. 2). Здесь k = s – r – 1, где s – число различных значений xi
дискретного ряда или число интервалов непрерывного признака Х; r – число
параметров предполагаемого закона распределения, для нормального распределения r = 2, отсюда k = s – 3, для экспоненциального закона r = 1, для за2
кона равной плотности r = 2 и т. д. Затем сравнивают χ2выч и c крит
(a, k) и де-
лают вывод.
При формулировке вывода руководствуются следующим правилом:
если наблюдаемое значение критерия χ2выч попало в область принятия ги2
потезы (χ2выч < c крит
(a, k)), то нет оснований отвергать нулевую гипотезу;
если наблюдаемое значение критерия χ2выч попало в критическую область
2
(χ2выч .> c крит
(a, k)), то нулевая гипотеза отвергается, справедлива конкури-
рующая гипотеза, т. е. признак Х имеет закон распределения, определяемый
гипотезой Н1.
Пример. Продолжим рассмотрение примера 2. На уровне значимости
a = 0,01 проверим гипотезу о нормальном распределении. Сформулируем основную и альтернативную гипотезы. Гипотеза H0: случайная величина X подчиняется нормальному закону с параметрами mx, и σx . Истинные значения параметров нам не известны, возьмем их оценки m(x)теор = M * ( x ) = -2,007641,
σ(x)теор= s * ( x) = D * ( x) = 1,685847. Гипотеза H1: случайная величина X не подчинена нормальному закону с данными параметрами.
2
Рассчитаем наблюдаемое значение статистики Пирсона χ
выч.
При ис-
пользовании критерия Пирсона χ2выч количество значений признака, попада19
ющих в каждый разряд, не должно быть меньше пяти. Если это условие не
выполняется, разряды, имеющие mi < 5, объединяются в один разряд. В связи с
этим табл. 1.4 преобразована в табл. 1.6.
Т а б л и ц а 1.6
Преобразованная табл. 1.4
I
-7-(-5)
-5-(4)
-4-(-3)
-3-(-2)
-2-(-1)
-1-0
0-3
mi
8
22
24
41
48
29
28
pi*
0,04
0,11
0,12
0,205
0,24
0,145
0,14
n * pi
7,38
16,12
32,4
43,8
44,48
32,12
23,1
Расчет теоретических вероятностей попадания в заданный интервал для
нормального закона выполнен по формуле:
P (a £ х £ b ) = Ф(
b -m
a -m
) - Ф(
).
s
s
x
x
(1.17)
Результаты расчетов приведены в табл. 1.7.
Т а б л и ц а 1.7
Вероятности попадания в заданный интервал
Р теор
0,037
0,081
0,162
0,219
0,222
0,161
0,116
x1
-1,775
-1,182
-0,589
0,005
0,598
1,191
2,970
x2
-2,961
-1,775
-1,182
-0,589
0,005
0,598
1,191
Найдём
2
I
χ2 = (mi - npi ) = 6,1747
å
.
npi
i =1
Определяем число степеней свободы k: k = I-S = 7-3 = 4. По уровню значимости α = 0,01 и числу степеней свободы, находим χ2 (критическое) = 13,3
20
2
(см. прил. 2) χ2выч < χ
крит,
6,1746 < 13,3 , на данном уровне значимости гипоте-
зу не отвергаем.
Вывод: на уровне значимости α = 0,01 гипотеза о том, что СВ примера 2
распределена по нормальному закону, не противоречит опытным данным.
1.7. Индивидуальные задания
При выполнении лабораторной работы каждому студенту будет выдана
выборка объемом 200 чисел (либо в электронном виде, либо на листе бумаги).
1.8 . Контрольные вопросы
1) Приведите следствие теоремы Чебышева.
2) Постройте график эмпирической функции распределения, перечислите ее свойства, укажите отличие статистической функции распределения от
теоретической функции.
X
5
7
10 15
mi
2
3
8
7
3) Как построить гистограмму относительных частот, чему равна площадь гистограммы?
4) Метод наибольшего правдоподобия для определения параметров
экспоненциального распределения.
5) Теорема Чебышева, ее значение для практики.
6) Постройте полигон относительных частот распределения.
X
mi
1 3 5 7 9
10 15 30 33 12
7) Приведите формулы для вычисления известных Вам числовых характеристик статистического распределения.
8) Назовите требования, предъявленные к точечным оценкам.
9) Критерий согласия χ2 Пирсона: его назначение, применение.
10) Запишите неравенство Чебышева.
11) Используйте метод наибольшего правдоподобия для определения
параметров закона Пуассона.
21
12) Показать, каким требованиям, предъявленным к точечным оценкам,
x
удовлетворяет m x .
13) Что называется генеральной и выборочной совокупностью?
14) Почему гистограмму называют статическим аналогом плотности
распределения вероятностей?
15) Постройте гистограмму относительных частот, используя интервальный статистический ряд.
I
mi
5 –10
10 –15
15 –20
20 –25
25 –30
30 –35
35 – 40
4
6
16
36
24
10
4
16) Перечислите свойства эмпирической функции распределения.
17) Что называется генеральной и выборочной совокупностью?
Лабораторная работа 2
ИНТЕРВАЛЬНЫЕ ОЦЕНКИ ДЛЯ НЕИЗВЕСТНОГО
МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ И ДИСПЕРСИИ
Ц е л ь : построение доверительных интервалов для неизвестного математического ожидания и дисперсии.
Исходная выборка содержит 50 значений. Признак генеральной совокупности распределен нормально.
Последовательность выполнения лабораторной работы.
1. Построить доверительный интервал для неизвестного математического ожидания при условии, что:
а) σ известно, б) σ неизвестно; для γ = 0,95; n = 50; n = 30; n = 10.
Установить связь размеров интервала и объема выборки, влияние σ на
размер интервала.
2. Построить доверительный интервал для неизвестного математического ожидания при условии, что n = 30; σ неизвестно для γ = 0,95; γ = 0,99; γ =
= 0,999. Установить связь размеров интервала с надежностью.
3. Построить доверительный интервал для дисперсии при известном и
неизвестном mx при n = 30, если γ = 0,95; γ = 0,99; γ = 0,999.
22
Установить связь размеров доверительного интервала с γ, на что влияет
mx, когда оно известно и когда неизвестно.
2.1. Интервальные оценки
При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, что приводит к ошибкам. В таком случае
лучше пользоваться интервальными оценками, т. е. указывать интервал, который с заданной вероятностью накрывает истинное значение оцениваемого параметра. Разумеется, чем меньше длина этого интервала, тем точнее оценка
параметра. Поэтому если для оценки q * некоторого параметра q справедливо
неравенство | q * - q |< d , число δ >0 характеризует точность оценки (чем
меньше δ, тем точнее оценка). Статистические методы позволяют говорить
только о том, что это неравенство выполняется с некоторой вероятностью.
Надежностью (доверительной вероятностью) оценки θ* параметра θ
называется вероятность γ того, что выполняется неравенство | q - q |< d . Если
*
заменить это неравенство двойным неравенством - d < q * - q < d , то получим:
P(q * - d < q < q * + d ) = g
Таким образом, γ есть вероятность того, что q будет накрыта интервалом (q * - d , q * + d ).
Доверительным называется интервал, который накрывает неизвестный
параметр с заданной надежностью γ.
2.2. Построение доверительного интервала для неизвестного
математического ожидания при известном s
Пусть исследуемая случайная величина Х распределена по нормальному
закону с известным средним квадратичным распределением σ и требуется по
значению выборочного среднего xв оценить ее математическое ожидание а.
Будем рассматривать выборочное среднее xв как случайную величину X , а
значения вариантов выборки х1, х2,…, хп как одинаково распределенные независимые случайные величины Х1, Х2,…, ХN, каждая из которых имеет математическое ожидание а и среднее квадратичное отклонение σ. При этом
23
s (X ) =
s
, M ( X ) = a (используем свойства математического ожидания и
n
дисперсии суммы независимых случайных величин). Оценим вероятность выполнения неравенства | X - a |< d . Применим формулу для вероятности попадания нормально распределенной случайной величины в заданный интервал:
d
P (| X - a |< d ) = 2Ф ( ) . Заменим X на
s
X . Тогда, с учетом того, что
d n
d n
s
) =2Ф( t ), где t =
. От, получим: P (| X - a |< d ) = 2Ф(
s
s
n
ts
сюда d =
, и предыдущее равенство можно переписать так:
n
s (X ) =
ts
ts ö
æ
Pç xв < a < xв +
÷ = 2Ф(t ) = g
n
n
è
ø
(2.1)
Тогда формула для оценки доверительного интервала для математического ожидания при известном s будет иметь вид:
x-
ts
ts
<a< x+
n
n
(2.2)
Пример. Задано γ = 0,95, σ = 1,747068. Найдем Ф(t)=γ/2; Ф(t) = 0,475.
По таблице функции Лапласа (прил. 1) определяем значение t: t =1,96. Доверительный интервал будем определять по формуле (2.2). Из выборки 50 чисел
возьмем 10 значений (произвольно) и определим X = -1, 72164.
n = 10
0,2882
-1,3032
-0,2906
-2,6754
-1,9309
2,3296
-2,0014
-5,4286
-5,35
-0,8541
Таким образом, доверительный интервал для неизвестного математического ожидания при условии, что
σ известно, составляет
- 2,80448 £ a £ -0,63879 .
Из выборки 50 чисел извлекаем выборку n = 30, находим X = -2, 1105
По формуле (2.2) определяем доверительный интервал.
n = 30
24
0,2882
-1,3032
-0,2906
-2,6754
-1,9309
2,3296
-2,0014
-5,4286
-5,3500
-0,8541
-2,0037
-3,9186
-1,8034
0,01506
-2,8086
-1,4650
-4,6182
-4,0677
-4,1138
-1,6115
-2,6326
-4,2054
-1,5718
-3,5856
-0,3977
-0,8528
0,7607
-2,0718
-2,9986
-2,1477
Доверительный интервал для неизвестного математического ожидания
при условии, что σ известно, составляет: - 2 ,73568 £ a £ - 1, 48532 . Аналогично определим доверительный интервал для выборки n = 50. X = -2, 17113.
n = 50
0,2882
-1,3032
-0,2906
-2,6754
-1,9309
2,3296
-2,0014
-5,4286
-5,3500
-0,8541
-2,0037
-3,9186
-1,8034
0,01506
-2,8086
-1,4650
-4,6182
-4,0677
-4,1138
-1,6115
-2,6326
-4,2054
-1,5718
-3,5856
-0,3977
-0,8528
0,7607
-2,0718
-2,9986
-2,1477
-1,3026
-0,4210
-1,8372
-3,2667
0,0460
-3,7035
-3,6369
0,85375
0,67095
-4,7585
-2,0789
-2,4411
-5,6016
-3,0906
-3,6752
-3,0511
-1,3725
-1,4375
-2,7709
-2,3662
Таким образом, доверительный интервал для неизвестного математического ожидания при условии, что σ известно, составляет 2,6554 ≤ α ≤ – 1,6869.
Далее необходимо сделать вывод о том, как меняются границы и размеры интервала в зависимости от объема выборки.
2.3. Построение доверительного интервала для неизвестного
математического ожидания при неизвестном s
СВ Х распределена по нормальному закону, с неизвестным σ. Необходимо по выборочному среднему оценить её математическое ожидание.
Для поиска доверительного интервала для математического ожидания
при неизвестном σ построим новую случайную величину
x -a
T= в
,
s
n
25
(2.3)
где xв выборочное среднее; s – исправленная дисперсия; п – объем выборки.
Эта случайная величина, возможные значения которой будем обозначать t,
имеет распределение Стьюдента с k = n - 1 степенями свободы.
æ
t
2
n
2
ö
÷ ,
Поскольку плотность распределения Стьюдента s (t , n) = Bn çç1 +
n -1÷
è
ø
æ nö
Гç ÷
è nø
где B =
, явным образом не зависит от а и σ, можно задать вероn
n
1
æ
ö
p (n -1)Гç
÷
è 2 ø
ятность ее попадания в некоторый интервал - tg , tg , следующим образом:
æ
ö
tg
ç
÷
x
a
Pç в
< t g ÷ = 2 ò s ( t , n )dt = g
. Отсюда получаем:
s
ç
÷
0
ç
÷
n
è
ø
t sö
t s
æ
Pçç xв - g < a < xв + g ÷÷ = g .
nø
n
è
(2.4)
Таким образом, получен доверительный интервал для а, где tg можно
найти по таблице Стьюдента при заданных п и γ.
Формула для оценки математического ожидания при неизвестном s
имеет вид..
x - tg
S
S
< a < x + tg
.
n
n
(2.5)
Формулы (2.2) и (2.5) похожи, σ формулы (2.2) заменено в (2.5) на несмещенную оценку S, t заменяется на tγ. СВ, с которыми мы работаем, имеют
разные законы распределения: нормальный в формуле (2.2) и Стьюдента – в
формуле (2.5). При n > 50 распределение Стьюдента мало отличается от нормального. Практически уже при n > 30 можно считать, что распределение
Стьюдента приближенно нормальное.
26
Пример. (Выборки те же, что и в предыдущем примере). σ неизвестно.
Найдем
выборочное
исправленное
среднеквадратичное
отклонение:=
S
*
D=
x 1,74707 . Проведем расчет по формуле (2.5).
По таблице распределения Стьюдента (прил. 3) определяем ty:
при n = 10, tg = 2,26 доверительный интервал равен – 2,9702 £ а £ – 0,4731;
при n = 30, tg = 2,045 доверительный интервал равен – 2,7628 £ а £ – 1,4582;
при n = 50, tg = 2,009 доверительный интервал равен – 2,8119 £ а £ – 1,5303.
Делаем вывод о влиянии объема выборки n на размер доверительного
интервала.
Оценим влияние надежности γ на размер доверительного интервала.
Пример. Построим доверительный интервал для неизвестного математического ожидания σ при условии, что n = 30; σ неизвестно, γ = 0,95;
γ = 0,99; γ = 0,999. Установим связь размеров интервала с надежностью. Следует воспользоваться формулой (2.5) для оценки математического ожидания
при неизвестном s .
Используем выборку, для которой X = -2, 1105; S =
*
D
x
= 1,74707.
n = 30
0,28823
2,3296
-2,0037
-1,465
-2,6326
-0,8528
-1,3032
-0,2906
-2,6754
-2,0014
-5,4286
-5,35
-3,9186
-1,8034
0,01506
-4,6182
-4,0677
-4,1138
-4,2054
-1,5718
-3,5856
0,76073
-2,0718
-2,9986
-1,9309
-0,8541
-2,8086
-1,6115
-0,3977
-2,1477
Доверительный интервал для неизвестного математического ожидания с
надежностью g = 0,95. По таблице Стьюдента (прил. 3) определяем значение
tγ = 2,045. Доверительный интервал равен –2,76279 ≤ a ≤ – 1,4582.
Для
g
= 0,99 определяем tγ = 2,756. Доверительный интервал равен
– 2,98958 ≤ a ≤ – 1,23142.
Для g = 0,999 определяем tγ = 3,659. Доверительный интервал равен
– 3,27761 ≤ a ≤ – 0,94339.
27
Делаем вывод о влиянии γ на размеры доверительного интервала при
n = 30 и неизвестном σ.
При n = 30 можно использовать распределение Стьюдента, можно –
нормальное распределение. Воспользуемся функцией Лапласа для определения доверительного интервала с γ = 0,95; γ = 0,99; γ = 0,999 и сравним полученные результаты с результатами предыдущего примера.
2.4 Построение доверительного интервала для дисперсии
Построим доверительный интервал для дисперсии при известном и
неизвестном математическом ожидании для n = 30 при γ = 0,95; γ = 0,99;
γ = 0,999.
Исследуемый признак генеральной совокупности распределен нормально. Выборочная дисперсия от выборки к выборке меняется, т. е. имеем дело со
случайной величиной. Без доказательства примем, что закон распределения
выборочной дисперсии нормальный. Оценка дисперсии вычисляется по формуле (1.2). При небольших объемах выборки для устранения смещения оценку вычисляют по формуле:
n
S
2
=
å (x i -a )
i =1
n -1
2
,
(2.6)
где S2 – несмещенная оценка дисперсии; xi – значение СВ в выборке; a –
математическое ожидание; n – объем выборки.
Разделим обе части равенства (2.6) на σ2 и умножим на n:
x -a 2
nS 2 n
= å i = 1( i
) = å ti2 = c 2 .
2
s
i=1
s
(2.7)
Распределение статистики χ2 не зависит ни от математического ожидания, ни от дисперсии, а зависит лишь от объема выборки n. Дифференциальная функция χ2 сложна, ее интегрирование – процесс трудоемкий, и для нее
так же, как и для распределения Лапласа, Стьюдента, составлены таблицы.
28
nS 2
имеет n степеней
При известном математическом ожидании c =
s2
2
nS 2
свободы, при неизвестном математическом ожидании c = 2 имеет n – 1
s
2
степеней свободы. Этот случай чаще всего встречается на практике. Запишем
вероятность попадания в заданный интервал:
nS 2
P( c 2 <
< c 2 ) = 1 - a.
1 s2
2
(2.8)
и
c 22 ,
чтобы площадь S была равна 1– α. Из рис. 2.1, а, б видно, что значениями
c12
Далее по таблице χ2 (прил. 2) нужно выбрать два значения
и
c 22
c 12
можно варьировать. Заштрихованные площади S1 и S2 равны между со-
бой, а значения
чтобы P(χ2 <
c12
и
c 22
различны, их принято выбирать таким образом,
) = α/2. На рис. 2.2 приведен применяемый на
) = P(χ2 <
практике вариант расчета
и
, заштрихованные площади равны α/2 .
Рис. 2.1. Иллюстрация возможного выбора χ2 и χ
Рис. 2.2. Применяемый на практике вариант расчета
29
c 12
и
c 22 .
P(χ2 <
и
таким образом, чтобы
Условились выбирать
2
= P(χ < ) =α/2 .
Доверительный интервал для неизвестного σ2
)=
(2.9)
Пример. Построить доверительный интервал с γ = 0,96 для σ2 случайной
величины X, распределенной нормально, с S2 = 10, n = 20, математическое
ожидание неизвестно. Для γ = 0,96 α = 1 – 0,96 = 0,04, тогда α/2 = 0,02. Далее
обращаемся к таблице и находим для k = n – 1 = 20 – 1 = 19 для вероятностей
α/2 = 0,02 и 1 – α/2 = 1 – 0,02 = 0,98 значения
Подставим
c 12
и
c 22
c12
= 8,6 и
c 22
= 33,7.
в формулу (2.9)
20 *10
20 *10
<s 2 <
или
33.17
8.6
5,935 < σ2 < 23,256.
Определяем доверительный интервал при известном mx для k = n = 20 и
вероятностей α/2 = 0,02 и 1 – α/2 = 0,98
c 22
c12 = 9,2; c 22 = 43. Подставим c 12
и
в формулу (2.9):
20 *10
20 *10
<s2 <
или 4,651 < σ2 < 2 1,739.
43
9.2
Далее установим связь размеров доверительного интервала для дисперсии при известном и неизвестном математическом ожидании с надежностью
0,95; 0,99; 0,999, используя выборку объема n = 50 (пример из раздела 2.2).
В заключение сделаем вывод о том, как надежность влияет на размер
доверительного интервала при известном и неизвестном математическом
ожидании.
Примечание: в заданиях использованы бесповторные выборки.
30
2.5. Индивидуальные задания
Мx = – 4,001; Dx = 0,956.
Задание 1
2,679; -4,481; -4,314; -4,046;
-3,598; -3,672; -4,577; -4,255;
-3,013; -5,512; -4,085; -6,079;
-4,390; -5,194; -3,088; -4,630;
-3,960; -5,220; -3,906; -4,967;
-1,500; -3,776; -4,731; -4,607;
-5,979; -4,365 -2,819; -3,638;
-5,934; -5,273; -4,983; -3,854;
-3,338; -3,753; -5,134; -4,629;
-4,002; -4,915; -2,352; -4,445;
-5,108; -3,242; -2,458; -4,211;
-3,740; -3,338; -5,593; -4,442;
-2,837; -2,406
Задание 2
-4,068; -3,814; -3,075; -5,472;
-4,444; -4,268; -5,340; -2,545;
-4,270; -3,033; -5,761; -2,765;
-2,637; -3,813; -5,236; -4,966;
-4,050; -3,260; -4,467; -3,114;
-3,894; -3,928; -2,455; -3,610;
-3,510; -4,923; -6,215; -3,388;
-4,470; -4,303; -5,222; -4,962;
-2,725; -5,562; -5,198, -4,945;
-5,190; -5,315; -5,461; -4,301;
-6,028; -4,344; -3,772; -3,935;
-3,813; -3,647; -3,864; -3,657;
-3,706; -2,577
Задание 3
-3,037; -5,310; -3,460; -2,385;
-4,362; -4,093; -2,021; -4,828;
-3,223; -2,542; -4,780; -4,838;
-4,624; -2,775; -2,490; -3,887;
-3,679; -3,622; -4,620; -4,970;
-4,442; -3,953; -4,185; -3,603;
-3,810; -4,389; -3,431; -4,037;
-3,961; -5,056; -3,675; -4,135;
-3,618; -3,444; -2,812; -4,480;
-3,035; -3,373; -3,315; -5,098;
-5,400; -3,240; -2,806; -3,997;
-5,189; -3,334; -3,207; -3,234;
-3,459; -3,055
Задание 4
-4,173; -4,805; -4,617; -4,087;
-2,413; -3,639; -3,340; -3,971;
-2,508; -2,614; -3,598; -3,814;
-4,769; -3,009; -3,691; -4,173;
-2,415; -6,306; -2,553; -2,089;
-5,623; -5,730; -2,495; -3,972;
-3,623; -3,868; -5,474; -4,750;
-4,018; -5, 375; -2,446; -2,330;
-6,595; -3,717; -3,654; -4, 109;
-4, 576; -3,373; -3,429; -3,119;
-5,452; -3,022; -4,473; -4,240;
-3,355; -3,404; -3,306; -4,041;
-3,953; -4,232
Мx-= – 2,001; Dx = 2,868.
Задание 5
0,288; -1,303; -0,291; -2,675
-1,930; 2,330; 2,001; -5,428
13,539; 2,882; 9,366; 12,808;
-5,350; -0,854; -2,004; -3,919;
-1,549; -2,834; 0,015; -4,618;
Задание 6
-1,747; -2,771; -2,366; -2,766;
-2,117; -2,768; -2,468; 0,362;
-2,086; -1,817; -1,151; -2,814;
0,209; -4,062; -5,513; -1,676;
-1,491; -1,679; -2,464; -0,326;
31
-4,068; -4,114; -1,612; -2,633
-4,205; -1,572; -3,585; -0,687;
-0,853; 0,760; -2,544; -2,999;
-2,148; -1,303; -0,421; -1,837;
-3,268; 0,046; -3,703; -3,964,;
0,854; 0,670; -4,759; -2,079;
-2,441; -5,602; -3,091; -3,675;
-3,051; -1,373
-1,676; -0,719; -1,875; -3,599;
-2,525; -4,705; -4,277; -2,597;
-1,389; 0,243; -0,398; -4,321;
-5,050; -4,141; -2,809; 0,776;
-5,837; -4,116; -4,075; -4,531;
-1,604; -1,764; -4,550; 0,520;
0,139; -3,673; -0,466; -1,325;
-0,940; -3,668
Задание 7
-3,637; -2,523; -1,888; -1,405;
-0,332; -2,627; -0,654; -3,081;
-1,444; -2,765; -1,672; -1,932;
-1,338; -0,328; -4,426; -4,060;
-1,057; -1,346; -1,919; -2,674;
-3,829; -1,036; -0,915; -0,683;
-0,846; -0,363; -4,268; -2,161;
0,526; 0,123; -1,065; 1,427;
-3,385; 0,600; 0,798; -3,434;
-3,452; -1,803; -3,074; -2,321;
-1,016; -1,438; 0,057; 0,057;
-0,814; 0,068; -0,626; -3,680;
-1,313; -2,064
Задание 8
-3,637; -2,234; -2,828; -3,901;
-1,994; -0,673; -2,300; 0,749;
0,583; -3,332; -3,396; -1,374;
0,401; 0,283; -3,069; -2,403;
-0,857; -1,304; -1,465; -2,151;
-1,950; -1,678; -2,300; 0,745;
-5,994; 0,506; 1,310; -4,811;
-4,997; 0,608; -1,952; -1,348;
-1,772; -4,553; -3,300; -2,032;
-4,383; 0,656; 0,892; -6,495;
-1,510; -1,401; -2,189; -2,998;
-0,915; -1,012; -0,474; -4,515;
-0,305; -2,819
Мx = 10,000; Dx = 9,000.
Задание 9
14,062; 8,374; 10,534; 8,369;
6,127; 8,367; 8,336; 6,089;
15,884; 11,449; 14,921; 10,947;
7,750; 10,885; 10,946; 10,082;
10,736; 11,729; 9,629; 12,563;
11,159; 8,893; 11,225; 10,467;
9,669; 10,628; 14,179; 10,504;
10,155; 4,705; 10,519; 13,617;
12,198; 11,954; 10,858; 7,973;
12,479; 8,070; 7,281; 13,464;
9,221; 9,085; 8,834; 5,135;
10,554; 8,484; 10,932; 14,831;
14,552; 6,175
Задание 10
9,762; 7,768; 9,523; 9,105;
13,322; 16,787; 9,111; 11,581;
10,571; 7,009; 10,387; 9,473;
8,623; 10,857; 10,268; 9,137;
12,352; 14,857; 8,361; 5,153;
9,784; 19,482; 10,780; 14,371;
11,936; 16,741; 10,563; 11,122;
10,372; 5,686; 13,352; 7,181;
7,427; 9,086; 8,378; 7,675;
7,466; 12,782; 6,122; 13,526;
12,344; 6,183; 10,840; 10,009;
10,528; 9,573; 4,026; 18,149;
9,679; 11,919
32
Задание 11
11,655; 11,639; 9,336; 6,591;
10,710; 12,704; 10,201; 7,795;
8,685; 8,572; 14,497; 12,731;
10,608; 7,762; 7,137; 7,846;
6,714; 8,744; 11,862; 8,008;
8,513; 11,207; 6,481; 8,376;
15,253; 8,157; 8,476; 8,228;
11,748; 14,390; 5,909; 8,548;
6,677; 8,071; 5,467; 9,286;
8,762; 8,086; 14,427; 11,038;
12,684; 7,336; 9,499; 14,152;
12,634; 11,212; 14,596; 7,853;
10,300; 7,482
Задание 12
8,816; 13,903; 9,366; 9,854;
9,828; 13,539; 9,367; 5,542;
11,117; 12,264; 5,603; 8,622;
18,798; 5,989; 6,987; 12,570;
11,283; 11,177; 8,803; 11,644;
9,738; 13,637; 7,242; 12,493;
9,494; 16,335; 9,720; 7,048;
10,331; 9,438; 12,883; 12,809;
12,907; 11,059; 12,345; 9,653;
7,538; 5,851; 13,885; 11,017;
4,232; 16,344; 9,732; 10,032;
7,944; 8,038; 6,533; 12,045;
6,572; 6,525
Мx = – 3,006; Dx = 1,890
Задание 13
-1,131; -3,120; -3,664; -2,677;
-2,431; -2,430; -1,196; -2,807;
-1,604; -1,710; -4,683; -5,082;
-3,551; -2,867; -5,868; -0,941;
-2,944; -4,034; -2,736; -1,253;
-0,535; -1,329; -2,584; -4,366;
-3,001; -4,391; -2,738; -1,747;
-5,799; -4,604; -3,378; -2,449;
-5,735; -0,670; -1,633; -2,135;
-2,064; -0,819; -2,736; -4,362;
-3,003; -5,252; -1,954; -4,336;
-4,566; -3,064; -2,899; -3,427;
-2,631; -3,360
Задание 14
-4,306; -2,908; -1,355; -5,940;
-3,428; -2,514; -3,680; -3,890;
-5,209; -1,638; -2,536; -4,368;
-4,860; -3,512; -5,138; -3,858;
-3,487; -1,901; -4,688; -2,488;
-2,501; -3,882; -4,726; -2,794;
-0,989; -2,546; -2,683; -3,629;
-1,692; -3,625; -3,516; -3,299;
-4,895; -2,732; -4,801; -3,625;
-5,490; -2,945; -2,650; -3,095;
-4,748; -2,459; -4,495; -3,627;
-3,660; -1,635; -1,927; -3,382;
-0,815; -4,981
Задание 15
-2,063; -1,072; -6,133; -4,682;
-0,746; -3,070; -4,728; -2,230;
-3,444; -2,850; -4,694; -2,466;
-3,815; -2,307; -5,066; -2,934;
-3,550; -2,439; -5,295; -4,493;
-3,053; -5,447; -2,213; -0,871;
Задание 16
-4,088; -0,831; -2,236; -4,139;
-0,638; -2,236; -4,139; -0,638;
-0,202; -2,489; -6,670; -4,131;
-1,039; -2,600; -0,877; -1,598;
-2,510; -0,716; -3,873; -3,154;
-4,170; -3,329; -3,815; -4,186;
33
-2,114; -3,675; -2,961; -1,925;
-4,552; -2,468; -2,058; -2,995;
-2,814; -1,663; -1,917; -5,085;
-4,852; -3,245; -4,061; -3,313;
-0,756; -3,026; -0,937; -0,891;
-4,946; -1,267
-2,067; -2,114; -2,839; -2,432;
-2,193; -3,877; -2,563; -1,754;
-3,217; -3,124; -5,053; -2,196;
-1,616; -2,541; -2,737; -3,668;
-1,320; -3,245; -3,340; -2,031;
-0,759; -2,087
2.6. Контрольные вопросы
1) Поясните термины «доверительный интервал», «доверительная вероятность (надежность)», «точность оценки».
2) Среднее значение: генеральная средняя, выборочная средняя, средняя
двух выборок с разными объемами. Приведите формулы.
3) Распределение дисперсии в выборках из нормальной генеральной совокупности. Распределение χ2 Пирсона.
4) Выведите формулу для нахождения доверительного интервала для
неизвестного mx при известном σ.
5) Групповая, внутригрупповая, межгрупповая и общая дисперсия. Приведите формулы.
6) Распределение средней арифметической для выборок из нормальной
совокупности. Распределение Стьюдента.
7) Как вычислить предельную погрешность, с которой xв оценивает истинное значение СВ, если σ известна, если σ неизвестна?
8) Как найти минимальный объем выборки для обеспечения заданной
погрешности при вычислении xв ?
9) Как влияет увеличение объема выборки на размеры доверительного
интервала?
Библиографический список
1. Г м у р м а н В. Е. Теория вероятностей и математическая статистика:
Учебное пособие / В. Е. Г м у р м а н . М.: Высшее образование, 2007. 479 с.
2. Г м у р м а н В. Е. Руководство к решению задач по теории вероятностей и математической статистике: Учебное пособие / В. Е. Г м у р м а н . М.:
Высшее образование, 2006. 476 с.
3. К р е м е р Н. Ш. Теория вероятностей и математическая статистика:
Учебник / Н. Ш. К р е м е р . М.: Юнити-Дана, 2004. 573 с.
34
ПРИЛОЖЕНИЕ 1
z2
1 x -2
Таблица значений функции Ф(х) =
ò e dz
2p 0
x
1
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,10
0,11
0,12
0,13
0,14
0,15
0,16
0,17
0,18
0,19
0,20
0,21
0,22
0,23
0,24
0,25
0,26
0,27
0,28
0,29
0,30
0,31
Ф(х)
2
0,0000
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,0279
0,0319
0,0359
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,0675
0,0714
0,0753
0,0793
0,0832
0,0871
0,0910
0,0948
0,0987
0,1026
0,1064
0,1103
0,1141
0,1179
0,1217
x
3
0,32
0,33
0,34
0,35
0,36
0,37
0,38
0,39
0,40
0,41
0,42
0,43
0,44
0,45
0,46
0,47
0,48
0,49
0,50
0,51
0,52
0,53
0,54
0,55
0,56
0,57
0,58
0,59
0,60
0,61
0,62
0,63
Ф(х)
4
0,1255
0,1293
0,1331
0,1368
0,1406
0,1443
0,1480
0,1517
0,1554
0,1591
0,1628
0,1664
0,1700
0,1736
0,1772
0,1808
0,1844
0,1879
0,1915
0,1950
0,1985
0,2019
0,2054
0,2088
0,2123
0,2157
0,2190
0,2224
0,2257
0,2291
0,2324
0,2357
x
5
0,64
0,65
0,66
0,67
0,68
0,69
0,70
0,71
0,72
0,73
0,74
0,75
0,76
0,77
0,78
0,79
0,80
0,81
0,82
0,83
0,84
0,85
0,86
0,87
0,88
0,89
0,90
0,91
0,92
0,93
0,94
0,95
35
Ф(х)
6
0,2389
0,2422
0,2454
0,2486
0,2516
0,2549
0,2580
0,2611
0,2642
0,2673
0,2703
0,2734
0,2764
0,2794
0,2823
0,2852
0,2881
0,2910
0,2939
0,2967
0,2995
0,3023
0,3051
0,3078
0,3106
0,3133
0,3159
0,3186
0,3212
0,3228
0,3264
0,3289
x
7
0,96
0,97
0,98
0,99
1,00
1,01
1,02
1,03
1,04
1,05
1,06
1,07
1,08
1,09
1,10
1,11
1,12
1,13
1,14
1,15
1,16
1,17
1,18
1,19
1,20
1,21
1,22
1,23
1,24
1,25
1,26
1,27
Ф(х)
8
0,3315
0,3340
0,3365
0,3389
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
0,3577
0,3599
0,3621
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,3770
0,3790
0,3810
0,3830
0,3849
0,3869
0,3883
0,3907
0,3925
0,3944
0,3962
0,3980
Окончание прил.1
1
1,28
1,29
1,30
1,31
1,32
1,33
1,34
1,35
1,36
1,37
1,38
1,39
1,40
1,41
1,43
1,44
1,45
1,46
1,47
1,48
1,49
1,50
1,51
1,52
1,53
1,54
1,55
1,56
1,57
1,58
1,59
1,60
2
0,3997
0,4015
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
0,4147
0,4162
0,4177
0,4192
0,4207
0,4236
0,4251
0,4265
0,4279
0,4292
0,4306
0,4319
0,4332
0,4345
0,4357
0,4370
0,4382
0,4394
0,4406
0,4418
0,4429
0,4441
0,4452
3
1,61
1,62
1,63
1,64
1,65
1,66
1,67
1,68
1,69
1,70
1,71
1,72
1,73
1,74
1,76
1,77
1,78
1,79
1,80
1,81
1,82
1,83
1,84
1,85
1,86
1,87
1,88
1,89
1,90
1,91
1,92
1,93
4
0,4463
0,4474
0,4484
0,4495
0,4505
0,4515
0,4525
0,4535
0,4545
0,4554
0,4564
0,4573
0,4582
0,4591
0,4608
0,4616
0,4625
0,4633
0,4641
0,4649
0,4656
0,4664
0,4671
0,4678
0,4686
0,4693
0,4699
0,4706
0,4713
0,4719
0,4726
0,4732
5
1,94
1,95
1,96
1,97
1,98
1,99
2,00
2,02
2,04
2,06
2,08
2,10
2,12
2,14
2,18
2,20
2,22
2,24
2,26
2,28
2,30
2,32
2,34
2,36
2,38
2,40
2,42
2,44
2,46
2,48
2,50
2,52
36
6
0,4738
0,4744
0,4750
0,4756
0,4761
0,4767
0,4772
0,4783
0,4793
0,4803
0,4812
0,4821
0,4830
0,4838
0,4854
0,4861
0,4868
0,4875
0,4881
0,4887
0,4893
0,4898
0,4904
0,4909
0,4913
0,4918
0,4922
0,4927
0,4931
0,4934
0,4938
0,4941
7
2,54
2,56
2,58
2,60
2,62
2,64
2,66
2,68
2,70
2,72
2,74
2,76
2,78
2,80
2,84
2,86
2,88
2,90
2,92
2,94
2,96
2,98
3,00
3,20
3,40
3,60
3,80
4,00
4,50
5,00
8
0,4945
0,4948
0,4951
0,4953
0,4956
0,4959
0,4961
0,4963
0,4965
0,4967
0,4969
0,4971
0,4973
0,4974
0,4977
0,4979
0,4980
0,4981
0,4982
0,4984
0,4985
0,4986
0,49865
0,49931
0,49966
0,499841
0,499928
0,499968
0,499997
0,499997
ПРИЛОЖЕНИЕ 2
Критические точки распределения c
Число степеней
свободы k
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
0,01
6,6
9,2
11,3
13,3
15,1
16,8
18,5
20,1
21,7
23,2
24,7
26,2
27,7
29,1
30,6
32,0
33,4
34,8
36,2
37,6
38,9
40,3
41,6
43,0
44,3
45,6
47,0
48,3
49,6
50,9
0,025
5,0
7,4
9,4
11,1
12,8
14,4
16,0
17,5
19,0
20,5
21,9
23,3
24,7
26,1
27,5
28,8
30,2
31,5
32,9
34,2
35,5
36,8
38,1
39,4
40,6
41,9
43,2
44,5
45,7
47,0
Уровень значимости a
0,05
0,95
3,8
0,0039
6,0
0,103
7,8
0,352
9,5
0,711
11,1
1,15
12,6
1,64
14,1
2,17
15,5
2,73
16,9
3,33
18,3
3,94
19,7
4,57
21,0
5,23
22,4
5,89
23,7
6,57
25,0
7,26
26,3
7,96
27,6
8,67
28,9
9,39
30,1
10,1
31,4
10,9
32,7
11,6
33,9
12,3
35,2
13,1
36,4
13,8
37,7
14,6
38,9
15,4
40,1
16,2
41,3
16,9
42,6
17,7
43,8
18,5
37
2
0,975
0,00098
0,051
0,216
0,484
0,831
1,24
1,69
2,18
2,70
3,25
3,82
4,40
5,01
5,63
6,26
6,91
7,56
8,23
8,91
9,59
10,3
11,0
11,7
12,4
13,1
13,8
14,6
15,3
16,0
16,8
0,99
0,00016
0,020
0,115
0,297
0,554
0,872
1,24
1,65
2,09
2,56
3,05
3,57
4,11
4,66
5,23
5,81
6,41
7,01
7,63
8,26
8,90
9,54
10,2
10,9
11,5
12,2
12,9
13,6
14,3
15,0
ПРИЛОЖЕНИЕ 3
Критические точки распределения Стьюдента
Ч Число степеней
свободы k
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
¥
Число степеней
свободы k
Уровень значимости a (двусторонняя критическая область)
0,1
0,05
0,02
0,01
0,002
0,001
6,31
12,7
31,82
63,7
318,3
637,0
2,92
4,30
6,97
9,92
22,33
31,6
2,35
3,18
4,54
5,84
10,22
12,9
2,13
2,78
3,75
4,60
7,17
8,61
2,01
2,57
3,37
4,03
5,89
6,86
1,94
2,45
3,14
3,71
5,21
5,96
1,89
2,36
3,00
3,50
4,79
5,40
1,86
2,31
2,90
3,36
4,50
5,04
1,83
2,26
2,82
3,25
4,30
4,78
1,81
2,23
2,76
3,17
4,14
4,59
1,80
2,20
2,72
3,11
4,03
4,44
1,78
2,18
2,68
3,05
3,93
4,32
1,77
2,16
2,65
3,01
3,85
4,22
1,76
2,14
2,62
2,98
3,79
4,14
1,75
2,13
2,60
2,95
3,73
4,07
1,75
2,12
2,58
2,92
3,69
4,01
1,74
2,11
2,57
2,90
3,65
3,96
1,73
2,10
2,55
2,88
3,61
3,92
1,73
2,09
2,54
2,86
3,58
3,88
1,73
2,09
2,53
2,85
3,55
3,85
1,72
2,08
2,52
2,83
3,53
3,82
1,72
2,07
2,51
2,82
3,51
3,79
1,71
2,07
2,50
2,81
3,49
3,77
1,71
2,06
2,49
2,80
3,47
3,74
1,71
2,06
2,49
2,79
3,45
3,72
1,71
2,06
2,48
2,78
3,44
3,71
1,71
2,05
2,47
2,77
3,42
3,69
1,70
2,05
2,46
2,76
3,40
3,66
1,70
2,05
2,46
2,76
3,40
3,66
1,70
2,04
2,46
2,75
3,39
3,65
1,68
2,02
2,42
2,70
3,31
3,55
1,67
2,00
2,39
2,66
3,23
3,46
1,66
1,98
2,36
2,62
3,17
3,37
1,64
1,96
2,33
2,58
3,09
3,37
0,05
0,025
0,01
0,005
0,001
0,0005
Уровень значимости a (односторонняя критическая область)
38
Учебное издание
ЕПИФАНЦЕВА Маргарита Ярополковна
ЛАБОРАТОРНЫЙ ПРАКТИКУМ
ПО СТАТИСТИКЕ
Часть 1
__________________________________
Редактор Н. А. Майорова
Корректор И. А. Сенеджук
***
Подписано в печать . .2014. Формат 60 × 84 1/16.
Офсетная печать. Бумага офсетная. Усл. печ. л. 2,5. Уч.-изд. л. 2.8
Тираж 100 экз. Заказ
.
**
Редакционно-издательский отдел ОмГУПСа
Типография ОмГУПСа
*
644046, г. Омск, пр. Маркса, 35
39
Документ
Категория
Без категории
Просмотров
6
Размер файла
398 Кб
Теги
712
1/--страниц
Пожаловаться на содержимое документа