close

Вход

Забыли?

вход по аккаунту

?

15

код для вставкиСкачать
Теория вероятностей
и математическая
статистика
Оценивание и проверка
статистических гипотез
Учебно-методическое пособие
Министерство образования и науки Российской Федерации
Сибирский федеральный университет
ТЕОРИЯ ВЕРОЯТНОСТЕЙ
И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Указания к решению задач
Оценивание и проверка статистических гипотез
учебно-методическое пособие
Красноярск
СФУ
2012
УДК 519.2(07)
ББК 22.17я73
Т 338
Составитель: Т. В. Крупкина.
Т 338 Теория вероятностей и математическая статистика: указания к
решению задач. Оценивание и проверка статистических гипотез:
учебно-методическое пособие [Текст] / Т. В. Крупкина – Красноярск : Сиб. федер. ун-т, 2012. — 40 с.
Посвящено курсу «Теория вероятностей и математическая статистика». Содержит примеры решения типовых задач для обеспечения самостоятельной работы
студентов, необходимые для решения задач теоретические сведения, а также указания по выполнению 2 части расчетной работы.
Предназначено для студентов направлений подготовки 010100.62 «Математика», 010500.62 «Прикладная математика и информатика» и 010300.62 «Математика. Компьютерные науки», а также специальностей 010101.65 «Математика» и
010501.65 «Прикладная математика и информатика».
УДК 519.2(07)
ББК 22.17я73
© Сибирский
федеральный
университет, 2012
§ 1. Достаточные статистики
Статистика T = T (X) называется достаточной для параметра θ,
если условное распределение (плотность или вероятность) случайной
величины X = (X1 , ..., Xn ) (выборки) при условии T (X) = t не зависит
от параметра θ. В дискретной модели статистика T (X) достаточна, если
P (X = x)
P (T (X) = t)
(1)
не зависит от параметра для x таких, что T (x) = t. Для непрерывных
величин распределение задается плотностью. В этом случае также достаточно показать, что
fX (x)
(2)
fT (t)
не зависит от параметра θ.
Критерий достаточности статистики – теорема Неймана — Фишера о факторизации.
Теорема 1 (теорема факторизации). В модели hFθ i статистика
T (X) является достаточной для параметра θ тогда и только
тогда, когда
L(x, θ) = g(T (x), θ) · h(x).
Представление L(x, θ) в таком виде (множитель g может зависеть от
θ, а от x зависит лишь через T (x), а множитель h от параметра θ не
зависит) называется факторизацией распределения. Факторизация не
единственна. При h ≡ 1 говорят о тривиальной факторизации.
Свойства достаточных статистик.
1. Всякая эффективная оценка является достаточной статистикой.
2. Любая взаимно однозначная функция от достаточной статистики
T является достаточной статистикой.
3. Оптимальная оценка, если она существует, является функцией от
достаточной статистики.
4. Если для скалярного параметра θ существует эффективная оценка
T (x), то T (x) совпадает с о.м.п. θ̂.
3
5. Если T (x) – достаточная статистика, а о.м.п. θ̂ существует и единственна, то θ̂ является функцией от T (x).
Статистика называется полной, если для всякой (ограниченной)
функции ϕ(T ) из того, что E ϕ(T ) = 0 следует, что ϕ(T ) ≡ 0.
Достаточная статистика, являющаяся функцией любых других
достаточных статистик, называется минимальной.
Пример 1. Исследуем на достаточность статистику
P
Z = n12 ( ni=1 Xi )2 в Pλ .
J Сначала покажем, что достаточной является статистика
n
1X
T =
Xi .
n i=1
Для проверки достаточности по определению надо убедиться, что
P (X=x)
P (T (X)=t) не зависит от параметра λ.
P (X = x) = P (X1 = x1 , .., Xn = xn ) =
n
Y
P (Xi = xi ) =
i=1
=
n
Y
e−λ λxi
i=1
Случайная величина
Pn
i=1 Xi
P (T = t) = P (
xi !
P
e−λn λ xi
= Q
.
(xi !)
имеет распределение Pλn , значит,
n
X
i=1
e−nλ (nλ)tn
.
Xi = nt) =
(tn)!
P
P
P (X = x)
e−λn λ xi (tn)!
( xi )!
P .
P (X/T = t) =
=Q
=Q
(xi !)e−nλ (nλ)tn
P (T = t)
(xi !)n xi
Полученное выражение
не зависит от параметра λ, следовательно, стаPn
1
тистика T = n i=1 Xi = x̄ является достаточной. Вместе с ней достаточна и статистика Z = T 2 , как взаимно однозначная (в силу неотрицательности) функция от достаточной статистики T . I
Пример 2. Найти достаточную статистику в показательном
распределения Eθ .
4
J Пусть (X1 , . . . , Xn , ) – выборка из данного показательного распределения. Запишем функцию правдоподобия:
L(x, θ) =
n
Y
i=1
fξ (xi ) =
n
Y
θ·e
−θxi
n −θ
=θ e
P
xi
.
i=1
Вспомним общий вид факторизации:
L(x, θ) = g(T (x), θ) · h(x).
P
P
Возьмем T (x) =
xi , тогда θn e−θ xi = g(T (x),
Pnθ. Получили тривиальную факторизацию. Следовательно, T (x) = i=1 Xi – достаточная
статистика. I
§ 2. Доверительные интервалы
Две статистики I1 (X), I2 (X) (I1 (X) < I2 (X)) называют доверительным интервалом значимости α для параметра θ (0 < α < 1),
если выполняется условие
P(I1(X) < θ < I2(X ) = 1 − α.
(3)
Число 1−α называется доверительной вероятностью, а I1 (X), I2 (X)
– нижней и верхней доверительными границами.
Для построения доверительного интервала параметра θ надо
взять статистику G(X, θ), такую, что она сама монотонно зависит от
параметра θ, а ее распределение от θ не зависит, записать уравнение
P(g1 < G(X, θ) < g2 ) = 1 − α, и разрешить неравенство под знаком
вероятности относительно параметра θ.
Доверительные интервалы для параметров нормального распределения:
s
s
· tn−1, 1− α2 , X + √
· tn−1, 1− α2 ;
Ia = X − √
n−1
n−1
!
2
2
nS
nS
Iσ2 =
, 2
.
2
χn−1,1− α χn−1, α
2
5
2
Параметр произвольного распределения можно оценить так же,
как параметр нормального распределения, если известно распределение некоторой статистики, зависящей от параметра и его оценки. Другой способ связан с использованием асимптотического метода. Если θ̂
асимптотически нормальна и несмещена (например, является о.м.п.),
то
θ̂ − θ d
p
→ u ∈ N (0, 1).
Dθ̂
!
θ̂ − θ
1 − α = P u α2 < p
< u1− α2 .
Dθ̂
Разрешая неравенство под знаком вероятности относительно θ, получим доверительный интервал значимости α.
Пример 3. Найдем асимптотический доверительный интервал
уровня значимости α для параметра p распределения Бернулли
B(1, p).
J Известно, что о.м.п. p равна
Pn
i=1 xi
= X.
n
В качестве статистики G можно взять
p−X
p−X
np − m
G= √
= p pq = √
,
npq
Dp̂
n
Pn
где m = i=1 xi . Из ЦПТ следует, что
np − m d
→ u ∈ N (0, 1).
√
npq
p̂ =
Поэтому
np − m
p u α2 6 √
6 u1− α2 = 1 − α;
npq
(u α2 = −u1− α2 ). Разрешим относительно p уравнение
np − m p
= u1− α2 .
nP (1 − p) Для этого потребуется возвести обе части в квадрат и решить относительно p квадратное уравнение. При отборе корней необходимо иметь
в виду, что 0 < p < 1. I
6
Пример 4. Найти доверительный интервал значимости α =
0, 01 для курса английского фунта стерлингов по данным за 100
дней1 .
№ Значения № Значения № Значения № Значения
1
48,9231 26 49,5273 51 49,7769 76 50,1459
2
49,0009 27 49,5319 52 49,8113 77 50,1484
3
49,0009 28 49,5642 53 49,8743 78 50,1792
4
49,0009 29 49,5757 54 49,8743 79 50,1969
5
49,0676 30 49,5757 55 49,8743 80 50,2041
6
49,1057 31 49,5757 56 49,8806 81 50,2253
7
49,1104 32 49,5908 57 49,8913 82 50,2253
8
49,1591 33 49,6426 58 49,9032 83 50,2253
9
49,1915 34 49,6436 59
49,908
84 50,2366
10 49,1957 35 49,6949 60 49,9485 85 50,2681
11 49,1957 36 49,7218 61 49,9562 86 50,2743
12 49,1957 37 49,7218 62
49,961
87 50,3392
13 49,2786 38 49,7218 63 49,9704 88 50,4789
14 49,2786 39 49,7218 64 49,9861 89 50,5537
15 49,2892 40 49,7218 65 49,9921 90 50,5914
16 49,2892 41 49,7218 66
50,029
91 50,5914
17 49,2892 42 49,7218 67 50,0655 92 50,5914
18 49,3908 43 49,7218 68 50,0655 93 50,6346
19 49,3933 44 49,7218 69 50,0655 94 50,6346
20 49,4365 45 49,7218 70 50,0779 95 50,6346
21
49,449
46 49,7218 71 50,0779 96 50,6985
22 49,5006 47 49,7297 72 50,0779 97 50,7337
23 49,5191 48 49,7297 73 50,1117 98 50,7971
24 49,5273 49 49,7297 74 50,1117 99
50,816
25 49,5273 50 49,7301 75 50,1117 100 50,9521
J Для нахождения доверительного интервала необходимо сначала
рассчитать выборочные характеристики X и S: X = 49, 8388 и S =
0, 4703. Используем формулу
S
S
Ia = X − √ · tn−1, 1− α2 , X + √ · tn−1, 1− α2 ;
n
n
1
Курс английского фунта стерлингов за период 18.11.2005 г. – 25.02.2006 г.
7
найдем по таблице квантилей распределения Стьюдента tn−1, 1− α2 =
t99, 0,995 = 2, 58. Тогда
0, 4703
0, 4703
Ia = 49, 8388 − √
· 2, 58; 49, 8388 + √
· 2, 58 =
100
100
= (49, 717; 49, 960) . I
Пример 5. Найти 95%-й доверительный интервал для числа
пассажиров пригородного поезда, если среднее число пассажиров, рассчитанное за 25 рабочих дней, равно 512, σ = 20.
J Требуется найти доверительный интервал значимости α = 0, 05 для
параметра a нормального распределения N (a, σ) при известном σ = 20;
воспользуемся вышеприведенной формулой:
σ
σ
Ia = X − √ · u1− α2 ; X + √ · u1− α2 =
n
n
20
20
= 512 − √ · u0,975 ; 512 − √ · u0,975 =
25
25
20
20
= 512 −
· 1, 96; 512 −
· 1, 96 =
5
5
= (512 − 7, 84; 512 + 7, 84) = (504, 12; 519, 84) ' (504; 520). I
Пример 6. Найти 99%-е доверительные интервалы для параметров нормального распределения по данным:
S = 2, 08, X = 0, 775, n = 100.
J Доверительный интервал минимальной длины для параметра a вычисляется следующим образом:
S
S
· tn−1,1− α2 , X̄ + √
· tn−1,1− α2 .
Ia = X̄ − √
n−1
n−1
При α = 0, 01 находим по таблице квантилей распределения
Стьюдента t99, 0,995 = 2, 576
Ia = (0, 231; 1, 31).
8
Доверительный интервал значимости α для σ
!
s
s
2
2
nS
nS
Iσ =
,
.
2
χn−1,1− α
χ2n−1, α
2
2
χ299, 0,995
При α = 0, 01 находим по таблице
70, 06 и вычисляем
Iσ = (1, 65; 2, 488). I
= 158, 95, χ299, 0,005 =
§ 3. Статистические гипотезы
Статистической гипотезой (или просто гипотезой) называется
любое утверждение о виде или свойствах распределения наблюдаемых
в эксперименте случайных величин. Статистическая гипотеза называется простой, если однозначно фиксирует распределение наблюдений.
Иначе это сложная гипотеза. Проверяемая гипотеза называется нулевой (H0 ). Любая гипотеза о распределении наблюдаемой случайной величины, которая может оказаться истинной, но отличается от основной
гипотезы, называется альтернативной гипотезой. Правило, согласно
которому проверяют гипотезу H0 (принимают или отвергают), называется статистическим критерием проверки гипотезы H0 . Статистическая гипотеза называется параметрической, если она представляет
из себя предположение о том, что неизвестный параметр распределения (дисперсия, математическое ожидание и т. п.) имеет наперед заданное значение или множество значений. В процессе проверки H0 можно
принять правильное решение или совершить ошибку.
Вероятностью ошибки первого рода называется вероятность
отклонить H0 , когда H0 верна. Эта вероятность совпадает с уровнем
значимости критерия α. Очевидно,
α = P(Hd = H1 /H0 ) = P(T (x) ∈ V /H0 )
(α равняется вероятности того, что значение статистики T принадлежит
критической области V при условии, что верна H0 ).
Вероятностью ошибки второго рода называется вероятность
принять H0 , когда H0 не верна. Вероятность ошибки второго рода обозначается β. Очевидно,
β = P(Hd = H0 /H1 ) = P(T (x) ∈ V /H1 ),
9
(β равняется вероятности того, что значение статистики T не принадлежит критической области V при условии, что верна H1 ).
Величину 1 − β будем называть мощностью критерия K и обозначать M (K). Понятие мощности критерия введено для случая простых H0 , H1 ; существенно, что множество Θ1 состоит из единственной
точки θ1 .
Наилучшие критические области (НКО)
Теорема Неймана – Пирсона. Пусть H0 : θ = θ0 , H1 : θ = θ1 .
Тогда НКО заданного уровня значимости α состоит из точек выборочного пространства, удовлетворяющих неравенству
L(x, θ1 )
> cα ,
L(x, θ0 )
где cα – константа, зависящая от α, L – функция правдоподобия.
Равномерно наиболее мощным (р.н.м.к.) размера α называется статистический критерий с заданным размером (уровнем значимости) α для проверки сложной гипотезы H0 против сложной альтернативы H1 , мощность которого не меньше мощности любого другого статистического критерия, предназначенного для проверки H0 против H1
и имеющего тот же размер α.
Критерий K для проверки гипотезы H0 против простой альтернативы H1 называется состоятельным, если
M (K) = PH1 (Hd (X) = H1 ) → 1 при n → ∞.
Критерий размера α, имеющий мощность не меньше α, называется несмещенным.
Пример 7 (НКО и мощность критерия). Найти НКО и мощность
критерия для проверки гипотезы H0 : θ = a0 , против гипотезы
H1 : a = a1 , a1 > a0 в нормальной модели с известным вторым
параметром σ.
J В модели hN (θ, σ)i рассмотрим функцию правдоподобия
L(x, θ1 )
=
L(x, θ0 )
√1
e−
(σ 2π)n
Pn
2
i=1 (xi −a1 )
2σ 2
Pn
(x −a )2
− i=12σi2 0
1
2
2
= e− 2σ2 (na1 −na0 −2(a1 −a0 )
√1
e
(σ 2π)n
10
P
xi )
> cα .
X
1
2
2
(na
−
na
−
2(a
−
a
)
xi > ln cα .
1
0
1
0
2σ 2
Выразим член, содержащий статистику (функцию от элементов выборки), и переобозначим для простоты константу:
X
−2(a1 − a0 )
xi 6 b.
−
a1 > a0 , поэтому
X
xi > d
(где d – новая константа). Таким образом, мы нашли статистику
X
T (x) =
xi
и форму НКО
V = {x :
X
xi > d}.
Чтобы найти границу критической области, перейдем к стандартной
статистике. Такой статистикой является
X − a0 √
n,
σ
P
доказывали, что Z ∈ N (0, 1). Неравенство xi > d равносильно неравенству Z > u, где u – новая константа. Поэтому НКО, заданная через
Z, будет иметь форму
V = {x : Z > u}.
Z=
По заданному α из соотношения α = P (Z ∈ V /a0 ) = P (Z > u) найдем
u:
P (Z > u) = 1 − FZ (u) = 1 − Φ(u) = α,
следовательно,
Φ(u) = 1 − α, u = u1−α ,
а НКО
X − a0 √
n > u1−α .
σ
Теперь найдем мощность критерия. По определению, мощность критерия M (K) равна 1 − β, где
β = P (T (x) ∈ V /θ1 ) = 1 − P (T (x) ∈ V /θ1 ).
Тогда
M (K) = P (T (x) ∈ V /θ1 ).
11
√
0
Статистика T (x) в данном случае равна X−a
n, θ1 = a1 , а критическая
σ
область V = [u1−α , ∞). Таким образом,
X − a0 √
n > u1−α .
M (K) = Pa1
σ
(Pa1 означает, что вероятность рассчитывается на основе модели
N (a1 , σ).)
X − a0 √
σu1−α
M (K) = Pa1
n > u1−α = Pa1 X > √ + a0 =
σ
n
σu1−α
= 1 − Pa1 X < √ + a0 .
n
Вспомним, что в N (a1 , σ) X имеет распределение N (a1 , √σn ). Тогда
!
σu
√1−α + a0 − a1
σu1−α
σu1−α
n
√ + a0 = Φ
Pa1 X < √ + a0 = FX
,
√σ
n
n
n
и
M (K) = 1 − Φ
σu
√1−α
n
+ a0 − a1
√σ
n
!
.
Можно слегка преобразовать последнее выражение, используя свойство Φ(x):
Φ(−x) = 1 − Φ(x) и свойство квантилей стандартного нормального распределения: uα = −u1−α . Окончательно получим
√ (a1 − a0 ) n
M (K) = Φ uα +
.
σ
I
Пример 8 (НКО). Найти наилучшую критическую область для
проверки гипотезы H0 : R[−a, a] против гипотезы H1 : N (0, σ)
по одному наблюдению (n = 1) при уровне значимости α = 0, 1.
J


L(x, H1 )
=
L(x, H0 ) 
2
x
√1 e− 2σ2
σ 2π
x2
− 2σ
2
√1 e
σ 2π
:
1
2a ,
x ∈ [−a, a],
: 0 = ∞, x ∈
/ [−a, a].
12
(4)
НКО V заданного уровня значимости α состоит из точек выборочного
пространства, удовлетворяющих неравенству:
L(x, θ1 )
> cα ,
L(x, θ0 )
следовательно, надо разрешить (4) относительно x. Разрешая, получаем:
V = {x : |x| > a} ∪ {x : |x| 6 d},
где d – некоторая константа. Значение константы d найдем из определения α:
α = P (Z ∈ V /H0 ); P (Z ∈ V /H0 ) = P (|x| 6 d/H0 )
и, поскольку H0 : R[−a, a], эта вероятность равна площади прямоугольника с высотой, равной плотности равномерного распределения
1
2a , и с основанием 2d. Таким образом,
d
α = P (|x| 6 d/H0 ) = .
a
Отсюда d = aα, и получен окончательный вид НКО:
V = {x : |x| > a} ∪ {x : |x| 6 aα}.
Следовательно, если наблюдаемое значение x по модулю больше a, или
не больше aα, гипотеза о равномерном распределении отвергается (в
пользу нормального распределения); если же |x| ∈ (aα; a], гипотеза о
равномерном распределении не отвергается. I
Пример 9 (мощность критерия). В условиях предыдущего примера найти мощность полученного критерия.
J Мощность критерия численно равна площади над критической областью, рассчитанной на основе распределения Z при альтернативной гипотезе H1 . Решение принимается по одному наблюдению, то есть распределение Z совпадает с распределением X. Таким образом, M (K)
равна площади криволинейной трапеции с основанием V , ограниченной сверху графиком плотности N (0, σ). Основание трапеции состоит
из трех несвязанных интервалов: (−∞; −a) ∪ [−aα; aα] ∪ (a; ∞). Площадь под графиком плотности выражается через функцию распределения, и
M (K) = Φ0,σ (−a) + (Φ0,σ (aα) − Φ0,σ (−aα)) + 1 − Φ0,σ (a).
13
Вспомним, что Φ0,σ (x) = Φ(x/σ). Тогда M (K) упрощается и выражается через функцию Φ(x). При решении задач с числовыми данными
подставляются табличные значения функции Φ(x). I
§ 4. Проверка параметрических гипотез
Алгоритм проверки статистической гипотезы.
1. Сформулировать статистическую параметрическую модель,
нулевую и альтернативную гипотезы, задать уровень значимости α.
2. Выбрать статистику Z(x), такую, что она сама зависит от параметра θ, а ее распределение при верной H0 от θ не зависит и различается
при H0 и при H1 .
3. Найти критическую область V .
4. Рассчитать по выборке значение статистики Zв .
5. Если Zв попадает в критическую область V, то нулевая гипотеза отвергается (в пользу альтернативной). Если Zв не попадает в критическую область V , то нулевая гипотеза не отвергается.
6. Сформулировать ответ в терминах вопроса.
Замечание 1. Гипотеза H0 отвергается или не отвергается с уровнем значимости α. Пусть наблюдаемая случайная величина принадлежит классу нормальных распределений N (θ1 , θ2 ). Перечислим критерии проверки гипотез о параметрах нормального распределения.
Замечание 2. В данной таблице индекс «0» внизу означает, что
значение параметра известно. Например, N (a, σ0 ) – дисперсия известна (и равна σ02 ), а математическое ожидание неизвестно. Индекс «0»
вверху означает предполагаемое значение параметра. Например, a =
a0 – математическое ожидание неизвестно, и его предполагаемое значение равно a0 . В последнем столбце указывается распределение Z при
условии, что верна H0 (Z/H0 ).
Критерии для проверки гипотез о параметрах одного распределения. Пусть наблюдаемая случайная величина принадлежит
классу нормальных распределений N (θ1 , θ2 ) ∼ N (a, σ).
Рассмотрим выборку X = {(x1 , . . . , xn )}, элементы которой
независимы и имеют распределение N (a, σ).
14
Гипотеза о дисперсии. H0 : σ = σ 0 .
Статистическая модель
Статистика Z Z/H0
hN (a0 , σ)i
P
(xi −a0 )2
(σ 0 )2
χ2n
hN (a, σ)i
nS 2
(σ 0 )2
χ2n−1
Гипотеза о среднем. H0 : a = a0 .
Статистическая модель
Статистика Z
hN (a, σ0 )i
√
(x̄−a0 ) n
σ0
N (0, 1)
hN (a, σ)i
√
(x̄−a0 ) n
s̄
Tn−1
Z/H0
Критерии для проверки гипотез о параметрах двух независимых распределений. Рассматриваются 2 независимые случайные
величины и выборки наблюдений этих величин X, Y :
X = {(x1 , . . . , xn1 )} ∈ N (a1 , σ1 ), Y = {(y1 , . . . , yn2 )} ∈ N (a2 , σ2 ).
Гипотеза о дисперсии. H0 : σ1 = σ2 .
Модель
hN (a0 , σ)i, hN (a, σ)i
Статистика Z
(s̄1 )2
(s̄2 )2 ,
Z/H0
s1 > s2 . Fn1 −1,n2 −1
Замечание. Критерий, использующий данную статистику для
проверки данной гипотезы, называется критерием Фишера.
Гипотеза о средних. H0 : a1 = a2
15
Модель
Статистика Z
r x̄−ȳ
hN (a, σ0 )i
(известны σ1 , σ2 )
hN (a, σ)i(σ1 , σ2 неизвестны, но гипотеза
H0 : σ1 = σ2 не отвергается)
Z/H0
N (0, 1)
2
2
σ2
σ1
n1 + n2
x̄−ȳ
r
2
s̄2
1 (n1 −1)+s̄2 (n2 −1) ( 1 + 1 )
n1 +n2 −2
n1
n2
r x̄−ȳ
hN (a, σ)i(σ1 , σ2 неизвестны, и гипотеза H0 :
σ1 = σ2 отвергается)
s̄2
s̄2
1
2
n1 + n2
√
Tn1 +n2 −2
Tν ,
где ν ≈
s̄2
s̄2
1
2
n1 + n2
2
s̄2
1
n1
!2
s̄2
2
n2
n1 +1
+
!2
n2 +1
Замечание 1. Критерий, использующий статистику, отмечен√
ную галочкой ( ), называется критерием Стьюдента.
Гипотеза о средних для парных совокупностей. Рассматриваются 2 случайные величины и выборки наблюдений этих величин X, Y :
X = {(x1 , . . . , xn )} ∈ N (a1 , σ1 ), Y = {(y1 , . . . , yn )} ∈ N (a2 , σ2 ), причем
Xi и Yi связаны, например, через объект наблюдения. Перейдем к разности случайных величин; тогда d = X − Y, d ∈ N (ad , σd ). Очевидно,
ad = a1 − a2 . Обычно σd неизвестно. Гипотеза H0 : a1 = a2 ∼ H0 :
ad = 0.
Модель
hN (a, σ)i
Статистика Z
√
d¯ n
s̄d
=
P √
P d2i n−1
P
n di −( di )2
Z/H0
Tn−1
Замечание 2. Этот критерий называется критерием Стьюдента для парных выборок.
Пример 10. По выборке из нормального распределения N (a, 3)
объема n = 139 со средним x = 9, 193 проверить гипотезу о том,
что параметр a равен 9.
16
−2
J
1. Пусть α = 0, 05.
hN (a, σ0 )i, σ0 = 3.
H0 : a = 9; H1 : a 6= 9.
2. В нашем примере параметр a, оценка параметра – X, известно
распределение функции
√
(X − a) n
Z(x) =
.
σ0
3. Если верна H0 : a = 9, то Z(x) ∈ N (0, 1). Если же верна H1 :
a = a1 6= 9, то распределение X ∈ N (a1 , σ0 ) смещено влево или вправо
относительно распределения X при нулевой гипотезе
N (9, σ0 ), значит,
√
(X−a) n
так же смещено и распределение Z(x) =
. Поэтому критическая
σ0
область двусторонняя:
V = {x : Z(x) 6 u0,025 или Z(x) > u0,975 },
то есть
V = {x : Z(x) 6 −1, 96} ∪ {x : Z(x) > 1, 96}.
4.
√
(X − a) n
;
Z(x) =
σ0
√
(9, 193 − 9) 139
Zв =
≈ 0, 758;
3
5. Zв не попадает в критическую область V , поскольку −1, 96 <
0, 758 < 1, 96. Следовательно, с уровнем значимости α = 0, 05 нулевая
гипотеза H0 не отвергается.
6. Вывод: данная выборка может быть взятой из совокупности с
математическим ожиданием 9 I.
Пример 11. Проверить гипотезу о том, что среднеквадратичное отклонение цены на товар σ = 1, 4, если по 101 наблюдению
S = 1, 2.
J
17
1. Можно использовать нормальную модель; уровень значимости
α зададим равным 0,05. Сформулируем гипотезы:
H0 : σξ = σ0 = 1, 4; H1 : σξ = σ1 < 1, 4
2. Воспользуемся статистикой
nS 2
Z= 2 ,
σ0
при условии H0 статистика Z имеет распределение χ2n−1 .
3. Найдем критическую область V . Так как σ1 < σ0 , то при вер2
ной гипотезе H1 статистика Z = nS
принимает меньшие значения, чем
2
σ0
при верной гипотезе H0 , следовательно, критическая область левосторонняя: V = {x : Z(x) 6 χ2α }. Из таблиц находим граничное значение Zкрит = χ2100;0,05 = 77, 929. Таким образом, критическая область
V = [0; 77, 929].
4. Рассчитаем по выборке значение статистики Zв :
nS 2
101 · (1, 2)2
Zв = 2 =
≈ 74, 2
σ0
(1, 4)2
5. Поскольку Zв = 74, 2 < 77, 929 = Zкрит , то Zв попадает в
критическую область V , следовательно нулевая гипотеза отвергается
в пользу альтернативной с уровнем значимости α = 0, 05.
6. Таким образом, нельзя считать, что среднеквадратичное отклонение цены на товар σ = 1, 4. Следует признать, что оно меньше.I
§ 5. Непараметрические критерии
Гипотеза о виде распределения. H0 : F (x) = F0 (x).
Критерии, проверяющие гипотезу о виде распределения, называются критериями согласия.
Критерий согласия Колмогорова. Пусть x = (x1 , . . . , xn ) – выборка из генеральной совокупности с неизвестной функцией распределения F (x). Выдвинута простая гипотеза H0 : F (x) = F0 (x), где F0 (x)
задана. Критерий согласия Колмогорова применяют для непрерывных
функций распределения F (x).
18
В качестве статистики критерия выбирают величину
Dn = Dn (x) = sup |(Fn (x) − (F (x)|,
(5)
x
а в качестве критической области – область вида
V = (t∗ , ∞),
(6)
где t∗ табулировано. Так, t∗ = t∗α = 1, 3581 при α = 0, 05; t∗α = 1, 6276
при α = 0, 01. Таким образом, при заданном уровне значимости α правило проверки гипотезы H0 при n > 20 сводится к следующему:
если значение статистики t̂ = Dn (x) = maxx |Fn∗ (x) − F0 (x)| удовлетворяет неравенству
√
n · t̂ > t∗ ,
то H0 отвергают, в противном случае делают вывод, что статистические
данные не противоречат гипотезе.
Критерий согласия χ2 Пирсона. Критерий согласия χ2 Пирсона также проверяет гипотезу H0 : F (x) = F0 (x), но его можно применять для любых распределений. Чтобы воспользоваться этим критерием, выборочные данные предварительно группируют. Пусть ni –
число значений, попавших в i-й интервал, i = 1, . . . , k, n – объем выборки, pi – теоретическая вероятность попадания одного элемента выборки в i-й интервал. Однако в теоретическом распределении могут
быть неизвестные параметры (θ1 , . . . , θr ), что обычно и встречается на
практике. Тогда по выборке (x1 , . . . , xn ) первоначально находят оценки
(θ1∗ , . . . , θr∗ ) и затем по F (x, θ1∗ , . . . , θr∗ ) вычисляют теоретические вероятности pi .
Статистика критерия
Z=
k
X
(ni − npi )2
i=1
npi
∼ χ2ν ,
(7)
где ν = k − r − 1 – число степеней свободы. Ограничения: n > 50 и
npi > 4. Критическую область задаем в виде V = (t∗ , ∞), значение t∗ –
квантиль распределения χ2ν порядка (1 − α).
Таким образом, вид критерия согласия χ2 :
если значение статистики Zв удовлетворяет неравенству
Zв > t∗ ,
гипотезу H0 отвергают, в противном случае гипотеза H0 не противоречит условиям испытаний.
19
Пример 12. Фирма предлагает 3 вида продукта. По данным прошлого года вероятности заказов для разных видов соответственно равны 0,1; 0, 65; 0,25. В этом году из 600 покупателей
42 приобрели продукт первого вида, 365 – второго, 193 – третьего. Можно ли считать, что предпочтения покупателей не
изменились?
J Проверим гипотезу H0 : F (x) = F0 (x), где F0 обозначает распределение вероятностей по данным прошлого года. Составим таблицу:
Вид продукта
1
2
3
Число покупок ni 42 365 193
pi
0, 1 0, 65 0, 25
npi
60 390 150
Здесь n = 600, pi – теоретическая вероятность покупки продукта i-го
вида, i = 1, 2, 3.
Zв =
3
X
(ni − npi )2
npi
i=1
=
2
(42 − 60)
(365 − 390)2 (193 − 150)2
=
+
+
= 19, 33.
60
390
150
Пусть α = 0, 015.
t∗ = χ2l−r−1; 0,99 = χ23−0−1; 0,95 = χ22; 0,99 = 9, 21034
(последнее значение нашли по таблице).
Zв > t∗ ,
следовательно, гипотезу H0 отвергают и следует считать, что предпочтения покупателей изменились.I
Пример 13. Было проведено 1000 измерений случайной величины η, равной времени ожидания ответа на запрос, измеренному
в долях от теоретически возможного максимального времени,
принятого за единицу. Требуется выяснить распределение этой
величины.
20
J Сгруппируем данные:
№
1
2
3
4
5
6
7
8
9
10
11
Интервал Численность ni
0, 00 − 0, 09
80
0, 09 − 0, 18
81
0, 18 − 0, 27
93
0, 27 − 0, 36
85
0, 36 − 0, 45
87
0, 45 − 0, 54
87
0, 54 − 0, 63
87
0, 63 − 0, 72
106
0, 72 − 0, 81
99
0, 81 − 0, 90
89
0, 90 − 0, 99
106
ni
n
ni
nh
P ni
0,080
0,081
0,093
0,085
0,087
0,087
0,087
0,106
0,099
0,089
0,106
0,007
0,007
0,008
0,008
0,008
0,008
0,008
0,010
0,009
0,008
0,010
0,080
0,161
0,254
0,339
0,426
0,513
0,600
0,706
0,805
0,894
1,000
n
По рассмотрении таблицы группировки можно выдвинуть гипотезу о равномерном распределении. Параметры этого распределения
найдем с помощью оценивания:
â = ymin = x∗1 = 0,
b̂ = xmax = x∗n ≈ 1.
H0 : Fη (y) = FR[0,1] (y).
Применим критерий согласия χ2 Пирсона.
В качестве статистики критерия возьмем величину
Z=
k
X
(ni − npi )2
npi
i=1
,
где pi – теоретическая вероятность попадания одного элемента выборки в i-й интервал, равная 0,1. После вычислений получаем Zв = 9, 25.
Критическая область Vk = (χ2k−r−1,1−α , +∞), где r – число параметров, оцененных в выборке. У нас r = 2, в таблице значений квантилей распределения χ2 находим χ28,0.95 = 15, 51. Так как значение Zв не
попало в критическую область, то гипотеза H0 не отвергается, то есть
статистические данные не противоречат гипотезе о том, что величина η
имеет распределение R[0, 1]. I
Пример 14. В условиях предыдущего примера проверим гипотезу с помощью критерия согласия Колмогорова.
21
J H0 : Fη (y) = FR[0,1] (y).
В качестве статистики критерия возьмем величину
√
Dn = n · max Fn∗ (y) − FR[0,1] (y) .
y
После вычислений мы получили Dn = 1, 22. Так как критическая область для α = 0, 05 равна Vk = (1, 36; +∞), a значение Dn не попадает
в критическую область, то гипотеза H0 не отвергается, то есть можно
считать, что величина η имеет распределение R[0, 1] I
§ 6. Модель линейной регрессии
Пусть Y – случайная величина, Xi , i = 1, . . . , k – контролируемые (неслучайные) переменные. Модель (функциональная зависимость) известна из предварительных соображений с точностью до параметров:
Y = f (X1 , . . . , Xk , θ1 , . . . , θs ) + ε,
где θi , i = 1, . . . , s – параметры, ε – вектор ошибок. Будем считать, что
E ε = 0 и ошибки некоррелированы.
Параметры выбираются так, чтобы минимизировать сумму квадратов ошибок:
P
R = ni=1 (Yi − f (Xi1 , . . . , Xik , θ1 , . . . , θs ))2 → min,
∂R
= 0, j = 1, . . . , s.
∂θj
Наиболее часто используются линейные по параметрам модели вида
Y = θ1 · a1 (X1 ) + θ2 · a2 (X2 ) + . . . + θk · ak (Xk ) + ε.
(Если ak (Xk ) ≡ 1, будет свободный член.)
Рассмотрим основной случай, когда ai (Xi ) = Xi . Тогда исходные
данные имеют вид
Y = X · θ + ε.
Рассмотрим модель
Y1 = X11 θ1 + . . . + X1k θk + ε1
...
Yn = Xn1 θ1 + . . . + Xnk θk + εn
22
или
Y = X · θ + ε.
Оценка θ, найденная из условия
R=
X
(Yi −
k
X
Xij θj )2 → min,
j=1
равна
θ̂ = (X T X)−1 · X T Y.
(8)
В одномерном случае для нахождения параметров линейной модели
Y = X · θ + θ1 + ε удобно использовать следующие формулы, получаемые из соотношения
θ̂ = (X T X)−1 · X T Y :
θ̂ =
где
SSxy
SSxy
, θ̂1 = y − θ̂ · x,
SSxx
(9)
P
P
( i xi )( i yi )
,
=
(xi − x)(yi − y) =
x i yi −
n
i
i
P
2
X
X
(
2
2
i xi )
SSxx =
(xi − x) =
xi −
.
n
i
i
X
X
Свойства оценок МНК
1. E θ̂ = θ. (Несмещeнность).
2. Kθ̂ = σ 2 (XT X)−1 .
3. Теорема Гаусса – Маркова.
В классе несмещенных линейных оценок оценки МНК имеют наименьшую дисперсию.
В линейной модели Y = X · θ + θ1 + ε (одномерный случай) доверительный интервал для коэффициента регрессии θ
θ̂ ± tn−2,1− α2 Sθ̂ ,
где
s
Sθ̂ =
P
− Ŷi )2
;
P
(n − 2) (Xi − X)2
i (Yi
23
доверительный интервал для среднего значения y при фиксированном
x0 :
s
1
(x0 − x)2
ŷ ± tn−2,1− α2 S
+P
;
n
(xi − x)2
доверительный интервал для индивидуального значения y при фиксированном x0 :
s
1
(x0 − x)2
α
ŷ ± tn−2,1− 2 S 1 + + P
,
(xi − x)2
n
где
sP
− ŷi )2
.
(n − 2)
i (yi
S=
Пример 15. Найдем оценки параметров линейной модели Y = X1 ·
θ1 + X2 θ2 + ε по данным
X1
0
1
0
1
X2
0
0
1
1
Y
0, 1 0, 9 2, 1 3, 0
J
θ̂ = (X T X)−1 · X T Y.


0
0


2
1
1
0
0
1
0
1

XT X =
·
0 1= 1 2 ;
0 0 1 1
1 1
2
−1
2/3
−1/3
(X T X)−1 = 1/3 ·
=
.
−1 2
−1/3 2/3


0,
1


0
1
0
1
0,
9
3,
9
=
.
XT Y =
·

0 0 1 1
2, 1 
5, 1
3, 0
2/3
−1/3
3,
9
0,
9
θ̂ = (X T X)−1 · X T Y =
·
=
;
−1/3 2/3
5, 1
2, 1
Ŷ = 0, 9X1 + 2, 1X2 . I
24
Пример 16. Найдем по данным примера 15 величину R̂, равную
сумме квадратов ошибок.
P
P
P
J R = i (Yi − 2j=1 Xij θj )2 = i (Yi − Ŷi )2 , где Ŷi – значения,
вычисленные по уравнению регрессии Ŷ = 0, 9X1 + 2, 1X2 .
X1
0
1
0
1
X2
0
0
1
1
Y
0, 1 0, 9 2, 1 3, 0
0 0, 9 2, 1 3, 0
Ŷ
|Y − Ŷ | 0, 1 0
0
0
X
R=
(Yi − Ŷi )2 = 0, 01. I
i
Пример 17 (модель со свободным членом). Найдем оценки параметров линейной модели Y = X1 · θ1 + X2 θ2 + θ3 + ε по данным
X1 1
0
1
X2 1
0
0
Y
0 −1, 1 2
J Будем считать, что переменная X трехмерна, и рассматривать
модель Y = X1 · θ1 + X2 θ2 + X3 θ2 + ε, где X3 ≡ 1:
X1
X2
X3
Y
1
0
1
0
1
1
0 −1, 1
1
0
1
2
θ̂ = (X T X)−1 · X T Y.

 
 

1 0 1
1 1 1
2 1 2
XT X =  1 0 0  ·  0 0 1  =  1 1 1  ;
1 1 1
1 0 1
2 1 3


2 −1 −1
(X T X)−1 =  −1 2 0  .
−1 0 1
25

 
1 0 1
XT Y =  1 0 0  · 
1 1 1

2 −1
T
−1
T
θ̂ = (X X) · X Y =  −1 2
−1 0
 

0
2
−1, 1  =  0  .
2
0, 9
 

 
2
3, 1
−1
0  ·  0  =  −2  ;
0, 9
−1, 1
1
Ŷ = 3, 1X1 − 2X2 − 1, 1. I
Пример 18. Найдем оценку параметра линейной модели Y = X ·
θ + ε по данным
X1
0
1
0
1
X2
0
0
1
1
Y1
0, 1
3, 1
Y2
J
1, 9 5, 2
−0, 1 −0, 9 0, 8 0, 1


2 −1 −1
(X T X)−1 =  −1 2 0  .
−1 0 1
8,
3
−0,
8
XT Y =
.
7, 1 0, 9
3,
17
−0,
83
θ̂ = (X T X)−1 · X T Y =
.
1, 96 0, 86
Ŷ1 = 3, 1X1 + 1, 96X2 .
Ŷ2 = −0, 83X1 + 0, 86X2 .
Посмотрим, насколько хорошо модель приближает данные:
X1
0
1
0
1
X2
0
0
1
1
Y1 0, 1 3, 1 1, 9 5, 2
Y2 −0, 1 −0, 9 0, 8 0, 1
I
26
Пример 19. Найдем оценки параметров линейной модели Y = X ·
θ + θ1 + ε, используя формулы (9) по данным
X 1 2 3 4 5
Y
J
1 1 2 2 4
P
P
15 · 10
( i xi )( i yi )
SSxy =
xi yi −
= 37 −
= 7.
n
5
i
P
X
225
( i xi )2
2
= 55 −
= 10.
SSxx =
xi −
n
5
i
X
SSxy
7
= 0, 7.
=
SSxx
10
10
θ̂1 = y − θ̂ · x =
− 0, 7 · 3 = 2 − 2, 1 = −0, 1.
5
Ŷ = 0, 7X − 0, 1. I
θ̂ =
Пример 20. Найдем 95 %-й доверительный интервал для коэффициента регрессии θ в линейной модели Y = X · θ + θ1 + ε по
данным:
X 1 2 3 4 5
Y
1 1 2 2 4
J Доверительный интервал равен
θ̂ ± tn−2,1− α2 Sθ̂ ,
где
s
P
Sθ̂ =
ŷi )2
.
(xi − x)2
i−
i (y
P
(n − 2)
X
X
θ̂ = 0, 7,
(xi − x)2 = 10;
(yi − ŷi )2 = 1, 1; n = 5, t3;0,975 = 3, 182.
i
Подставляя найденные значения, получаем доверительный интервал
для коэффициента регрессии:
0, 7 ± 0, 61 = [0, 09; 1, 31].
I
27
Пример 21. В условиях предыдущего примера найдем 95 %-й доверительный интервал для среднего значения y при x = 4.
J Доверительный интервал равен
s
1
(x0 − x)2
+P
,
n
(xi − x)2
ŷ ± tn−2,1− α2 S
где
sP
S=
x = 3,
X
− ŷi )2
.
(n − 2)
i (yi
(xi − x)2 = 10; S = 0, 61, t3;0,975 = 3, 182.
Доверительный интервал для среднего:
r
1 (4 − 3)2
2, 7 ± 3, 182 · 0, 61
+
= 2, 7 ± 1, 1 = [1, 6; 3, 8].
5
10
I
Пример 22. Сравним интервал, полученный в предыдущем примере, с 95 %-й доверительным интервалом для индивидуального
значения (прогноза) y при x = 4.
J Доверительный интервал для прогноза y равен
s
1
(x0 − x)2
ŷ ± tn−2,1− α2 S 1 + + P
.
n
(xi − x)2
Получаем
r
2, 7 ± 3, 182 · 0, 61 1 +
1 (4 − 3)2
+
= 2, 7 ± 2, 2 = [0, 5; 4, 9].
5
10
Доверительный интервал прогноза значения в 2 раза шире, чем доверительный интервал для среднего значения. I
28
Приложение 1
Задание к расчетной работе
«Моделирование и статистическая обработка выборки значений
двумерной случайной величины с зависимыми компонентами»
Часть 2
5. Интервальное оценивание параметров. Построить доверительные интервалы для каждого из параметров уровней значимости
0.05 и 0.01 для каждой компоненты.
6. Проверка гипотез. Сформулировать и проверить гипотезы о виде
распределения для каждой компоненты и гипотезы о каждом из
параметров.
7. Принятие статистического решения. Рассчитать для данной модели теоретические числовые характеристики (см. п. 2) и составить параллельную таблицу теоретических и выборочных числовых характеристик, построить на одном чертеже и в одном масштабе график плотности, гистограмму и полигон для каждой компоненты, в случае если гипотезы о выбранной статистической модели не отвергаются, сделать вывод о распределении генеральной
совокупности, в случае если гипотезы о выбранной статистической
модели отвергаются, предложить другую модель.
Указания по выполнению и оформлению расчетной работы
При выполнении работы рекомендуется опираться на следующие пособия: (1), (2), (3).
Ниже указаны параграфы пособий, используемые при выполнении расчетной работы.
5. Интервальное оценивание параметров. (2), § 11, (3)), § 11.
6. Проверка гипотез. (2), §§ 12—14, (3), §§ 12—14.
7. Принятие статистического решения. (2), § 16, (1), § 17.
Выполненные задания оформляются в соответствии с требованиями оформления студенческих текстовых документов [7]. Отчет о выполнении работы сдается в бумажном виде и должен быть распечатан
на листах формата А4, файл с расчетами сдается в электронном виде.
Образцы выполнения и оформления работы выложены в электронном
курсе. Работа оценивается по 100-балльной шкале. Срок сдачи работы: последняя неделя семестра.
29
Приложение 2
Таблица 1.
x
0, 0
0, 1
0, 2
0, 3
0, 4
0, 5
0, 6
0, 7
0, 8
0, 9
1, 0
1, 1
1, 2
1, 3
1, 4
1, 5
1, 6
1, 7
1, 8
1, 9
2, 0
2, 1
2, 2
2, 3
2, 4
2, 5
2, 6
2, 7
2, 8
2, 9
3, 0
0
0, 0000
03983
07920
11791
15542
19146
22575
25804
28814
31594
34134
36433
38493
40320
41924
43319
44520
45543
46407
47128
47725
48214
48610
48928
49180
49379
49535
49653
49744
49813
49865
1
00399
04380
08317
12172
15910
19497
22907
26115
29103
31859
34375
36650
38686
40490
42073
43447
44630
45637
46485
47193
47778
48257
48645
48956
49202
49396
49547
49664
49752
49819
49869
0
49865
Десятые доли x
1
2
3
4
5
6
7
8
9
49903 49931 49952 49966 49977 49984 49989 49993 49995
x
3
Zx
1
2
e−t /2 dt
Значения функции Φ0 (x) = √
2π
0
Сотые доли x
2
3
4
5
6
7
00798 01197 01595 01994 02392 02790
04776 05117 05567 05962 06356 06749
08700 09095 09483 09871 10257 10642
12552 12930 13307 13683 14058 14431
16276 16640 17003 17365 17724 18082
19847 20194 20540 20884 21226 21566
23237 23565 23891 24215 24537 24857
26424 26731 27035 27337 27637 27935
29389 29673 29955 30234 30511 30785
32121 32381 32639 32894 33147 33398
34614 34850 35083 35314 35543 35769
36864 37076 37286 37493 37698 37900
38877 39065 39251 39435 39617 39796
40658 40824 40988 41149 41309 41466
42220 42634 42507 42647 42786 42922
43574 43699 43822 43943 44062 44179
44738 44845 44950 45053 45154 45254
45728 45819 45907 45994 46080 46164
46562 46638 46712 46784 46856 46926
47257 47320 47381 47441 47500 47558
47831 47882 47932 47982 48030 48077
48300 48341 48382 48422 48461 48499
48679 48713 48745 48778 48809 48839
48983 49010 49036 49061 49086 49111
49224 49245 49266 49286 49305 49324
49413 49430 49446 49461 49477 49491
49560 49573 49586 49598 49609 49621
49674 49683 49693 49702 49711 49720
49760 49767 49774 49781 49788 49795
49825 49830 49836 49841 49846 49851
49874 49878 49882 49886 49889 49893
30
8
03188
07142
11026
14803
18439
21904
25175
28230
31057
33646
35993
38100
39973
41621
43056
44295
45352
46246
46995
47615
48124
48537
48870
49134
49343
49506
49632
49728
49801
49856
49897
9
03586
07535
11409
15173
18793
22241
25490
28524
31328
33891
36214
38298
40148
41774
43189
44408
45449
46327
47062
47671
48169
48574
48899
49158
49361
49520
49643
49737
49807
49861
49899
Приложение 2
Таблица 2.
Значения квантилей распределения Стьюдента Tn
n/α
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
18
20
22
25
27
30
40
50
70
100
∞
0,95
2,92
2,35
2,13
2,02
1,94
1,90
1,86
1,83
1,81
1,80
1,78
1,77
1,76
1,75
1,75
1,73
1,73
1,72
1,71
1,70
1,70
1,68
1,68
1,67
1,66
1,65
0,975
4,30
3,18
2,78
2,57
2,45
2,37
2,31
2,26
2,23
2,20
2,18
2,16
2,15
2,13
2,12
2,10
2,09
2,07
2,06
2,06
2,04
2,02
2,00
1,99
1,98
1,96
0,99
6,97
4,54
3,75
3,37
3,14
3,00
2,90
2,82
2,76
2,72
2,68
2,65
2,62
2,60
2,58
2,55
2,53
2,51
2,49
2,48
2,46
2,42
2,40
2,38
2,36
2,33
0,995
9,52
5,84
4,60
4,03
3,71
3,50
3,36
3,25
3,17
3,11
3,06
3,01
2,98
2,95
2,92
2,88
2,85
2,82
2,79
2,77
2,75
2,70
2,68
2,65
2,63
2,58
Указание. Пусть необходимо получить значение квантили распределения Стьюдента T9 порядка α = 0, 95. На пересечении столбца 0, 95 (порядок «α») и строки 9
(число степеней свободы «n») находим значение 1, 83, то есть
t9;0,95 = 1, 83.
Замечание. В силу симметричности распределения Стьюдента tn;1−α = −tn;α .
31
Приложение 2
Таблица 3.
Значения квантилей распределения χ2n
n/α
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
40
60
80
100
0,01
0,000
0,020
0,115
0,297
0,554
0,872
1,24
1,65
2,09
2,56
3,05
3,57
4,11
4,66
5,23
5,81
6,41
7,01
7,637
8,26
11,52
14,95
22,16
37,48
53,54
70,06
0,05
0,004
0,103
0,352
0,711
1,15
1,64
2,17
2,73
3,33
3,94
4,57
5,23
5,89
6,57
7,26
7,96
8,67
9,39
10,12
10,85
14,62
10,85
26,51
43,19
60,39
95,70
0,10
0,016
0,211
0,584
1,064
1,61
2,20
2,83
3,49
4,17
4,87
5,58
6,30
7,04
7,79
8,55
9,31
10,09
10,86
11,65
12,44
14,62
18,49
29,05
46,46
64,28
100,62
0,90
2,71
4,61
6,25
7,78
9,24
10,64
12,02
13,36
14,68
15,99
17,28
18,55
19,81
21,06
22,31
23,54
24,77
25,99
27,20
28,41
34,38
40,26
51,81
74,40
96,58
140,23
0,95
3,84
5,99
7,81
9,49
11,07
12,59
14,07
15,51
16,92
18,31
19,68
21,03
22,36
23,68
25,00
26,30
27,59
28,87
30,14
31,41
37,65
43,77
55,76
79,08
101,88
146,57
0,99
6,63
9,21
11,34
13,28
15,09
16,81
18,48
20,09
21,67
23,21
24,73
26,22
27,69
29,14
30,58
32,00
33,41
34,81
36,19
37,57
44,31
50,89
63,69
88,38
112,33
158,95
Указание. Пусть необходимо получить значение квантили распределения χ210 порядка α = 0, 95. На пересечении столбца 0, 95 (порядок «α») и строки 10 (число
степеней свободы «n») находим значение 18, 31, то есть
χ210;0,95 = 18, 31.
32
Приложение 2
Таблица 4.
Значения квантилей распределения F порядка α = 0, 01
n2 /n1
1
2
3
4
5
6
7
8
9
10
11
12
1
4052
98,5
34,1
21,2
16,3
13,8
12,3
11,3
10,6
10,0
9,9
9,3
2
4999
99,0
30,8
18,0
13,3
11,0
9,6
8,7
8,0
7,6
7,2
6,9
3
5403
99,2
29,5
16,7
12,1
9,8
8,5
7,6
7,0
6,6
6,2
6,0
4
5625
99,25
28,7
16,0
11,4
9,2
7,9
7,0
6,4
6,0
5,7
5,4
5
5764
99,3
28,2
15,5
11,0
8,8
7,5
6,6
6,1
5,6
5,3
5,1
6
5889
99,33
27,9
15,2
10,7
8,5
7,2
6,4
5,8
5,4
5,1
4,8
7
5928
99,34
27,7
15,0
10,5
8,3
7,0
6,2
5,6
5,2
4,9
4,7
8
5981
99,36
27,5
14,8
10,3
8,1
6,8
6,0
5,5
5,1
4,7
4,5
9
6022
99,38
27,3
14,7
10,2
8,0
6,7
5,9
5,4
5,0
4,6
4,4
10
6054
99,4
27,2
14,5
10,1
7,9
6,6
5,8
5,3
4,9
4,5
4,3
Таблица 5.
Значения квантилей распределения F порядка α = 0, 05
n2 /n1
1
2
3
4
5
6
7
8
9
10
1
161 200 216
225
230
234
237
239
241
242
2
18,5 19,0 19,2 19,25 19,3 19,33 19,36 19,37 19,38 19,38
3
10,1 9,6
9,3
9,1
9,0
8,94
8,88
8,84
8,81
8,78
4
7,7
7,0
6,6
6,4
6,3
6,2
6,1
6,04
6,0
5,96
5
6,6
5,8
5,4
5,2
5,1
5,0
4,9
4,8
4,78
4,74
6
6,0
5,1
4,8
4,5
,4
4,3
4,2
4,15
4,1
4,06
7
5,6
4,7
4,4
4,1
4,0
3,9
3,8
3,7
3,68
3,63
8
5,3
4,5
4,1
3,8
3,7
3,6
3,5
3,44
3,4
3,34
9
5,1
4,3
3,9
3,6
3,5
3,4
3,3
3,2
3,18
3,13
10
5,0
4,1
3,7
3,5
3,3
3,2
3,1
3,07
3,02
2,97
11
4,8
4,0
3,6
3,4
3,2
3,1
3,0
2,95
2,9
2,86
12
4,75 3,9
3,5
3,3
3,1
3,0
2,9
2,85
2,8
2,76
Указание. Пусть необходимо получить значение квантили распределения F10,12
порядка α = 0, 05. На пересечении столбца 10 (число степеней свободы «n1 ») и
строки 12 (число степеней свободы «n2 ») находим значение 2, 76, то есть
F10,12;0,95 = 2, 76.
33
n1 /n2
4
6
9
12
15
18
21
24
27
30
33
36
39
42
45
48
51
54
57
60
4
6
9
1
3
5
6 12 21
9 17 30
12 23 39
16 28 48
19 34 57
22 39 66
25 45 75
28 50 85
31 56 94
35 61 103
38 67 112
41 72 121
44 78 131
47 83 140
50 89 149
53 94 158
57 100 167
60 105 177
15
72
88
105
122
139
156
173
189
206
223
240
257
274
291
308
325
12
42
55
68
81
94
107
120
133
146
159
172
185
198
211
224
237
250
109
130
150
171
192
213
233
254
275
296
317
338
359
379
400
18
154
179
203
228
253
278
302
327
352
377
402
427
451
476
21
207
236
265
293
322
351
380
408
437
466
495
524
553
24
268
301
334
367
399
432
465
498
531
564
597
630
27
338
374
411
448
485
522
559
596
633
670
707
30
415
456
497
538
579
620
661
702
743
784
33
501
546
591
636
681
726
771
816
862
36
42
45
48
595
644 697
693 750 808
742 804 865 927
791 857 922 988
841 910 980 1050
890 964 1037 1111
939 1017 1095 1199
39
54
57
60
1054
1119 1189
1185 1259 1333
1251 1329 1407 1486
51
Критические значения критерия U Манна-Уитни при уровне значимости α = 0, 05
Таблица 6.
Приложение 2
34
35
B (r, p) — отрицательное
биномиальное (Паскаля)
Gp — геометрическое
GG (N, M, n) —
гипергеометрическое
Pλ — Пуассона
B (N, p) — биномиальное
B (1, p) — Бернулли
Дискретное равномерное
Вырожденное
Обозначение
ξ = 0, 1, . . .
ξ = 0, 1, . . .
ξ=
0, 1, . . . , min (M, n)
ξ = 0, 1, . . .
ξ = 0, 1, . . . , N
ξ = 0, 1
P(ξ = 1) = p
1
n
λm e−λ
,
m!
m = 0, 1, . . . ; r > 0; 0 < p < 1
m
P(ξ = m) = Cr+m−1
pr (1 − p)m ,
P(ξ = m) = p(1 − p)m ,
0<p<1
P(ξ = m) = pM, N (m, n) =
m C n−m
CM
N −M
,
n
CN
n 6 N, m 6 M
P(ξ = m) = pλ (m) =
λ>0
m = 0, 1, . . . , N ; N ∈ N;
0<p<1
m pm (1 − p)N −m .
P(ξ = m) = CN
P(ξ = 0) = 1 − p,
P(ξ = xi ) =
P(ξ = c) = 1
ξ≡c
ξ = xi ;
i = 1, 2, . . . , n
Закон распределения
Значения
Таблица 7. Некоторые важные дискретные распределения
Если r ∈ Z, то m — число неудач до r-го
успеха
Число неудач до первого успеха
Из N предметов, среди которых M предметов 1-го вида и (N − M ) предметов 2-го
вида, производят выборку без возвращения n предметов, где 1 6 n 6 N . Случайная величина — число предметов 1-го
вида в выборке
Число маловероятных успехов в бесконечном ряду испытаний (λ — среднее число успехов)
Число успехов в N испытаниях, проводимых по схеме Бернулли
Число успехов в одном испытании
Величина с равновероятными значениями
Случайная величина — постоянная c
Интерпретация
Приложение 2
#
36
p>0
Парето
σ>0
λ>0
a,
σ>0
Лапласа
[частный случай распределения Кэптейна при g (x) = ln x]
Логарифмически нормальное
a,
β>0
α > 0,
Γα, β — гамма-распределение
Кэптейна
λ>0
λ>0
σ>0
a > 0,
a,
a<b
Параметры
Ca, λ — Коши
Eλ — показательное (экспоненциальное)
N (0, 1) — стандартное нормальное распределение,
причем fξ (x) = ϕ (x), Fξ (x) = Φ (x)
N (a,
" σ) — нормальное
R [a, b] — равномерное
Обозначение
Таблица 8. Некоторые важные непрерывные распределения
0 при x < 0
при x > 0
o
2
Γ−1 (β)αβ xβ−1 e−αx
(
0 при x < 1,
при x > 1.
p x−(p+1)
λ
exp {−λ|x − α|}
2
n
g 0 (x)
√ exp − (g (x)−a)
2σ 2
σ 2π
n
o
1
x−a)2
√
exp − (ln 2σ
, x>0
2
σ 2πx
(
1
λ
· 2
π λ + (x − a)2
o
n
2
1
√ · exp − (x−a)
= ϕa, σ (x)
2σ 2
σ 2π
(
0 при x < 0,
−λx
λe
при x > 0
Плотность распределения
(
0 при x ∈
/ [a, b],
1/(b − a) при x ∈ [a, b]
Приложение 2
Приложение 2
Таблица 9. Мат. ожидания и дисперсии некоторых важных распределений
Распределение
Eξ
Dξ
Бернулли
B (1, p)
p
pq
Биномиальное
B (N, p)
Np
N pq
λ
λ
M
N
nM (N − M )(N − n)
N 2 (N − 1)
Пуассона
Pλ
Гипергеометрическое
Gm, n (M, N )
Геометрическое
Gp
q
p
q
p2
Паскаля
B (r, p)
rq
p
rq
p2
Равномерное
R[a, b]
a+b
2
(b − a)2
12
Нормальное
N (a, σ)
a
σ2
Показательное
Eλ
1
λ
1
λ2
@
@
β
α
β
α2
α
2
λ2
Коши
Γ (Гамма)
n
Ca, λ
Γα, β
Лапласа
37
Библиографический список
[1] Крупкина, Т. В. Теория вероятностей и случайные процессы.
Ч. 1: учебное пособие / Т. В. Крупкина, С. В. Бабенышев, А. К.
Гречкосеев, Е. С. Кирик. СФУ. 2008.
[2] Крупкина, Т. В. Математическая статистика: курс лекций. / Т.
В. Крупкина, А. К. Гречкосеев. — Красноярск : ИПК СФУ, 2009.
[3] Крупкина, Т. В. Математическая статистика в примерах и задачах: : практикум по решению задач / Т. В. Крупкина, А. К.
Гречкосеев. – Красноярск: ИПК СФУ, 2009.
[4] Крупкина, Т. В. Теория вероятностей и математическая статистика. Сб. задач Ч. 4 : учебно-методическое пособие [Текст] /
Т. В. Крупкина, А. И. Пыжев. – Красноярск — Сиб. федер. ун-т,
2012.
[5] Боровков, А. А. Математическая статистика. Оценка параметров. Проверка гипотез / А. А. Боровков. – М. : ФИЗМАТЛИТ,
2007.
[6] Ивченко, Г. И. Математическая статистика : учеб. пособие /
Г. И. Ивченко, Ю. И. Медведев . – М. : Высш. шк., 1984.
[7] СТО 4.2–07–2008. Система менеджмента качества. Общие
требования к построению, изложению и оформлению документов
учебной и научной деятельности [текст] / разраб. : Т. В. Сильченко,
Л. В. Белошапко, В. К. Младенцева, М. И. Губанова. – Красноярск : ИПК СФУ, 2008.
38
Оглавление
§ 1. Достаточные статистики . . . . . . . . . . . . . . . . . . .
§ 2. Доверительные интервалы . . . . . . . . . . . . . . . . . .
3
5
§ 3. Статистические гипотезы . . . . . .
§ 4. Проверка параметрических гипотез
§ 5. Непараметрические критерии . . .
§ 6. Модель линейной регрессии . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. 9
. 14
. 18
. 22
Приложение 1 . . .
Приложение 2 . . .
Список литературы
Оглавление . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
39
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
29
38
38
38
Учебное издание
Теория вероятностей и математическая статистика
Указания к решению задач
Оценивание и проверка статистических гипотез
Составитель:
Крупкина Татьяна Валерьевна
Подготовлено к публикации редакционно-издательским
отделом БИК СФУ
Подписано в печать 12.03.2012 г. Формат 60х84/16.
Бумага офсетная. Печать плоская.
Усл. печ. л. 2,5. Уч.-изд. л. 2,2.
Тираж 50 экз. Заказ № 6599.
Редакционно-издательский отдел
Библиотечно-издательского комплекса
Сибирского федерального университета
660041, г. Красноярск, пр. Свободный, 79
Тел/факс (391) 201-21-49. E-mail [email protected]
http://rio.sfu-kras.ru
Отпечатано Полиграфическим центром
Библиотечно-издательского комплекса
Сибирского федерального университета
660041, г. Красноярск, пр. Свободный, 82а
Документ
Категория
Без категории
Просмотров
45
Размер файла
344 Кб
Теги
1/--страниц
Пожаловаться на содержимое документа