close

Вход

Забыли?

вход по аккаунту

?

763.Статистические методы в психологии учеб.-метод. пособие [для студентов спец. 030300

код для вставкиСкачать
Министерство образования и науки Российской Федерации
Сибирский федеральный университет
Магистратура
СТАТИСТИЧЕСКИЕ МЕТОДЫ В ПСИХОЛОГИИ
Учебно-методическое пособие
Электронное издание
Красноярск
СФУ
2013
1
УДК 159.9.01(07)
ББК 88.3я73
С781
Составитель: Новопашина Лариса Александровна
С781
Статистические методы в психологии: учеб.-метод. пособие
[Электронный ресурс] / сост. Л.А. Новопашина. – Электрон. дан. –
Красноярск: Сиб. федер. ун-т, 2013. – Систем. требования: PC не ниже
класса Pentium I; 128 Mb RAM; Windows 98/XP/7; Adobe Reader V8.0 и
выше. – Загл. с экрана.
Учебно-методическое пособие содержит краткий конспект лекций в соответствии с
ФГОС ВПО РФ по изучению материала курса «Статистические методы в психологии».
Пособие содержит краткий конспект лекций для самостоятельного изучения студента,
включен библиографический список, предлагаемый студенту для самостоятельного изучения.
Предназначено для магистрантов, проходящих обучение по направлению 030300
«Психология».
УДК 159.9.01(07)
ББК 88.3я73
© Сибирский
федеральный
университет, 2013
Учебное издание
Подготовлено к публикации Издательским центром
БИК СФУ
Подписано в свет 17.06.2013 г. Заказ 1284.
Тиражируется на машиночитаемых носителях.
Издательский центр
Библиотечно-издательского комплекса
Сибирского федерального университета
660041, г. Красноярск, пр. Свободный, 79
Тел/факс (391) 206-21-49. E-mail [email protected]
http://rio.sfu-kras.ru
2
Оглавление
Лекция 1. Психология как наука……………………………………………………….4
Лекция 2. Основы статистического вывода ……………………………………………8
Понятие вероятности……………………………………………………………….10
Нормальное распределение………………………………………………………....12
Свойства нормального распределения……………………………………………....14
Стандартное отклонение и нормальное распределение……………………………..15
Виды статистических гипотез………………………………………………………16
Понятие статистическая значимость………………………………………………...21
Выборочное значение и таблицы критических значений…………………………....23
Типы ошибок при принятии решений……………………………………………....24
Библиографический список………………………………………………………...39
Приложение………………………………………………………………………...40
3
Психология как наука
Аристотель, как известно, написал книгу «О душе», которую многие
историки считают первой психологической работой. В ней мы находим попытку
систематизации представлений древних греков о душе, о ее связи с телом и о
различных видах познавательных и эмоциональных процессов.
Тем не менее, и Платон, и Аристотель, и их ученики, и последователи
были весьма далеки от научного познания, в современном смысле слова. И дело
даже не в том, что не были еше разработаны специфические методы
объективного познания, а в том, что в те времена даже ж ставились вопросы о
степени точности и достоверности человеческого опыта, которые только и могли
привести к созданию науки и научного аппарата. В свою очередь вопрос об
эмпирической достоверности ведет к пониманию роли мер и самого процесса
измерения, что становится актуально лишь в связи с развитием мореходства,
промышленности и военной техники.
Долгие века (более двух тысячелетий) идеи о душе оставались
прерогативой философов. Последние же просто не считали необходимым и
достойным заниматься эмпирической проверкой этих идей, ибо их интересовали
не реальные и конкретные психические процессы, а свойства души как таковой
или человеческого мышления как такового. То есть не реальные процессы, а их
обобщенные абстрактные модели, такие как «Способности чистого разума у И.
Канта, «Трактате человеческой природе» Д. Юма или «О страстях* Р. Декарта.
Психология начала превращаться в науку лишь в XIX веке, когда физиолог
Эрнест Вебер провел свои опыты по изучению едва заметных различий в
ощущениях, а его последователь — врач и физик Густав Фехнер в попытках
дать объективное описание идентичности души и тела вслед за Вебером
разработал первые, достаточно строгие экспериментальные методы измерения
разностных и абсолютных порогов ощущения и создал свои знаменитые
«Основы психофизики», увидевшие свет в 1860 году. То, что первый раздел
научной психологии получил именно такое название, вполне закономерно.
Физика в XIX веке обрела статус доминирующей науки, которая не только
обросла мощным методическим арсеналом, но и стала реальным двигателем
технического прогресса. Естественно, что именно физика явилась образцом
подражания для исследований и в других науках, в том числе и для физиологии
— науки, выросшей в XVIII— XIX веках на базе освобожденной от церковных
ограничений медицинской практики.
Не случайно то, что именно физиологические исследования привели Е.
Геринга и Г. Гельмгольца к ряду открытий, в том числе и в области психологии
восприятия цвета, а открытие И. Павловым механизма выработки условных
рефлексов дало начало развитию наиболее влиятельной в XX веке школы
бихевиоризма. Можно сказать, что психология как научная дисциплина выросла
именно на стыке философии, пытающейся понять устройство психики человека,
4
и физиологии как эмпирической дисциплины. Иван Сеченов в своей работе
«Кому и как разрабатывать психологию?» отвечал прямо — только физиологам,
то есть исследователям, использующим эмпирические, экспериментальные
методы в изучении психических явлений.
Г. Фехнер считал себя еще не столько психологом, сколько
философствующим физиком и физиологом, а общепризнанный основатель
научной психологии Вильгельм Вундт, который начинал свою научную карьеру
в качестве ассистента физиологической лаборатории Г. Гельмгольца, назвал
свой самый популярный (вплоть до 20-х годов XX века) учебник психологии —
«Основы физиологической психологии». Тем самым подчеркивая отличие этой
новой эмпирической науки от традиционной «понимающей психологии» (В.
Дильтей). Вплоть до начала XX века психология еще продолжала
ассоциироваться с философией и «пониманием» человеческого поведения (то
есть люди, занимавшиеся психологией, должны были лишь умозрительно
размышлять и рассуждать о свойствах человеческой души), в то время как
физиология в то же время уже была признанной научной дисциплиной. взявшей
на вооружение экспериментальный метод.
На заре эмпирической психологии изучались, прежде всего, простые
реакции индивида на физические стимулы. В частности, Фехнер ставил своей
задачей
экспериментально
установить
объективную
связь
между
интенсивностью воздействующих на человека физических раздражителей и
интенсивностью возникающих ощущений. Вундт изучал чувственное
восприятие в лаборатории Гельмгольца и продолжил эти исследования уже в
собственной психологической лаборатории опираясь на базу эмпирических
работ Вебера и Фехнера.
Лишь позже, в результате создания Вундтом в 1879 году при Лейпцигском
университете лаборатории, а затем и института экспериментальной психологии,
расширился круг изучаемых явлений и методов исследования, а также было
создано (в том числе и самим Вундтом) значительное число приборов для
проведения психологических экспериментов. В этом институте впервые в
мировой практике появился штат платных сотрудников-психологов и огромное
количество внештатных сотрудников со всех концов света: из Японии, Дании,
США, Великобритании, Бельгии, России и многих других стран (Рамуль, 1974).
Именно они способствовали развитию психологии не только в Германии, но и в
мире в целом.
Впрочем сам Вундт, как и его немецкий коллега Вильгельм Дильтей, до
конца жизни считал, что надо различать две науки: объяснительную психологию
физиологического (экспериментального) характера с точными измерениями и
описательно-аналитическую психологию, сходную с другими социальноЭрнест Вебер (1795— 1878) и б) Густав Фехнер (1801 — 1887) — пионеры
научной психологии — создатели школы экспериментальной психологии
ошушений в Лейпциге; в) Вильгельм Вундт (1832—1920) — создатель первой
лаборатории и института экспериментальной психологии вЛейпииге.
5
гуманитарным науками. Параллельное построением новой экспериментальной
науки, включая и разработку специальной психологической аппаратуры для
точных измерений, Вундт 20 последних лет своей жизни создавал
фундаментальный труд — «Психологию народов» в 10-ти томах, который
представляет собой описание и анализ психологических особенностей разных
народов на основе изучения их фольклора. Однако своих учеников и соратников
он приобщал лишь к первой, экспериментальной науке, что оказало весьма
благоприятное влияние на последующее развитие мировой психологии.
Как известно, российские психологи, прошедшие подготовку в институте
Вундта, затем внесли значительный вклад в развитие психологии в России. Так,
Бехтерев создал первую в России психофизиологическую лабораторию при
Казанском университете и целый ряд научных центров в Санкт-Петербурге,
Ланге — кафедру и лабораторию в Новороссийском (затем — Одесском)
университете, Челпанов «Психологический семинарий», а затем на его базе
первый в России научно-исследовательский и учебный психологический
институт при Московском университете, а Узнадзе — институт психологии при
Тбилисском университете.
В конце XIX века появились первые специализированные журналы по
психологии в Германии, Англии и США, которые поначалу назывались
философскими. Но очень скоро, по мере расширения профессионального
научного сообщества психологов, философские или физиологические ярлыки
были сняты и заменены на психологические, чему немало способствовала
научная школа Вундта и ее «выпускники».
В XIX и начале XX века психологи стремились к признанию статуса
психологии как самостоятельной научной дисциплины, равноценной и
равноправной с такими «старыми» и зарекомендовавшими себя науками, как
химия и физика. Одним из необходимых условий такого признания была
разработка объективного инструментария — создание таких методов, которые
позволяют получать новое знание с известной степенью объективности и
достоверности, то есть в обязательном порядке используют единообразное
измерение психических явлений и количественный анализ его результатов. На
этом пути психология достигла значительных успехов. Многие разработанные
психологами технологии измерения и количественного анализа полученных
данных, которые будут далее описаны в этой книге, стали затем применяться во
всех остальных социальных и гуманитарных науках.
Конечно, предмет изучения психологии является гораздо более сложным и
динамичным, по сравнению с физикой или химией. И вполне естественно, что
степень доступной точности измерения в психологии всегда будет ниже, чем в
этих и подобных им науках. Однако общие требования объективной проверки,
разработки и использования методов в соответствии со стандартными и
полностью прописанными технологиями, стали обязательными и для
психологии.
6
Даже краткий анализ истории возникновения психологии как
самостоятельной науки позволяет сформулировать ее задачи: объективное
изучение, описание и объяснение того, как люди понимают себя и окружающий
мир и как, соответственно этому пониманию, они ведут себя. В свою очередь,
исследование животных позволяет понять биологические основы поведения и
дать сравнительный а нал и i pa тык уровней психической регуляции поведения.
В свою очередь, для того чтобы решать эти задачи и быть надежным
«поводырем* общества, психологическая наука должна использовать такие
инструменты, которые будут гарантировать точную и объективную картину
сущности поведения и сознания людей. Именно базовые, наиболее общие
требования, предъявляемые к этим инструментам, будут изложены в
последующих главах.
Резюме
Наука, в отличие от философии, возникает на том этапе развития
общества, когда появляется потребность в точных измерениях и использовании
этих измерений для создания более эффективных и унифицированных
технологий. Не столько упорядочивание и систематизация опыта, с чем
справлялась философская и гуманитарная мысль, сколько описание и
объяснение сути вещей и явлений на основе эмпирического изучения и
измерения
потребовало
появления
нового
внеконфессионального,
вненационального социального института — науки, которая изначально
направлена на получение как можно более точного, объективного знания.
Первой наукой становится механика, на основе которой вырастает астрономия,
химия, физика и прикладная математика.
Психология, как и ряд других социальных наук, вслед за физиологией
начинает в середине XIX века превращаться в эмпирическую научную
дисциплину, основанную на объективных методах познания психических
явлений, сначала достаточно простых, но затем все более сложных. Параллельно
с развитием предмета и методов изучения в конце XIX — начале XX века
происходит бурное развитие инфраструктуры психологии (учреждений,
аппаратуры, журналов, конференций и др.), в результате чего психология
приобретает все основные характеристики науки и научного исследования и
соответствующий общественный статус.
7
ОСНОВЫ СТАТИСТИЧЕСКОГО ВЫВОДА
Для чего нужен статистический вывод?
Психологи, почти всегда хотят узнать нечто большее, чем просто меру
центральной тенденции или меру разброса имеющегося набора данных. Они
собирают числовые данные для описания и изучения психических процессов,
недоступных непосредственному объективному измерению. Следовательно,
психологов интересуют не числа как таковые, а та информация о психических
процессах, которая может содержаться в этих данных, то есть их интересует, что
значат эти числа для понимания особенностей психических процессов и свойств.
И если для ответа на вопрос «каковы эти данные?» нам может быть достаточно и
описательной статистики, то для ответа на вопрос «что эти данные могут
значить?» требуется совсем иной подход.
Для реализации такого подхода и были созданы методы выводной
статистики, или статистического вывода, которые позволяют нам перейти
отданных по конкретным участникам к обобщениям о процессах и явлениях,
распространенных далеко за пределами использованной выборки. В противном
случае, никаких обобщений о фактическом положении вещей делать нельзя.
Что такое статистический вывод?
Можно определить вывод как выведение заключения на основе некоторых
данных или информации, из чего следует, что статистические выводы являются
процедурами, которые могут быть использованы исследователями для
выведения заключений из полученных результатов. Уже поверхностный
лингвистический анализ ключевого слова «вывод» указывает нам на
необходимость выхода за рамки данных об использованной выборке. По
существу, психологам приходится отвечать на два общих вопроса о значении
данных, ответы на которые требуют использования статистического вывода.
Первый из них относится к взаимоотношениям между одиночной
выборкой данных (любой величины) и «материнской» популяцией. Если
использованная выборка рассматривается как несовершенное представление
популяции, то возникает вопрос о том, возможно ли использовать информацию
по выборке для оценки параметра, такого, например, как среднее или
стандартное отклонение популяции. Тем самым, принципиально важно,
насколько по среднему, полученному на выборке (или стандартному
отклонению), можно судить об аналогичных параметрах популяции. Это важный
вопрос, ибо он представляет попытку найти более широкое значение
полученных данных и сделать заключение не только об изучаемой выборке, но и
о популяции в целом.
8
Возможно ли это? Вполне возможно с помощью процедуры, называемой в
статистике оценка параметров. Как вы помните, в главе 6 статистические
показатели были определены как значения, вычисленные по выборке, в то время
как параметры представлены в качестве аналогичных значений, но вычисленных
на популяции. Оценка параметров, следовательно, относится к статистическим
процедурам, с помощью которых данные по выборке могут быть использованы
для оценки (ключевое слово) одного или более основополагающих параметров
популяции, что предполагает последовательное применение процедур
статистического вывода в поиске степени достоверности сделанной оценки.
Обратимся теперь ко второму, более широко используемому приложению
методов статистического вывода в исследовании – к статистической проверке
гипотез. Это необходимо в том случае, когда исследователь (чаще всего при
использовании эксперимента в качестве основного метода исследования) хочет
сравнить один набор данных с другим. Так как некоторая степень различий
между наборами данные неизбежно порождается погрешностью выборки, то
возникает вопрос о том, действительно ли представленные наборы настолько
отличны друг от друга, что это различие не может быть отнесено к результату
случайных влияний, а вызывается именно условиями эксперимента, заданными
исследователем.
Обычно вопрос о различиях ставится в форме ясно сформулированных
гипотез, выдвижение которых является частью формальной структуры
исследования. Поскольку собраны определенные данные, такие гипотезы
должны быть проверены, и именно здесь статистический вывод играет
решающую роль.
Понятно, что одно дело — провести эксперимент и собрать данные, и
другое — определить, какой ответ эксперимент дает на ваш исследовательский
вопрос и подтверждается ли выдвинутая гипотеза. Без четких процедур
определения, действительно ли независимая переменная реально оказывает
влияние на зависимую переменную в том направлении, в котором и
предполагалось, мы рискуем остаться с данными, значение которых непонятно.
Только статистический вывод обеспечивает однозначное определение значения
полученных данных.
Существует два основных приложения теории статистического вывода в
психологии — оценка параметров и проверка гипотез. Однако необходимо
подчеркнуть, что оба приложения исходят из одного обстоятельства: данные,
полученные на основе приложения конкретного исследовательского метода,
представляют выборку из популяции, и понятно, что именно популяция, а не
выборка, интересует исследователя.^
Естественно возникает вопрос: каким образом процедуры вывода могут
обеспечить достоверные ответы на вопросы о параметрах популяции и
гипотезах? Ответ, или, по меньшей мере, его весомая часть основывается на
понятии случайной выборки. Вся теория статистического вывода основана на
9
математических моделях, включающих допущение о том, что выборка, на
которой собраны данные, получена из популяции на основе процедуры
случайного выбора. В той мере, в какой это фундаментальное допущение
соблюдается, выводные статистики могут использоваться достаточно просто при
получении выводов из данных. С другой стороны, если выборка не носит
случайного характера, то задачи принятия решения относительно гипотез или
оценки параметров популяции становятся гораздо более проблематичными и их
решение предполагает техники, выходящие за пределы базового
методологического аппарата, и в данном пособии такие техники не
рассматриваются.
Причина того, почему допущение о случайном характере выборки
является столь важным для процессов вывода, лежит в математической теории
выбора. В XIX веке было обнаружено, что при случайном характере создания
выборки, отношение между параметром популяции, таким как среднее
популяции, и всеми возможными средними по выборкам из данной популяции
может быть выражено в виде математической формулы, то есть точно
вычислено. Впоследствии это открытие обеспечило основу для разработки
различных статистических тестов, часть из которых будет описана в данном
пособии.
Прежде чем перейти к статистическим процедурам, необходимо раскрыть
ряд ключевых понятий, позволяющих понять принципы этих статистик, а
именно, понятия вероятности, возможности, а также идеи распределения вообще
и нормального распределения, в частности.
Понятие вероятности
Вероятность
Можно говорить о градиенте (степени) предсказуемости в наступлении
определенных событий, начиная от событий, о которых мы знаем, что они
наверняка произойдут (таких как смерть и ночь), далее переходя к событиям, о
которых мы можем сказать, что они, скорее всего, произойдут (старость или
раздражение), и затем к событиям, появление которых все более маловероятно,
вплоть до событий, появление которых практически исключено, таких как
турпоездки на летающих тарелках или победа сборной Латвии в чемпионате
мира по футболу.
Этот континуум вероятностей наступления всевозможных событий – от
событий, наступление которых совершенно неизбежно, до событий, которые с
такой же неизбежностью не наступят, – можно представить в виде
количественной шкалы. Это позволяет, во-первых, точно отобразить
информацию о том, что появление одних событий вероятнее, чем других. и, вовторых, определить значение вероятности того или иного события. Таким
образом, событиям, которые неизбежно произойдут, присваивается вероятность
10
появления 1 (р=1,0), а тем, которые лежат на другом конце континуума и точно
не произойдут, присваивается вероятность появления 0 (р=0,0). Все
промежуточные события, о которых нельзя сказать ни то, ни другое,
располагаются на шкале значений между 0 и 1 с величиной значения,
отражающей степень обоснованной уверенности в том, что данное событие
наступит. Естественно, что вероятные события будут обладать и более высокими
значениями вероятности. Так событие с вероятностью 0,5 обладает шансом
появиться 50:50, в то время как событие с вероятностью 0,001 обладает шансом
появиться только в одном случае из 1000.
Данный порядок присвоения вероятности позволяет выразить с любой
требуемой степенью точности вероятность появления любого события,
независимо от того, насколько неопределенным является данное событие само
по себе. Единственное условие, конечно, заключается в наличии достаточной
информации для вычисления это вероятности. Например, в тираже 2 000 000
лотерейных билетов лишь один билет обеспечивает выигрыш главного приза.
Если вы покупаете вместо одного 20 лотерейных билетов, рассчитывая
увеличить вероятность выигрыша, то вам надо отдавать себе отчет, что тем
самым вы лиш меняете его вероятность с 0,0000005 до 0,00001, что тоже
является крайне ничтожным значением (гораздо меньшим, чем вероятность
встречи голливудской звезды на улицах родного города)
В статистике ключевым для оценки вероятности является понятие
«нормального распределения», что и будет обсуждаться далее. Однако, прежде
чем перейти к этому, необходимо остановиться на понятии возможности,
которое часто не отличают от вероятности.
Возможность
Данное понятие тесно связано с понятием вероятности и часто
используется как синоним. И хотя оно, так же как и понятие вероятности,
является ключевым в статистике, их надо различать. Различие это заключается в
следующем. Как было видно, вероятность события относится к конкретной
степени предсказуемости некоего конкретного события, каким бы отдаленным
это событие ни было. Возможность же относится к самому фактору случайности,
то есть факту случайного влияния на события неизвестных или непредсказуемых
факторов, что выражается в появлении одного события чаще, чем другого.
Например, представим себе коробку, в которой лежит одинаковое число
белых и черных шаров. Если мы закроем глаза и будем выбирать шар наугад, то
вероятность того, что мы выберем белый шар, будет равна вероятности того, что
мы выберем черный. Вероятности обоих событий будут равны р=0.50.
Однако, если ваши глаза закрыты, то есть вы не можете совершать
осознанный выбор, что влияет на то, какой вы шар выберете? Только
случайность, то есть возможность выбора или одного или другого варианта.
11
Если оба возможных результата исходно одинаково вероятны и ваш выбор
абсолютно не направлен, то только возможность (или случайность) будет влиять
на результат, как это происходит при кидании монеты.
Таким образом, если вероятность оценивает предсказуемость какого-то
конкретного результата из полного диапазона событий, которые могут
произойти, то возможность обеспечивает описание того, в связи с чем
происходит именно данное событие из диапазона одинаково допустимых
событий. Это объясняет; почему иногда в статистике мы связываем два понятия
и говорим о вероятности появления какого-либо явления по возможности (как
например, вероятность р=0.05 получения данного результата в эксперименте не
под воздействием изучаемой закономерности, а только по случайности). Говоря
это, мы просто присваиваем числовое значение вероятности того, что данное
событие является результатом случайного (ненаправленного) влияния.
Сравнительные границы вероятности
(больше или меньше, чем...)
В психологии часто возникает необходимость выразить некоторое
представление или закономерность не столько точной вероятностью, сколько
вероятностью, которая меньше или больше какого-либо эталонного уровня.
Например, очень часто в психологии необходимо соотнестись с вероятностью,
которая меньше, чем р=0.05, хотя и невозможно определить, насколько меньше.
Эго может быть сделано с использованием знака < (символ «меньше чем») или >
(символ «больше чем») как отдельно, так и в комбинации со знаком = (≥) для
выражение представления «больше чем или равно» или соответственно ≤ для
выражения представления «меньше чем или равно». Используя эти символы, мы
можем выразить представление о том, например, что вероятность некоторого
события меньше, чем 1 из 100, обозначая это как р<0,01. Надо учитывать,
однако, что выражение вероятности в такой форме представляет всего лишь
отметку границы континуума вероятностей, оставляющую вопрос о точном
значении вероятности открытым. В связи с этим, , после раскрытия понятия
вероятности, можно будет вернуться к этому моменту, в связи с понятиями
«уровень значимости» » и «зона отвержения».
Нормальное распределение
Понятие «нормальное распределение»
Распределение в статистике, как уже было отмечено, относится к любому
набору значений или показателей данных, которые организованы так, что это
позволяет видеть «форму» этого набора данных. В главе 6 был описан полезный
подход к конструированию распределения путем подсчитывания количества
появлений каждого значения переменной в наборе данных и использование этой
12
информации для построения распределения, обозначенного как гистограмма или
распределение частот.
Представление о распределении частот обеспечивает основу для важного
теоретического распределения, называемого нормальным. До начала более
детального анализа чрезвычайно полезного и интригующего свойства
нормальности необходимо остановиться на том, чем это понятие так важно для
нас. Во-первых, распределение большого числа переменных в реальности, как
будет показано далее, очень близко к форме этого распределения. Например,
распределение показателей роста людей, будучи изображением данных на
достаточно большой выборке, приближается по своей форме к нормальному
распределению. А также (хотя это не может быть проверено с абсолютной
точностью в силу трудностей измерения) это скорее всего справедливо и для
измерения
психологических
переменных,
таких
как
показатели
интеллектуальных тестов или времени реакции.
Опыт исследовательской работы говорит о том, что понятие нормального
распределения обеспечивает нас мощным средством описания распределения
многих переменных в реальных условиях. Причина того, что мы говорим о
«приближении к» или «сходстве с» нормальным распределением, а не о
совпадении, заключается в том, что нормальное распределение описывает очень
большую популяцию и его свойства установлены на основе статистической
теории.
При сборе «реальных данных неизбежно используется лишь выборка из
этой популяции. Следовательно, даже когда значения в популяции могут быть
совершенно нормально распределены, распределение выборки только
приближается к нормальному. На близость распределения выборки к
теоретической модели влияют, кроме других факторов, размер и характер
процедуры составления выборки. Так, чем больше ее размер, тем больше
приближение к базовому распределению (то есть распределению, имеющему
место в «материнской» популяции), так как выше вероятность того, что в
выборку будет полностью включен репрезентативный набор всех значений
переменной.
Вторая причина важности нормального распределения представляется
гораздо более технической, но не менее интересной. В той мере, в какой
выдержана процедура случайного составления выборки и выборка достаточно
большая, и показатели в выборке включают влияние разнообразных источников
случайной ошибки, распределение данных по выборке будет приближаться к
нормальному при увеличении объема выборки. Более того, чем больше размер
выборки, тем ближе распределение к нормальному.
Этот факт, наряду с другими, обеспечивает основу техники оценки
параметров, которая будет рассмотрена ниже. Именно этим объясняется
большой интерес психологов к нормальному распределению, ибо их данные
13
собраны зачастую из популяции, характеристики которой известны лишь
частично.
В-третьих, уникальные свойства нормального распределения означают,
что оно дает реальный способ приписывания вероятностей значениям
переменной, так, что взаимоотношения между данными по выборке и ее
«материнской» популяции могут быть ясно выражены. Здесь, как мы видим,
достигается нечто очень важное для психологов, ибо очень редко психолог
может добраться до всех представителей популяции интереса.
Свойства нормального распределения
Надо иметь в виду, что нормальное распределение является чисто
теоретическим распределением, полученным нанесением теоретически
полученных вероятностей (а не «реальных», полученных на выборке) на
протяжении всего диапазона возможных значений от + бесконечности добесконечности вдоль горизонтальной оси X . В результате мы получаем график,
имеющий фамильные черты сходства с симметричным колоколом.
Как скоро будет видно, нормальное распределение представляет по сути
целую семью распределений. Однако каждое и любое нормальное
распределение независимо от его точной формы, всегда обладает следующими
четырьмя свойствами, два из которых (1 и 3) вы можете легко увидеть на
рисунке. Нормальное распределение является абсолютно симметричным
относительно его среднего значения, которое, следовательно, разделяет зону под
кривой на две равные части.
Среднее, медиана и мода нормального распределения равны друг другу.
Арифметическое среднее равно центральному значению распределения
(медиане), которое, в свою очередь, равно наиболее часто появляющемуся
значению в данном наборе.
Хвосты распределения распространяются в обе стороны, достигая касания
оси X лишь в бесконечности. Это значит, что их надо понимать как уходящих в
бесконечность, приближаясь все ближе и ближе к абсциссе, но не касаясь ее,
хотя, конечно, это невозможно изобразить на графике.
Вся площадь под кривой представляет одну единицу, то есть эта область
включает все возможные значения, которые данная переменная может
принимать. Следовательно, эта область может быть точно разделена, и любые
данные пропорции всей области (такие как 5%, 10%, 50%) могут быть
использованы как утверждение вероятности (р=0,05, р=0,1 или р=0,5), чей
показатель значения, как легко заметить, лежит внутри области кривой.
В то же время есть еще одна «семейная» черта любого нормального
распределения, обеспечивающая основу определения вероятностей в выводной
статистике. Она возникает из взаимодействия между формой нормального
распределения и стандартным отклонением данных, которые оно представляет.
14
Стандартное отклонение и нормальное распределение
Абсцисса нормального распределения представляет первичные значения
переменной, со средним, медианой и модой, занимающими центральное
положение на шкале. Однако, абсцисса нормального распределения может быть
также размечена в единицах стандартного отклонения, каждая из которых равна
некоему числу единиц первичных данных. Так, на распределении со средним
100 и стандартным отклонением в 15 единиц первичных значений переменной,
одна единица стандартного отклонения приравнивается 15 единицам первичных
данных, соответственно две единицы стандартного отклонения приравниваются
30 единицам первичных данных и т.д. Это будет проиллюстрировано ниже, где
абсцисса нормального распределения представляет разметку как в единицах
стандартного отклонения от среднего, так и в единицах первичных значений
переменной.
Взаимоотношение между первичными значениями переменной и
стандартным отклонением данных в нормальном распределении, в свою
очередь, имеет большое значение. Если абсцисса нормального распределения
размечена в единицах стандартного отклонения (так называемый z-показатель),
мы скорее, чем когда абсцисса размечена в единицах первичных данных,
обнаруживаем, что любая данная плоскость под кривой (то есть область между
кривой графика и любыми двумя точками на абсциссе) может быть просто
определена с использованием z-показателя.
Еще более полезной и важной чертой является то, что данная площадь под
кривой между двумя любыми точками на абсциссе всегда остается той же при
переходе от одного нормального распределения к другому, независимо от
конкретной формы этого нормального распределения. Эти площади под кривой
изображены на графике, который изображает нормальное распределение, с
различными областями под кривой, обозначенными точками на абсциссе в
приросте одной единицы z-показателя (стандартное отклонение – 8) выше и
ниже среднего (рис. 24).
Нормальное распределение с осью абсцисс (Х), размеченной как в
единицах первичных данных, так и в единицах стандартного отклонения
Площадь под кривой нормального распределения может быть разделена на
фиксированные и прогнозируемые пропорции в отношении к z- показателю на
абсциссе. Так, область, лежащая от 1 z-показателя ниже среднего и 1 zпоказателя выше среднего представляет, как показано на графике, 68,26%
(2x34,13%) всей площади под кривой, и это справедливо не только для данного
конкретного нормального распределения, но также и для любого другого,
независимо от его конкретной формы. Подобно этому, область лежащая между
двумя единицами стандартного отклонения ниже и выше среднего (от zпоказателя -2 до +2) будет всегда содержать 95,44% [2х(34,13% + 13,59%)] всей
площади и оставшиеся 4,56% (2x2,28%) будут всегда лежать на крайних
15
внешних концах кривой, соответственно за -2 и +2 значениями z-показателя от
среднего.
По графику, однако, остается неясным, можно ли использовать только
площади под кривой, ограниченные только любыми целыми числами на
абсциссе. Фактически, может быть определена область между любыми
промежуточными значениями стандартного отклонения, путем поиска
требуемого значения из таблиц.
Тот факт, что взаимоотношение между единицами стандартного
отклонения и соответствующими пропорциями площади под кривой является
общим
свойством
нормального
распределения,
делает
нормальное
распределение весьма эффективным инструментом количественного анализа
данных. Поскольку, как мы только что видели, различные пропорции площади
под кривой могут быть найдены по отношению к шкале единиц стандартного
отклонения на абсциссе, и шкала одинакова для любого нормального
распределения, то, имея данные о значениях среднего и стандартного
отклонения распределения, можно сказать, какая площадь под кривой лежит
между любыми двумя значениями z-показателя.
Это не столь интересно само по себе, но позволяет сделать следующий
очень важный шаг. Если мы знаем пропорциональную долю под кривой, то при
оценке параметров у нас появляется возможность найти вероятности различных
значений в распределении. Таким образом, можно сказать, насколько вероятно
достижение любого данного значения показателя в имеющемся распределении.
Обратимся к заключительному свойству нормального распределения. Два
различных по форме нормальных распределения могут различаться между собой
только в двух достаточно ограниченных аспектах:
1) они могут различаться по своему значению среднего, что отражается в
их положении на абсциссе;
2) они могут различаться по своему значению стандартного отклонения,
что отражается в их ширине и высоте, ибо, как мы уже знаем, площадь под
кривой фиксирована по отношению к величине стандартного отклонения, что
означает соответствующее изменение высоты при любом изменении ширины.
Несмотря на их различную форму значений стандартного отклонения, все
они обладают всеми описанными выше одинаковыми свойствами нормального
распределения. Далее мы перейдем к рассмотрению второй функции
статистического вывода, упомянутой выше. Речь идет о решении чрезвычайно
важной задачи проверки гипотез, также основанной на уже известных нам
свойствах нормального распределения.
Виды статистических гипотез
Для обеспечения процесса принятия обоснованного решения до начала
сбора данных формулируются две взаимосвязанные гипотезы. Эти гипотезы
16
обычно называются нулевой и альтернативной (или экспериментальной, если
проводимое исследование действительно является экспериментом), и их
функция заключается в том, чтобы выражать точно и ясно альтернативные
предположения о различиях или связях между параметрами поведения членов
популяции, из которой производилась выборка.
Тем самым, именно принятие решения о популяции в целом (что является
конечной целью любого исследования) требует возможности проверки и
вынесения заключения о том, что обнаружение различия между средними
показателей по выборке означает наличие такого же различия в популяции. Как
мы видим, два возможных вывода могут быть сделаны при сравнении оценки
параметров в двух различных условиях эксперимента: являются эти параметры
одинаковыми или разными. В первом случае подтверждается нулевая гипотеза,
во втором экспериментальная.
Рассмотрим эти гипотезы более подробно.
Нулевая гипотеза
Нулевая гипотеза всегда утверждает, что между значениями параметров
популяции нет различий или устойчивых связей. Очень часто, особенно в случае
эксперимента, оцениваемым параметром может быть значение средней или
медианы переменной. Нулевая гипотеза в этом случае будет утверждать, что нет
различия между средними (или медианами) переменной в разных (по своим
условиям) выборках популяции.
Однако, сравнение между средними или медианами популяции является
только одной из многих возможностей. Другие задачи и методы сбора данных
могут означать, что в гипотезе необходимо сравнение других параметров, и в
этом случае нулевая гипотеза также должна выражать предположение об
отсутствии различий (кроме чисто случайных). Например, нулевая гипотеза в
корреляционном исследовании предполагает, что коэффициент корреляции по
популяции существенно не отличается от нуля. Если, с другой стороны,
рассматривается χ2-тест точного попадания (см. главу 8), нулевая гипотеза
должна выражать предположение об отсутствии различий между полученным в
результате исследования распределением частот в популяции и тем
распределением частот, которое предполагается в теории вероятности при
действии лишь случайных факторов. Какая бы статистическая процедура не
использовалась, нулевая гипотеза должна всегда выражать предположение об
отсутствии устойчивых, неслучайных различий или связей.
Альтернативная (экспериментальная) гипотеза
Экспериментальная (альтернативная) гипотеза называется так потому, что
обеспечивает строгую альтернативу нулевой гипотезе, утверждая наличие
существенного (то есть необъяснимого лишь случайными факторами) различия
17
или связи. Она утверждает нечто, прямо противоположное нулевой гипотезе, то
есть существование неслучайного различия или связи между параметрами двух
(или большего числа) переменных популяции.
При корректном выражении нулевой гипотезы, альтернативная гипотеза
также будет, скорее всего, выражена корректно. Рассмотрим это на примере. Как
указывалось, в проводимом корреляционном исследовании, соответствующая
нулевая гипотеза утверждает, что нет различий между коэффициентом
корреляции по популяции и нулевым коэффициентом. Как следует из
вышесказанного, альтернативная гипотеза утверждает, что такое различие
между коэффициентом корреляции по популяции и нулевым коэффициентом
существует и его нельзя объяснить лишь случайными факторами. Тот же
принцип реализуется при сочетании всех других альтернативных и нулевых
гипотез.
Таким образом, понятно, что статистические гипотезы всегда
представлены парами — одна нулевая и одна альтернативная — и дают очень
точный и однозначный прогноз о значениях параметров популяции, который
может быть позже проверен, используя реальные данные, полученные в
исследовании. Следовательно, обе гипотезы должны быть сформулированы
очень тщательно, чтобы было возможно вполне определенно сказать, какая из
них подтверждается данными исследования, а какая — нет.
В качестве образцов формулирования таких гипотез, обратимся к
конкретным исследованиям. Предположим, что вы создаете экспериментальный
межсубъектный дизайн, цель которого — выяснить связь между успешностью
подростков в выполнении экспериментальных заданий и самоуважением. В этом
случае, независимая переменная – успех или неудача в выполнении задания (в
целях определенности результатов, будем считать любое неубедительное
выполнение неудачей), а зависимая переменная — уровень самоуважения
участников, измеряемый соответствующим психологическом тестом или
опросником. Популяция интереса состоит из подростков в возрасте 13—-19 лет.
Гипотезы, соответствующие цели исследования, могут выглядеть следующим
образом.
Альтернативная гипотеза:
Средний уровень самоуважения будет ниже у тех подростков, кто
неудачно выполнил задание эксперимента, по сравнению с теми, кто справился с
данным заданием успешно.
Нулевая гипотеза:
Средний уровень самоуважения как у тех подростков, кто неудачно
выполнил задание эксперимента, так и у тех, кто справился с данным заданием
успешно, не будет существенно различаться (или, что - то же самое, значение
различия между этими уровнями не будет превышать значения случайных
различий).
18
Отметьте, что обе вышеприведенные гипотезы выражены в терминах
переменных, с которыми данный эксперимент непосредственно имеет дело. В
подобных экспериментах обе гипотезы должны четко фиксировать возможное
влияние изменений значения независимой переменной (в данном случае —
успех или неудача в выполнении задания) на зависимую переменную
(самоуважение).
В других видах исследования (таких, например, как наблюдение) сами
гипотезы должны всегда формулироваться по отношению к переменным,
которые затем будут измеряться. Это очень важно, ибо пока это не сделано,
полученные данные не обеспечивают основу проверки гипотез. Вы можете легко
провести вычисления с использованием статистических тестов и принять
решения относительно гипотез, но это будет пустым упражнением, если не
существует известного заранее отношения между данными и гипотезами.
Гипотезы как рамки решения
Альтернативная и нулевая гипотезы являются взаимодополнительными в
том смысле, что они выражают взаимоисключающие возможности (строгая
дизъюнкция), которые не могут быть верны обе. Верной может быть только и
исключительно лишь одна из них.
Однако важно учитывать, что эти гипотезы проверяются неодинаково
Обычно начинают с предположения, что верна нулевая гипотеза. Затем
проводится проверка этого предположения. Если результаты эксперимента не
подтверждают эту гипотезу, то ее можно отвергнуть и принять альтернативную.
Однако если нет достаточных оснований для отвержения нулевой гипотезы, то
можно только констатировать, что для отвержения нулевой гипотезы
достаточных оснований у нас нет и, следовательно, альтернативная гипотеза не
может быть принята. Обычно та область на графике распределения значений,
полученных по выборке, которая находится экстремальней критического
значения переменной по выбранному статистическому тесту, называется зоной
отвержения нулевой гипотезы или просто областью отвержения.
Имейте в виду, что, строго говоря, в данной ситуации не столько
принимается нулевая гипотеза, сколько на основе доступных нам данных
отвергается альтернативная гипотеза. Другими словами, нулевая гипотеза
представляет, по сути, «позицию по умолчанию», к которой мы возвращаемся
тогда, когда не можем найти достаточных оснований для позитивного принятия
альтернативной гипотезы.
Суммируем все сказанное о принятии этих гипотез.
Если, и только если ожидаемое в исследовании событие выражено
достаточно сильно, альтернативная гипотеза может быть принята, а нулевая –
отвергнута.
19
Во всех других случаях (то есть если ожидаемое событие выражено
недостаточно) альтернативная гипотеза не может быть принята, а нулевая
гипотеза не может быть отвергнута.
Это выглядит просто, однако принятие решения усложняется тем фактом,
что разные формы погрешности в данных почти всегда приводят к наличию
некоторых различий в сравниваемых значениях. Краткий просмотр таких
данных может привести к утверждению о принятии альтернативной гипотезы
как верной и отвержению нулевой гипотезы, в то время как по существу данные
не дают истинных оснований для такого решения.
Поясним это на примере. Предположим, что в процессе исследования того,
как разные виды организации текста влияют на понимание, обнаружено, что
способность понимать текст значимо не различается при двух изучаемых
способах организации информации. Статистический тест указывает на то, что
различие между данными является настолько малым (не отличимым от
случайного влияния), что его вряд ли можно отнести к влиянию
экспериментального условия. Исследователь заключает, что нет достаточных
оснований отвергнуть нулевую гипотезу (что нет различий в способности
понимания при двух разных видах организации текста), и альтернативная
гипотеза не может быть принята.
Дело в том, что нулевая гипотеза не отвергается даже тогда, когда
существует некоторая степень различий между данными в двух условиях. Даже
если таковое различие имеется, но не является настолько большим, чтобы
оправдать принятие альтернативной гипотезы, нулевая гипотеза не может быть
отвергнута.
Вы уже, вероятно, заметили, что мы несколько изменили форму вопроса.
обращаемого к данным исследования. Вместо того, чтобы просто отвечать на
вопрос, есть ли различия в данных (обозначающих различие между
параметрами), мы задаем вопрос о том, настолько ли эти различия велики для
оправданного отвержения нулевой гипотезы (и, соответственно, для
обоснованного решения о принятии альтернативной гипотезы). Если ответ
положительный, то мы можем принять альтернативную гипотезу и отвергнуть
нулевую, если ответ отрицательный, то мы не можем отвергнуть нулевую
гипотезу на основе различий, не превосходящих те, которые могут ожидаться
лишь на основе случайных влияний.
Здесь мы сталкиваемся с проблемой. Так как надо принять решение о
гипотезах, рассматривая лишь величину различий, а не их наличие или
отсутствие, нам надо обладать критерием, на основании которого можно было
бы принять такое решение. Необходим способ, дающий возможность принять
решение о том, что данное различие является достаточно большим для того,
чтобы обоснованно принять альтернативную гипотезу. Это важное соображение,
ибо величина различия как таковая не обязательно будет хорошим ориентиром
для ее принятия. Даже достаточно большая разница между двумя наборами
20
данных может быть обусловлена действием случайных факторов, но, будучи
«принята за чистую монету», может привести к принятию альтернативной
гипотезы, в то время как скорее верна нулевая.
Способом разрешения данной проблемы, обеспечивающим необходимый
стандарт объективной процедуры, является приложение понятия вероятности в
форме «уровня значимости» к процессу принятия решения. Это делает процесс
принятия решения частью процедуры использования статистических тестов, что
делает это решение истинно значимым, хотя и не мешает рассматривать
принятие решения как отдельный процесс.
Понятие «статическая значимость»
В процессе проверки гипотез оценивается, действительно ли различие
(например, между средними двух выборок) является настолько большим, что
оно не может, на определенном уровне вероятности, возникнуть случайно, а
может быть лишь результатом направленного влияния одной переменной на
другую или результатом их реального различия.
Понятие «статистическая значимость» позволяет сказать, что это различие
столь велико, что оно не может быть объяснено лишь случайными влияниями.
Однако, и этого еще недостаточно. Более полезно для таких утверждений
указание на специфический уровень вероятности, который говорит нам точно,
насколько невозможно отнести это различие лишь к разряду случайных влияний.
Это и называется уровнем значимости.
Уровень значимости является фактором в процессе принятия решения при
использовании
статистических
тестов
и
представляет
выбранную
исследователем точку на шкале вероятности (с диапазоном от 0 до 1), которая
устанавливает степень риска неверного отвержения нулевой гипотезы. Для
любого конкретного теста уровень значимости устанавливает максимально
допустимую вероятность отвержения нулевой гипотезы (в силу того, что
различие в данных достаточно велико), когда она верна по существу и не должна
быть отвергнута.
Предположим, что исследователь решил использовать уровень значимости
р=0,05 для анализа некоторых данных. Это означает, что в данном конкретном
случае исследователь решил, что максимально допустимая вероятность
ошибочного решения о принятии альтернативной гипотезы и отвержении
нулевой гипотезы не может быть выше, чем 5 из 100. Может быть приемлема
любая меньшая вероятность неправильного отвержения нулевой гипотезы (как,
скажем, 4 из 100, р=0,04), но большая вероятность (как, скажем, 6 из 100, р=0,06)
– нет. Уровень значимости устанавливает границу между тем, что является и что
не является приемлемым риском.
Уровень значимости, который используется в любом исследовании, может
теоретически принимать любое значение от 0 до 1. Однако в реальных
21
исследованиях выбираются значения максимально близкие к 0, так как цель
такого выбора заключается в том, чтобы свести к минимуму допустимый риск
неправильного отвержения нулевой гипотезы. Уровни значимости р=0,05 или
р=0,01 являются обычно наиболее популярными в психологических
исследованиях, хотя ученые в других дисциплинах (например, в медицине)
используют в качестве критерия также значения р=0,0001. В то же время, какое
бы значение вероятности для уровня значимости ни выбиралось, его функция
всегда остается одинаковой – указание вероятности неправильного отвержения
нулевой гипотезы.
Принятие решения о гипотезах
Вопрос о принятии решений относительно гипотез можно рассматривать
на двух уровнях анализа. Первый, наиболее общий, обеспечивает описание
структуры процесса, перечисление различных элементов, образующих процесс
принятия решения. Второй уровень анализа заключается в объяснении
ключевых принципов, на которых строится этот процесс. Ниже мы
последовательно рассмотрим процесс принятия решения и на структурном
уровне, и на более глубоком уровне объяснения его принципов.
Выборочное распределение статистического теста
Выборочные распределения с известными характеристиками могут быть
построены не только для таких описательных статистик, как среднее и
стандартное отклонение, но и для любого из статистических тестов. Это значит,
выборочное распределение может быть использовано как для различных
заключений о полученных данных, так и для обеспечения того, чтобы гипотеза,
выдвинутая в соответствии с используемым статистическим тестом, могла быть
проверена. При этом становится очень удобным обсуждение вероятности
обнаружения любого конкретного значения статистики, ибо, как мы видели
ранее, можно перевести понятие площади под кривой в утверждения
вероятности различных значений статистических показателей.
Мы можем не только использовать значения на горизонтальной оси
кривой нормального распределения для определения интервалов и их пропорций
площади под кривой, но и сказать, что те же самые интервалы обладают такой
же вероятностью появления в распределении, как и пропорция площади под
кривой, которую они идентифицируют. Таким образом, например, интервал на
оси X, который представляет верхние 5% площади под кривой (наиболее
крайние 5% справа) также имеет вероятность появления 5% или р=0,05. Другими
словами, можно наметить вероятность любого интервала, связанного со
статистическими показателями (или какой-либо другой переменной),
22
обеспечивая знание
распределении.
того,
где
этот
интервал
расположен
на
данном
Выборочное распределение и таблицы критических значений
Связь между выборочным распределением статистического теста и его
таблицей критических значений является прямой. Каждое использование
таблицы критических значений основано на различных выборочных
распределениях соответствующих статистических тестов, и для любого
заданного уровня значимости табличные значения будут поручены точно из той
же точки на каждом распределении. Таким образом, все, что надо сделать, чтобы
создать таблицу критических значений для уровня значимости р=0,05, это
копировать из каждого выборочного распределения то значение, которое
расположено в точке абсциссы, делящей площадь под кривой в пропорции 95% к
5%. Подобно этому создать таблицу критических значений для уровня
значимости р=0,01 можно набором значений из множества распределений,
расположенных в точке абсциссы, делящей площадь под кривой в пропорции
99% к 1%.
Критические значения статистического теста определяют интервалы,
которые имеют известные значения р. Таким образом, критические значения для
уровня значимости р=0,05 определяют те интервалы из выборочных
распределений статистик, значения в которых заведомо гарантируют
вероятность р≤0.05. Эти значения используются для оценки того, в какой мере
вычисленное по статистическому тесту значение больше или меньше
критического значения, отвечающего выбранному уровню значимости теста.
Как мы увидим ниже, если мы знаем p-значение (то есть критическое
значение) статистического показателя, путем простого сравнения нетрудно
установить — действительно ли вероятность, связанная с любым вычисленным
значением статистического показателя, превосходит критические значения или
уступает им.
Причина различия значений, представленных в таблице, в том, что
выборочные распределения статистических показателей таковы, что различные
размеры выборок (выраженные как степени свободы для некоторых
статистических критериев) производят различные диапазоны значений на
абсциссе. Критическое значение в 5% будет, следовательно, различаться для
разных выборочных распределений статистических показателей.
Суммируя вышесказанное, можно сказать, что, как только исследователь
определился с уровнем значимости и произвел вычисления по статистическому
критерию, оценка полученного значения для возможности принятия решения о
подтверждении гипотезы может быть произведена на основе обращения к
таблице критических значений соответствующего критерия. Для лучшего
понимания логики данного процесса рассмотрим следующий пример.
23
Как выбирать уровень значимости?
Итак, установка уровня значимости определяет степень осторожности, с
которой принимаются решения относительно гипотез. Более высокий уровень
значимости (например, р=0,1, или вероятность 1 из 10) является менее
надежным, чем более низкий уровень значимости (например, р=0,001, или
вероятность 1 из 1000), ибо он предполагает гораздо более высокую вероятность
принятия альтернативной гипотезы в случае, когда на самом деле верна нулевая
гипотеза.
Тем самым, чем ближе к нулю значение уровня значимости, тем меньше
вероятность ошибочного принятия альтернативной гипотезы. Тем не менее надо
понимать, что процесс принятия решения относительно гипотезы с
использованием уровня значимости не может быть полностью гарантирован от
ошибок, и это, к сожалению, обычное явление. Решение о том, принять или
отвергнуть нулевую гипотезу, реально включает вероятность совершения двух
форм ошибок (просчетов), ни одной из которых нельзя полностью избежать.
Типы ошибок (просчетов) при принятии решений
Первый тип ошибок
Первый тип ошибок представляет «ложную позитивную ошибку»,
возникающую при принятии решения отвергнуть нулевую гипотезу, в то время
как на самом деле она деле она не должна быть отвергнута.
Этот тип ошибок в статистике возникает в том случае, когда при верности
нулевой гипотезы результаты статистического теста попадают в зону
отвержения чисто случайным образом. Это, как мы видели, ведет к отвержению
нулевой гипотезы и последующему принятию альтернативной.
Из этого следует, что вероятность совершения ошибок первого типа в
любом конкретном исследовании устанавливается используемым уровнем
значимости. Уровень значимости р=0,05 показывает, что вероятность
совершения погрешностей первого типа (и соответственно, неправильное
отвержение нулевой гипотезы) р=0,05.
Второй тип ошибок
Второй тип ошибок представляет «ложную негативную» ошибку,
возникающую при принятии нулевой гипотезы, в то время как на самом деле она
должна быть отвергнута. Этот тип ошибок в статистике возникает когда при
неверности нулевой гипотезы результаты статистического теста попадают за
пределы зоны отвержения, задаваемой уровнем значимости, чисто случайным
образом.
Причина совершения ошибок второго типа заключается в том, что всякая
попытка исключить вероятность совершения ошибок первого типа путем
24
сведения к более жесткому уровню значимости неизбежно означает также, что
повышается вероятность (например в эксперименте) того, что факт
специфического влияния НП на ЗП (независимая и зависимая переменные) не
будет признан. Таким образом, если вы пытаетесь редуцировать вероятность
совершения погрешностей первого типа снижением используемого уровня
значимости теста с р=0,05 до р=0,01 или до р=0,001, вы тем самым также делаете
более вероятным то, что специфическое, хотя и небольшое различие в данных
будет идентифицировано как относящееся к случайным факторам.
Какая из этих ошибок представляет большее зло?
С точки зрения объективности исследования, «ложная позитивная»
ошибка является более опасной, ибо приводит к установлению наличия
устойчивой связи между переменными предполагаемой альтернативной
гипотезы, в то время как на самом деле ее нет. Более того, так как существует
предпочтение сообщения позитивных результатов в литературе, то это может
вести к ошибочным направлениям в последующих исследованиях.
Соответственно, «ложная негативная» погрешность является менее
опасной. Хотя, как может показаться, принятие негативного решения закрывает
возможности продолжения исследования на основам и заключения о наличии
слишком высокой вероятности влияния случайных факторов на полученные
результаты; это тем не менее оставляет открытой возможность того, что
повторение исследования позволит найти значимые различия.
Можно также отметить, что наличие этих двух типов ошибок
демонстрирует важность повторения уже проведенных в науке исследований.
Вполне разумной является практика повторения собственного исследования (так
же как и работы других исследователей) для проверки возможности
неправильного решения о принятии (или отвержении) альтернативной гипотезы
в предшествующем исследовании.
Возможности уменьшения вероятности ошибок?
Вероятность ошибок первого типа задается выбранным уровнем
значимости и, следовательно, может быть снижена просто уменьшением этого
уровня для используемой статистики, то есть путем перехода от р=0,05 к р=0,01
или к р=0,001. Однако выполнение этого одновременно приводит к известной
потере используемым статистическим тестом чувствительности и увеличении
вероятности ошибок второго типа, что, в свою очередь, уменьшает способность
теста выявлять (например, в эксперименте) специфическое влияние НП на ЗП.
Учитывая, что невозможно избавиться от обеих форм ошибок, наиболее
популярная тактика заключается в том, чтобы ограничить первый тип ошибок на
приемлемом уровне (на основе соответствующего уровня значимости),
25
предварительно проверив, что размер выборки является достаточно большим
для того, чтобы обеспечить минимизацию вероятности ошибки второго типа.
Оценка параметров:
переход от выборки к популяции
В этом разделе более детально будет описано, как можно делать выводы о
параметрах популяции на основе статистической обработки данных по выборке,
включая погрешность выборки, детали нормального распределения, понятия zпоказателя, «выборочного распреления среднего» и «доверительного
интервала».
Проблема с выборками
Данный раздел посвящен путям разрешения фундаментальной проблемы
социального исследования: что можно сказать о характеристиках популяции,
имея дело только с единичной выборкой данных?
Как известно, крайне редко выборка представляет всю популяцию
интереса, чаше всего она составляет лишь ее весьма небольшую часть. Именно
процесс использования данных выборки для получения выводов о некоторых
характеристиках популяции и представляет оценку параметров.
Функция любой выборки, как уже отмечалось, заключается в
представительстве популяции интереса, из которой она и создается. При этом
получение выводов о популяции на основании выборки основано на
предположении, что выборка достаточно полно представляет популяцию. В
идеальном варианте, это означает, что выборка является таковой, что значения
всех переменных, вычисленных по ней (например, среднее), являются точно
такими же, какими они бы были если бы были вычислены в случае, когда вся
популяция входила бы в выборку. Только в этом случае погрешность выборки
равна нулю.
Однако если даже процедура случайной выборки проведена тщательно,
базовое предположение, на котором основана оценка прямого соответствия
показателей выборки и популяции, почти никогда не оказывается верным (за
исключением тех весьма редких случаев, когда выборка практически совпадает с
популяцией, например, незрячие гомосексуалы в данном городе). Проблема
заключается в том, что не существует процедуры выборки, которая бы наверняка
обеспечивала полностью репрезентативные данные. Всегда остается различие
между набором данных по выборке и тем, что могло бы быть получено на всей
популяции.
Считается, что различие относится к погрешности выборки, вызванной
случайностью процедуры ее составления и ограниченностью объема. Понятно,
что при такой процедуре исследователь не может знать, как значения
26
индивидуальных данных распределяются внутри популяции, так что независимо
от того, насколько безупречно проводится выборочная процедура, она всегда
порождает данные, которые в какой-то степени (пусть и очень небольшой)
являются нерепрезентативными. Более того, погрешность выборки влияет не
только на первичные значения переменной, но и на значения любой
описательной статистики, вычисленной на основе первичных данных, что
отражается на соответствующих мерах центральной тенденции и мерах
вариативности или разброса.
Существование погрешности выборки означает, что, хотя такая статистика
как среднее выборки может представлять аккуратную точечную оценку для
среднего популяции, вероятней всего, это все-таки не так, и этот подход
(использующий лишь среднее выборки) не предлагает пути оценки размера или
вероятности различия между этими двумя значениями. Техника точечной оценки
предлагает быстрое, но «грязное» решение, а мы нуждаемся в более точных
процедурах, если хотим сделать надежные выводы о параметрах популяции на
основе показателей выборки.
Понятно, что необходимо найти более эффективный путь сглаживания
влияния погрешности выборки на точность оценки параметра. Такой путь,
называемый «интервальная оценка», вполне доступен, он представляет собой
приложение статистической теории выборки и понятия нормального
распределения к задаче выхода за рамки данных по выборке. Реализация этого
подхода включает две стадии.
Начиная с набора данных по выборке, интервальная оценка допускает
точную оценку с помощью доверительного интервала. Это определение
диапазона возможных значений, которые может принимать данный параметр
популяции. В этом и заключается полезность интервального оценивания, ибо
оно связывает вероятность с оценкой диапазона, что позволяет не только указать
диапазон, внутри которого находится параметр, но и сказать, насколько
вероятно то, что он будет находиться именно внутри указанного диапазона. Как
вы сможете в дальнейшем оценить, это позволяет планировать значение
параметра с определенной точностью и представляет развитие техники точечной
оценки. Понятие доверительного интервала является ключевым и в дальнейшем
к нему необходимо будет вернуться.
Прежде чем перейти к деталям интервальной оценки, обратимся к
разновидности нормального распределения, описанного ранее, а именно – к
стандартному нормальному распределению, позволяющему понять, как
интервальная оценка способна предоставлять информацию о параметрах
популяции. Именно такое распределение является основой этой техники и
средством вычисления доверительного интервала.
27
Стандартное нормальное распределение
Стандартное нормальное распределение (СНР) является формой
нормального распределения, абсцисса которого калибрована стандартным
образом, т.е. единицами стандартного отклонения или стандартной
погрешности. Это обеспечивает известную универсальность использования
СНР.
Понятие СНР основано на ключевой идее о единице стандартного
отклонения, уже упоминавшегося ранее в связи с нормальным распределением.
Как мы видели выше, абсцисса нормального распределения может быть
калибрована как в единицах первичных значений переменной, так и в единицах
стандартного отклонения выше и ниже среднего. СНР использует точно ту же
идею, кроме того, что в этом случае единицы стандартного отклонения
называются единицами z-показателя. Одна единица стандартного отклонения
(представляющая некоторое количество единиц первичных данных) равна одной
единице z-показателя/
Главное отличие СНР от других нормальных распределений заключается в
том, что среднее СНР приравнивается к нулевой точке. Согласно формальному
определению, СНР – это просто нормальное распределение, имеющее 0 в
качестве среднего и единицу в качестве стандартного отклонения, у которого
абсцисса калибрована в терминах z-показателя. Результат выгладит как
распределение на рисунке 29.
Как мы видели ранее, важной чертой любого нормального распределения
(независимо от природы показателей, которые оно представляет) является то,
что площадь под его кривой состоит из точно определяемых пропорций в
отношении к стандартному отклонению распределения. Так как СНР является
версией нормального распределения, то все особенности нормального
распределения относятся и к СНР. Единственное отличие заключается в том, что
для определения границ любой интересующей нас площади подкривой СНР
используются не единицы стандартного отклонения, а z-показатель.
Из предшествующего обсуждения нормального распределения также
понятно, что мы всего лишь фиксируем площади под кривой, отмеченные
значениями (в целых числах) единиц стандартного отклонения на абсциссе, хотя
и можно определить площадь под кривой для любого желаемого значения
стандартного отклонения. Это делается с помощью соответствующей таблицы.
Таблица областей под кривой нормального распределения основана на
СНР и дает площади под кривой между средним и любым z-показателем, ниже
или выше среднего, в размерности 0,01 единицы z-показателя. Это значит, что
можно определить площадь под кривой между двумя любыми точками на
абсциссе, как считыванием требуемых значений непосредственно из таблицы,
так и путем простых арифметических действий с табличными значениями.
28
Однако даже знания того, как различные пропорции площади под кривой
нормального распределения связаны с различными значениями z-показателя,
недостаточно для получения ценных выводов из полученного набора данных.
Гораздо больше исследователя интересует определение вероятности достижения
изучаемой переменной некоторого значения, представленного в распределении,
хотя оно может и не быть реально представлено в выборке.
В качестве примера можно взять набор IQ-показателей с диапазоном от 83
до 129 баллов, причем психолог хочет найти вероятность достижения наиболее
экстремальных значений, выше 140, хотя их в выборке и нет. Это нетрудно
сделать при сохранении в силе предположения о том, что переменная (в данном
случае IQ-показатели, но в принципе, значения любой переменной) нормально
распределена в интересующей нас популяции. Если допущение сохраняется, то
таблица областей под кривой может использоваться непосредственно как
таблица показателей вероятностей.
Основания такой возможности следующие.
Нормальное распределение (а СНР является формой нормального
распределения) является теоретическим распределением, покрывающим все
возможные значения изучаемых переменных, то есть можно сказать, что
площадь под кривой представляет 100% всех возможных значений переменной.
Площадь под любым участком кривой, ограниченным двумя значениями
переменной, пропорциональна доле результатов эксперимента, значения
которых попадут в этот диапазон. Например, если площадь под некоторым
участком составляет 25% площади под всей кривой, то в этот диапазон попадут
25% значений всех переменной. Это можно выразить и по-другому: вероятность
попадания отдельных результатов в заданный диапазон значений равна, в
данном случае, p=0,25 (или 1 из 4). Исходя из этого, а также зная среднее и
стандартное отклонение распределения, оказывается достаточно легко пойти
дальще и определить вероятность достижения любого диапазона значений в
первичных показателях.
Например, допустим, что психолог работает с большим набором
нормально распределенных первичных данных со средним 80 и стандартным
отклонением 10. Предположим далее, что психолог хочет установить, вопервых, какова пропорция значений, лежащих между 75 и 85, а во-вторых,
какова может быть вероятность достижения показателей, больших, чем 100, и, втретьих, какое значение меньше лишь 5% первичных данных. Процедура
получения такой информации может выглядеть следующим образом.
Можно начать с перевода первичных значений переменной величины zпоказателя. Наиболее удобно это делать путем вычисления значений zпоказателя и прибавления затем эквивалентов z-показателя в первичных данных
вверх и вниз, двигаясь от среднего в обоих направлениях.
Для того, чтобы найти z-показатель, эквивалентный любому первичному
показателю, используется общая формула:
29
Нет необходимости рисовать кривую, хотя многие находят полезным эскиз
диаграммы для визуализации распределения.
После превращения первичных значений переменной в эквивалентпоказателей, можно для лучшего понимания задать следующие вопросы.
1) Какова пропорция значений переменной, лежащих между zпоказателями -0,5 и +0,5?
2) Какова вероятность достижения z-показателя, большего чем +2,0?
3) Каково значение z-показателя, фиксирующее границу между верхним
максимумом 5% распределения и остальными значениями?
Для ответа на первый вопрос достаточно заглянуть в уже использованную
таблицу областей под кривой нормального распределения. Она показывает, что
область между средним и значением z-показателя 0,5 в обоих направлениях
представляет 0,1915 (то есть 19,15%) от общего. Так как вопрос требует
определения пропорции в обоих направлениях, то мы просто удваиваем это
значение. Учитывая, что все возможные значения переменной включены в
нормальное распределение, мы можем просто рассматривать пропорции области
как пропорции показателей. Следовательно, ответ на первый вопрос будет
гласить, что пропорция первичных данных, лежащих между z-показателя ми -0,5
и +0,5 равна 2 х 19,15% = 38,3% полного набора.
Ответ на второй вопрос похож по процедуре, однако таблица областей под
кривой нормального распределения должна быть использована здесь как
таблица вероятностей. Мы снова обращаемся к данной таблице для определения
области, которая лежит за пределами z-показателя, равного +2,0.
Таблица нам показывает, что область между средним и значение zпоказателя, равного 2,0, в обоих направлениях – 0,4772 (47,72%) обшей плошади
под кривой. Для того, чтобы найти искомую область за пределами z-показателя,
равного +2,0, надо просто вычесть это найденное в таблице значение из 50%.
Это и даст нам искомую величину: 50 – 47,72 = 2,28 (%), и соответственно, для
вероятности достижения z-показателя, большего +2,0, мы получим: р=0.5 –
0,4772 = 0,0228.
(Помните что при нормальном распределении среднее совпадает с
медианой и разделяет площадь под кривой на две равные части, таблица
областей под кривой нормального распределения дает при этом только площади
под кривой на одной стороне от среднего.)
Для ответа на третий вопрос нам надо, прежде всего, найти значение zпоказателя, которое делит верхнюю половину распределения в отношении 45% к
5%. Обращение к уже упоминавшейся нам значение z-показателя между 1,64 и
30
1,65, скажем 1,645. Затем мы используем упомянутую выше формулу 7.1 |zпоказатель = (первичное значение — среднее)/стандартное отклонение| для
превращения этого значения z-показателя в его эквивалент первичного значения
переменной:
среднее + (z-показатель х стандартное отклонение) = 80 + 1,645x 10 = 96,5
Последняя стадия процесса формулирования ответов на три поставленных
вопроса включает повторный перевод z-показателей в термины первичных
данных.
Выборочное распределение среднего
В качестве одного из важнейших понятий в обобщении данных на
популяцию, можно назвать выборочное распределение (или распределение
выборок). Для того, чтобы сделать его более ясным, остановимся лишь на одном
из набора возможных выборочных распределений — на выборочном
распределении среднего, которое, впрочем, дает нам представление об
алгоритме построения таких распределений и для других мер центральной
тенденции или вариативности.
Рассмотрим данное понятие на примере. Представим, что вместо того,
чтобы взять единичную случайную выборку данных в 20 показателей из
неизвестной популяции, вы получаете много (хоть 10000) таких выборок.
Предположим также, что мы можем вычислить среднее каждой выборки и
изобразить распределение частот средних. Результат, который будет выглядеть
очень похоже на нормальное распределение, и будет представлять выборочное
распределение среднего.
В свою очередь, это распределение обладает важной особенностью: если
случайные выборки составлены из нормально распределенной популяции, то
теоретическое распределение выборочных средних также будет нормальным со
средним,в точности равным среднему популяции. Это всегда верно, независимо
от размера выборок.
Для выборок, больших по размеру, даже если материнская популяция
является крайне отличной от нормальной, распределение выборочных средних
будет весьма близким к нормальному. В этих случаях чем больше размер
выборок, тем ближе распределение выборочных средних к нормальному (это
известно как центральная предельная теорема). Выборки n≥20, даже при
популяции, отличной от нормальной, дают распределение, весьма близкое к
нормальному распределению средних множества выборок.
Стандартная погрешность среднего в таком распределении представляет
другую форму стандартного отклонения выборочного распределения средних
(то есть стандартное отклонение всех средних в данном выборочном
распределении). То есть, когда мы переходим от конкретной выборки к
рассмотрению распределению средних множества выборок изданной популяции,
31
то обычно используем понятие стандартной погрешности. Его значение в
каждом конкретном случае стремится быть равным стандартному отклонению
популяции, деленному на квадратный корень размера выборки, и,
следовательно, вычисляется непосредственно следующим образом.
Во-первых, допустим, что родительская популяция является нормальной, и
мы также знаем σ — стандартное отклонение популяции. Далее мы можем легко
найти стандартную погрешность среднего (символ σ Х ) путем деления σ на
квадратный корень размера выборки:
Эта формула имеет большое практическое значение, ибо она связывает в
аналитической форме два необходимых компонента информации. Во-первых,
мы знаем из вышеупомянутого положения, что распределение выборочных
средних всегда стремится к нормальному по форме, и во-вторых, использование
формулы 7.2 позволяет найти стандартную погрешность этого распределения.
Сделав это и добавив ранее использованную технику для изучения значений,
которые могут быть найдены в выборке, мы можем оценить вероятность любого
данного значения, имеющегося в распределении, и весьма полезно будет
представление среднего популяции в качестве нулевого значения.
Теперь мы подошли к достижению главной цели данной главы — сделать
точные выводы о популяции лишь на основании характеристик выборки.
Доверительный интервал
Как мы видели в предшествующем разделе, важность понятия
«доверительный интервал» заключается в следующем. Оно позволяет
установить диапазон значений параметра популяции, определений данной
вероятностью. По сути, доверительный интервал представляет собой опенку
параметра, такого как среднее популяции (но не только), в виде диапазона
значений, который, в свою очередь, определяется на основе установки параметра
на специфическом уровне вероятности.
Важность этого понятия в том, что без него мы можем лишь установить
ряд возможных значений для параметра, но не можем сказать, будут ли она
действительно такими и насколько близкими к ним.
Здесь мы уточним некоторые аспекты доверительного интервала, не
затронутые в предшествующем разделе. Начнем с выборочного распределения,
например, с распределения среднего, представляющего распределение очень
большого числа средних отдельных выборок, которые (в случае нормального
распределения) расположены симметрично относительно среднего популяции.
Конечно же, распределение очень большого числа средних отдельных выборок
32
должно заполнять всю площадь под кривой.Проблема, на разрешение которой
нацелено понятие «доверительный интервал», заключается в следующем. Как
нам придти к реальной оценке среднего популяции в случае, если конкретное
среднее выборки может быть идентифицировано с одной (и только с одной)
точкой на данном графике?
Понятно, что некоторые выборочные средние лежат на той же линии, что и
среднее популяции, и, таким образом, имеют такое же значение, вто время как
другие могут лежать на некотором удалении от него. Следовательно, необходим
способ выражения взаимоотношения между любым средним значением из
отдельных выборок и средним по популяции, что и должно быть представлено
интересующим нас значением.
Дальнейшим шагом, как мы уже видели, является использование того что
нормальное распределение позволяет связывать точную вероятность с любым
заданным диапазоном изменения переменной. Используя таблицу областей под
кривой, мы можем обозначить вероятность любого диапазона значений
показателей (в данном случае, по отношению к возможным значениям среднего
по популяции), который мы выбираем и таким образом, получить
доверительный интервал
Оценка среднего популяции
при неизвестной стандартной погрешности
В начале обсуждения оценки параметров был использован пример, в
котором была известна стандартная погрешность среднего 13.44. Однако чаще
всего такой информации у нас нет. Что тогда? Как достичь цели, если, как мы
видели ранее, значение стандартной погрешности является ключевым для
вычисления доверительного интервала.
Даже если нам не известно значение стандартной погрешности
ответствующего выборочного распределения, тем не менее можно оценить ее
значение и затем перейти к оценке интересующего нас параметра. Для этого нам,
прежде всего, надо вычислить s, оценить стандартное отклонение внутри
популяции на основании данных по выборке, используя формулу 6.2 в главе 6.
Следующим шагом надо вставить полученное значение в формулу 7.3 (которая,
в принципе отличается от предшествующей формулы 7.2, определяющей
стандартную погрешность для популяции в целом) для того, чтобы найти Sx
величину стандартной погрешности среднего.
Затем, вместо использования таблицы нормального распределения для
выявления значения z-показателя, идентифицирующего соответствующую
область под кривой, необходимо использовать t-pacпределение для
статистического t-критерия. Это связано с тем что мы имеем дело не со
значениями популяции, а со значениями выборки, и, следовательно, должны
вычислять s, а не о, по приминал описанным в главе 6. Однако, s дает лишь
33
примерную оценку стандартного отклонения популяции, и она недостаточно
точна для использования стандартного нормального распределения (СНР),
требующего знания совершенно точного значения. Поэтому мы и обращаемся к
t-распределению. Как и СНР, t-распределение имеет нулевую точку в центре, но
абсцисса калибрована в значениях t-критерия — t-значениях (выше (+) или ниже
(—) среднего). Так как t-распределение подобно скорее нормальному
распределению, а не СНР, t-значения по-другому соотносятся с областями под
кривой, чем значения z-показателя. При необходимости полный набор tраспределений может быть найден в специальных статистических текстах, но
для наших целей и таблице критических значений приведены учения для обоих
95% и 99% доверительных интервалов.
При использовании t-распределения прежде всего вычисляется количество
степеней свободы, которое на 1 меньше, чем количество значений переменной,
используемых для вычисления стандартного отклонения (п— 1), а затем
используется таблица критических значений t (Приложение 5. таблица 9). Из
соответствующих столбцов (р=0.05 иди р=0.01) двусторонних критических
значений (зависящих от того, декой вы хотите доверительный интервал — 95%
или 99%), выберите значение t для желаемых степеней свободы. Найденное в
таблице значение будет обозначать, соответственно, 5% или 1% площади под
кривой на крайних концах распределения и может быть использовано дли
определения доверительного интервала для какого-либо параметра, такого как
среднее популяции, точно таким же образом, как ранее были использованы zпоказатели.
Рассмотрим для ясности следующий пример. Предположим, мы собрали
набор IQ показателей на случайной выборке в 20 человек. Среднее по выборке
— 58 и стандартное отклонение s=15. Вы хотите определить из этих данных по
выборке 95% доверительный интервал для среднего популяции. Для этого надо
сделать следующее.
Во-первых, вычислите стандартную погрешность среднего, используя
формулу:
Затем надо использовать это значение стандартной погрешности среднего
для определения диапазона возможных значений среднего популяции. Для этого
необходимо идентифицировать точку на t-распределении, которая обозначает
границы 95% доверительного интервала. Обратившись к уже использованной
таблице и посмотрев на столбцы с двусторонними значениями, вы найдете два
таких критических значения t: одно для р=0.05, другое для р=0.01. В данном
случае надо взять первое, поскольку вы заинтересованы в достижении оценки с
95% доверительным интервалом, и это дает значение t=2.093.
Теперь можно перейти к заключительной фазе решения. Данное значение
t=2.093 отделяет центральную область распределения, содержащую 95% всей
области, от оставшихся 5%, расположенных на концах распределения
34
(соответственно, по 2.5% на каждом конце). Следовательно, 95% области под tраспределением лежит внутри диапазона от t=-2.093 до t=2.093 что и образует
искомый 95% доверительный интервал. Остается только превратить эти
значения в первичные значения переменной для определения диапазона
возможных значений среднего популяции. Это нетрудно сделать, умножив
стандартную погрешность среднего на значения t, полученные из таблицы, и
прибавляя или вычитая полученный результат из среднего выборки.
Так верхняя границы 95% доверительного интервала будет равна 58+(2
09x3 35)=58+7=65 единиц первичных значений переменной в го время как
нижняя граница будет равна
58-(2 09хЗ 35)=58—7=5l единиц первичных значений переменной
Следовательно. на основании исходных данных по выборке можно сказать, что
среднее популяции будет лежать в пределах диапазона от 51 до 65 единиц
первичных значений переменной с вероятностью p=0.95 (95%).
В данной главе мы сосредоточились лишь на поиске диапазона воможных
значений среднего по популяции, хотя аналогичная процедура может быть
проведена и для определения других параметров популяции. При этом важно
использовать правильное выборочное распределение, что более подробно
описывается в специальных статистических текстах.
Алгоритм оценки среднего популяции на основе данных по выборке при
неизвестном отклонении
1. Определите стандартную погрешность среднего по выбору используя
формулу 3: Sх=s/Vn. .
2 Определите количество степеней свободы (n-1).
3 Обратитесь к таблице критических значений для t-распределения. Из
соответствующих столбцов (р=0.05 илир=0.01) двухсторонних критических
значений (зависящих от того, какой вы хотите доверительный интервал - 95%
или 99%), выберите критические значения t для желаемых степеней свободы.
4. Превратите t-значения в их эквиваленты в форме первичных значений
переменной, умножая их на стандартную погрешность.
5. Прибавьте к средней по выборке и вычтите из среднего по выборке
полученный результат для определения доверительного интервала для среднего
популяции.
Резюме
Выводные статистики позволяют выйти за рамки простого описанияполученных данных — они позволяют сказать нечто о возможном значении этих
данных за пределами использованной выборки.
В свою очередь, эти техники основаны на понятиях вероятности и
возможности, которые стоит различать, хотя они и взаимозависимы.
35
Вероятностное утверждение предполагает указание точного значения (между 0и
1) вероятности наступления события. В выводной статистике случайные
факторы, влияющие на полученные данные, являются частью проблемы,
которую статистические методы и должны разрешать. При этом понятие
вероятности чаще всего используется для характеристики возможной ошибки в
результате действия этих случайных факторов, то есть выражения вероятности
неверного принятия решения относительно выдвинутых гипотез.
Ключевым распределением, используемым в выводной статистике,
является
нормальное
распределение,
представляющее
симметричную
колоколообразную
кривую,
описывающую
распределение
множества
переменных в природе (включая и психологию). Наиболее важной чертой этого
распределения является то, что если кривая построена для нормально
распределенной переменной, то среднее и стандартное отклонение могут быть
использованы для определения конкретной пропорции общей площади под
кривой между любыми двумя точками на абсииссе. Это, в свою очередь,
означает, что если мы имеем нормальное распределение и известно его среднее
и стандартное отклонение, то можно оценить вероятность появления (рзначение) для любого диапазона значений переменной.
Гипотезы, играющие центральную роль в развитии научной теории,
представляют собой предположения, выдвинутые относительно возможного
результата исследования еще до сбора данных. Они бывают двух видов.
Обычные, или «научные», гипотезы представляют собой обшие предположения
о том, как может выглядеть контур данных в случае, если теория верна. В свою
очередь, статистические гипотезы являются точным набором парных
утверждений о популяции и выражают «научные» гипотезы в непосредственно
проверяемой форме, что позволяет создавать рамку принятия решения о
результатах исследования. Экспериментальная, или альтернативная, гипотеза
конкретизирует различие между значениями двух параметров популяции, в то
время как нулевая гипотеза утверждает отсутствие значимых различий.
36
После выдвижения гипотез и сбора данных, выводные статистики могут
быть использованы для определения того, какая из двух возможностей верна.
Вполне очевидно, что обе они одновременно быть верны не могут. Для принятия
решения на основании полученных данных вычисляется значение
статистического теста, которое сравняется затем с «критическим значением»,
полученным из соответствующей таблицы. Обычно в том случае, если
«вычисленное значение» по статистическому тесту попадает в зону отвержения,
альтернативная (экспериментальная) гипотеза принимается. В свою очередь,
если это значение в данную зону не попадает, альтернативная
(экспериментальная) гипотеза не может быть принята, а нулевая отвергнута.
Такое принятие решения не может быть свободно от ошибок. Последние
бывают двух видов. Вероятность ошибки вида 1, возникаю ' в случае когда
нулевая гипотеза неверно отвергнута, устанавливается уровнем значимости
теста. Ошибки вида 2 представляют зеркальное отражение ошибок вида 1, ибо
возникают в случае, когда нулевую гипотезу не удалось отвергнуть, в то время
как она должна быть отвергнута Из этих двух именно первая является более
серьезной, ибо она позволяет подтвердить наличие взаимоотношения между
переменными которого в действительности не существует, что может вести
исследование в неверном направлении. Уменьшить вероятность ошибок вида 1
можно снижая уровень значимости (например, переход отуров- ня р=0 05 к
уровню р=0.01), в то время как вероятность ошибки вида2 можно уменьшить,
увеличивая размер выборки или используя более подходящие меры для
измерения переменных.
В то же время существует и погрешность выборки, связанная с
неизбежным различием данных по выборке и по популяции в целом, что делает
неопределенным их взаимоотношения. Естественно, что исследователей
интересует возможность делать выводы о популяции на основе данных по
выборке. Для того чтобы достичь этого, используется техника оценки параметра,
представляющая вторую часть выводной статистики.
Оценка параметра иногда использует версию нормального распределения
называемого
стандартным
нормальным
распределением,
которое
стандартизировано по среднему, приравненному к 0, и стандартному
отклонению в 1, отнесенному к z-показателю. Основная функция этого
распределения - возможность использовать пропорциональные площади под
кривой (и, в то же время, вероятности появления различных значений данных)
вполне независимым от любого специфического набора показателей образом.
Ключевым понятием в понимании оценки параметров ~ понятие
выборочного распределения. Это распределение которое можно получить для
любой статистики в том случае если выборки повторно создаются из той же
популяции, и значения (прежде всего, среднее по выборке) изображаются на
диаграмме распределения частот. Оно, таким образом, позволяет производить
оценку параметров популяции только лишь на базе данных по выборке
Надо учитывать также, что среднее популяции представляет лишь один из
параметров, которые хотелось бы измерить. Другие статистические показатели,
как медиана или стандартное отклонение также обладают своими собственными
выборочными распределениями и это можно использовать подобным образом,
37
вычисляя соответствующие параметры популяции. Надо иметь в виду, что при
случайной процедуре выборки и должной ее величине, даже выборки из
ненормально распределенной популяции дают в итоге выборочное
распределение близкое по форме к нормальному.
Известно также, что стандартное отклонение выборочного распределения
(называемое «стандартная погрешность»), может быть вычислено прямо с
помощью формулы из стандартного отклонения любой случайной выборки. При
использовании характеристики стандартной нормальной кривой (или, если вы
хотите иметь оценку стандартного отклонения популяции, — соответствующего
t-распределения) становится возможным делать выводы о диапазоне значений
(или доверительном интервале), которые среднее популяции способно
принимать, и, что еще более ценно, становится возможным связывать уровень
вероятности с любым выбранным интервалом.
Чем более точной является оценка (и, соответственно, уже диапазон
доверительного интервала), тем меньше вероятность того, что параметр
популяции действительно находится в предсказанном диапазоне. И наоборот,
чем шире диапазон, тем более уверенно мы можем предсказывать, что
интересующий нас параметр находится в пределах данного диапазона. Чаще
всего, исследователи предпочитают вторую альтернативу.
38
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1 Дружинин В. Н. Экспериментальная психология. Учебник для вузов. 2
изд. СПб: Питер, 2012.
2 Наследов А.Д. Математические методы психологического исследования.
Анализ и интерпретация данных. СПб: Речь, 2007. – 390 с.
3 Наследов, А. Д. SPSS: компьютерный анализ данных в психологии и
социальных науках / А. Д. Наследов. - Санкт-Петербург : Питер, 2007. - 416 с.
4 Практикум по общей, экспериментальной и прикладной психологии:
учебное пособие / В. Д. Балин, В. К. Гайда, В. К. Гербачевский ; под ред.: А. А.
Крылов, С. А. Маничев. - 2-е изд., доп. и перераб. - Москва ; Нижний Новгород ;
Воронеж : Питер, 2007. - 559 с.
5 Вуколов Э. А. Основы статистического анализа. Практикум по
статистическим методам и исследованию операций с использованием пакетов
STATISTICA и EXCEL: учебное пособие. 2-е изд. М.: ФОРУМ, 2008.
6 Корнилова Т. В. Экспериментальная психология: теория и методы:
учебник для вузов. М.: Аспект Пресс, 2012.– 321 с.
7 Математическая психология: школа В. Ю. Крылова / под ред. А. Л.
Журавлева, Т. Н. Савченко, Г. М. Головиной.- М.: ИП РАН, 2010.
8 Наследов А.Д., Тарасов С.Г. Применение математических методов в
психологии. СПб, 2002.
9 Насонова Ю.В. Статистические методы в психологии. Учебное издание.
Учебно-методический комплекс. Витебск: УО «ВГУ им. П. М. Машерова", 2010.
10 Смит Н. Современные системы психологии. СПб, 2002.
11 Солсо Р., Джонсон Х., Билл К. Экспериментальная психология:
практический курс. СПб, 2002.
12 Худяков, А.И. Экспериментальная психология в схемах и комментариях,
СПб: Питер, 2008.
13 Экспериментальная психология в России: традиции и перспективы / под
ред. В. А. Барабанщикова.- М.: Институт психологии РАН, 2010.
39
«…Статистика это прежде всего
способ мышления,
и для ее применения нужно лишь
иметь немного здравого смысла и
знать основы математики.»
Мак-Коннелл
Статистические методы в
психологии
Новопашина Л.А.
Статистические методы

от лат. status — состояние —
некоторые методы прикладной
математической статистики,
используемые в психологии в
основном для обработки
экспериментальных результатов.
40
Основная цель применения

повышение обоснованности выводов
в психологических исследованиях за
счет использования вероятностной
логики и вероятностных моделей.
Основные направления использования
статистических методов в психологии

1) описательная статистика - включает в себя
группировку, табулирование, графическое
представление и количественное описание данных;

2) теория статистического вывода- используется в
психологических исследованиях для предсказания
результатов по данным обследования выборок;

3) теория планирования экспериментов – служит для
обнаружения и проверки причинных связей между
переменными.
41
Статистические методы обработки
данных эмпирического исследования
Методы параметрической статистки










t-критерий для связанных выборок.
t-критерий для несвязанных выборок.
Корреляция по Пирсону.
Факторный анализ и его виды.
Эксплораторный факторный анализ.
Конфирматорный факторный анализ.
Регрессионный анализ – простой и
множественный.
Логистическая регрессия.
Однофактрный дисперсионный анализ.
Многофакторный дисперсионный анализ.
Методы непараметрической статистики










Критерий Манна-Уитни.
Критерий Колмогорова-Смирнова.
Критерий Хи-квадрат.
Критерий Вилкоксона. Критерий знаков G.
Критерий Краскела-Уоллиса.
Корреляция по Спирмену.
Коэффициент сопряженности Пирсона.
Оценка нелинейной связи по Соммерсу.
Метод CHEID – как непараметрический
аналог факторного анализа.
S-критерий тенденций Джонкиера.
L-критерий Пейджа.
42
Методы проверки соответствия эмпирического
распределения данных теоретическому.










Кластерный анализ и его виды
Многомерное шкалирование.
Методы анализа временных рядов.
Критерий тренда.
Дискриминантный анализ.
Методы анализа пунктов теста (коэффициент альфа,
корреляция расщепленных форм).
Коэффициент конкордации при работе с экспертами.
Анализ причинности.
Путевой анализ.
Моделирование структурными уравнениями (LISREL,
SPATH).
Что есть параметрические и
непараметрические критерии?
43
Параметрические критерии


Параметрический тест основан на
допущениях как свойств материнской
популяции, так и самой процедуры
выборки. Здесь исходят из допущения, что
переменная, на основе которой строится
выборка и собираются данные, нормально
распределена в материнской
(генеральной) популяции.
Сравнение двух выборок производится по
признаку, измеренному в интервальной,
метрической шкале
Описательная статистика



Описательная статистика обобщает первичные
результаты, полученные при наблюдении или в
эксперименте.
Процедуры здесь сводятся к группировке данных
по их значениям, построению распределения их
частот, выявлению центральных тенденций
распределения средней арифметической, моде
или медиане.
Производится оценка разброса данных по
отношению к найденной центральной тенденции.
44
Выбор меры центральной
тенденции



Для номинативных данных – мода, т.е. та
градация номинативной переменной, которая
встречается наиболее часто.
Для порядковых и метрических переменных,
распределение которых унимодальное и
симметричное, мода, медиана и среднее
отклонение совпадают, чем больше отклонение от
симметричности, тем больше расхождение между
значением этих мер.
Наиболее часто используемая мера – средние
значения, но! На величину среднего влияет
каждое отдельное значение. Эта мера
чувствительна к «выбросам»
Мода(Mo) –
для общего представления о
распределении


Она соответствует либо наиболее частому значению, либо
среднему значению класса с наибольшей частотой
В некоторых случаях у распределения могут быть две моды;
тогда говорят о бимодальном распределении. Такая картина
указывает на то, что в данной совокупности имеются две
относительно самостоятельные группы
45
Медиана (Me)

соответствует центральному
значению в последовательном ряду
всех полученных значений
Средняя арифметическая (М)
(далее просто «средняя»)

наиболее часто используемый
показатель центральной тенденции.
Ее применяют, в частности, в
расчетах, необходимых для описания
распределения и для его
дальнейшего анализа.
46
Простые советы для выбора
меры
Выборочные средние можно сравнивать,
если выполняются следующие условия:
 группы достаточно большие, чтобы судить
о форме распределения;
 распределения симметричны;
 отсутствуют «выбросы».
Если не выполняется хотя бы одно из
перечисленных условий, то следует
ограничится модой и медианой.
Фон
Mo =15 Me =15 =15.2
47
Индуктивная статистика
Задачи индуктивной статистики:
 определять, достаточно ли велика
разность между средними двух
распределений для того, чтобы можно
было объяснить ее действием независимой
переменной, а не случайностью, связанной
с малым объемом выборки.
 определять, насколько вероятно, что две
выборки принадлежат к одной популяции
две кривые – до и после воздействия – для
контрольной группы и, с другой стороны, две
аналогичные кривые для опытной группы. При этом
масштаб кривых одинаковый.
48
Что такое нормальное
распределение?

Большинство результатов измерений
в психологии будет приближено к
нормальному распределению. В
случае, когда количество людей в
выборке исследования мало (менее
30), мы не получаем нормального
распределения
Если сложно, то нормальное
распределение это:
49
Нормальное распределение, также называемое
гауссовским распределением или распределением
Гаусса

распределение вероятностей, которое задается функцией
плотности распределения:
где, f(x)- высота подъема кривой(плотность вероятности для
значения х, е-основание натурального логарифма(примерно
2,718), число «пи»-3,14, параметр μ — среднее значение
(математическое ожидание) случайной величины и
указывает координату максимума кривой плотности
распределения, а σ² — дисперсия.
На графике это выглядит
так:
50
Не нормальное распределение
выглядит, например, так:
Статистики показали, что при нормальном распределении
«большая часть» результатов, располагающаяся в пределах одного
стандартного отклонения по обе стороны от средней, в
процентном отношении всегда одна и та же и не зависит от
величины стандартного отклонения: она соответствует 68%
популяции (т.е. 34% ее элементов располагается слева и 34%справа от средней):
51
94,45% элементов популяции при нормальном
распределении не выходит за пределы двух
стандартных отклонений от средней:
в пределах трех стандартных
отклонений умещается почти вся
популяция - 99,73%
52
?
Основной принцип метода
проверки гипотез


Выдвигается нулевая гипотеза Н0, с тем чтобы попытаться
опровергнуть ее и тем самым подтвердить альтернативную
гипотезу Ht. Действительно, если результаты
статистического теста, используемого для анализа разницы
между средними, окажутся таковы, что позволят отбросить
Н0, это будет означать, что верна Н1; т.е. выдвинутая
рабочая гипотеза подтверждается.
В гуманитарных науках принято считать, что нулевую
гипотезу можно отвергнуть в пользу альтернативной
гипотезы, если по результатам статистического теста
вероятность случайного возникновения найденного
различия не превышает 5 из 100*. Если же этот уровень
достоверности не достигается, считают, что разница вполне
может быть случайной и поэтому нельзя отбросить нулевую
гипотезу.
53
Пока просто рисунки 
Все остальное при встрече или по
мере необходимости или в
литературе.
Список прилагается
Для данных, разбитых на
классы по непрерывной шкале
54
Полигоны распределения частот
(для
еще более наглядного представления общей конфигурации
распределения
Как установить меру связи?

Термин "корреляция" впервые применил
французский палеонтолог Ж. Кювье,
который вывел "закон корреляции частей и
органов животных" (этот закон позволяет
восстанавливать по найденным частям
тела облик всего животного). В статистику
указанный термин ввел английский биолог
и статистик Ф. Гальтон (не просто связь –
relation, а "как бы связь " – corelation).
55
Типы шкал
Мера связи
Переменная X
Переменная Y
Интервальная или
отношений
Интервальная или
отношений
Коэффициент Пирсона
Ранговая, интервальная или
отношений
Ранговая, интервальная или
отношений
Коэффициент Спирмена
Ранговая
Ранговая
Коэффициент Кендалла
Дихотомическая
Дихотомическая
Коэффициент φ,
четырёхполевая корреляция
Дихотомическая
Ранговая
Рангово-бисериальный
коэффициент
Дихотомическая
Интервальная или
отношений
Бисериальный
коэффициент
Интервальная
Ранговая
Не разработан
Примеры диаграмм рассеивания и
соответствующих коэффициентов
корреляции
56
Документ
Категория
Без категории
Просмотров
33
Размер файла
1 353 Кб
Теги
763, 030300, метод, учеб, статистический, психология, пособие, спец, студентов
1/--страниц
Пожаловаться на содержимое документа