Подпишись и читай
самые интересные
статьи первым!

Измерительные шкалы. Шкала измерений в социологии Статистические методы в психологии

В статистических исследованиях используют различные типы признаков, характеризующих состояние экономического объекта. Признаки могут иметь различный вид в зависимости от шкалы измерения, что в дальнейшем сказывается на выборе методов статистического анализа.

В зависимости от шкалы измерения различают количественные (числовые) и категориальные (нечисловые, качественные) данные (см. рис. 3.1).

Количественные (числовые ) данные - это показатели, принимающие числовые значения, которые получаются путем некоторых измерений или подсчетов.

С точки зрения шкал измерений, количественные данные считают измеренными в интервальной шкале, которая применяется для отображения величины различия между характеристиками элементов. Интервальная (количественная) шкала показывает, насколько одно значение больше другого в принятых единицах измерения (например, шкала температур, времени, количества объектов). Интервальная шкала может иметь произвольные начало отсчета и масштаб. Множество допустимых преобразований данной шкалы составляют все линейные преобразования. Основное свойство шкалы - сохранение отношения длин интервалов. Частными случаями шкалы интервалов служат шкала отношений (нулевое начало отсчета) и шкала разностей (произвольное начало отсчета и единичный масштаб), а также абсолютная шкала (нулевое начало отсчета и единичный масштаб отсчета). Количественные шкалы допускают все арифметические действия над результатами измерения (например, заработная плата, остатки банковского счета, число работников на фирме).

В случае если данные получены путем измерений и могут принимать абсолютно любые значения из некоторого промежутка или всей числовой оси, их называют непрерывными. Если данные образуют счетное множество и принимают только некоторые изолированные значения на числовой оси, между которыми значений быть не может, то такие признаки называют дискретными.

Примеры количественных дискретных данных

  • Число вызовов «скорой помощи», поступающих в больницы г. Москвы ежедневно.
  • Количество страховых компаний в Российской Федерации, имеющих лицензии.
  • Число страховых случаев, наступивших в портфеле договоров страхования автокаско страховой компании в течение года.
  • Число беженцев и вынужденных переселенцев, официально зарегистрированных Федеральной миграционной службой за 2011 г.

Источник: URL: http://rating.rbc.ru/article.shtml92008/09/30/32143066.

Данные представлены в табличной форме, в виде линейного графика и столбиковой диаграммы.

Две переменные - «количество автомобилей в городе» и «население города» - дискретные количественные. Для наглядности на графике представлена переменная, рассчитанная как их отношение - число автомобилей на тысячу жителей.

Примеры количественных непрерывных данных

  • Динамика учетных цен на золото в России за последние 20 лет.
  • Рост, вес, давление крови и другие измеряемые показатели человека.
  • Урожайность сельскохозяйственных культур фермерских хозяйств Российской Федерации.
  • Удои молока в животноводческих хозяйствах Центрального федерального округа.
  • Дальность полета выпускаемого из орудия снаряда.

Источник: URL: http://rating.rbc.ru/articles/201 l/ll/09/33470757_tbl.shtml?2011/ 11/08/33470320.

Для представления данных по непрерывной количественной переменной «Чистые активы» использованы табличная форма и столбиковая диаграмма.

Другую группу, существенно отличающуюся от количественных данных, составляют нечисловые - категориальные или качественные данные. В этом случае объект может принадлежать только к одной из множества категорий (классов). Особенно часто это имеет место при создании и обработке анкет, опросников, рейтингов и т.д. Даже если обозначить эти категории числами (например, перекодировать: 0 - женский, 1 - мужской пол), то с такими данными все равно нельзя работать как с числовыми, а только как с категориальными.

В зависимости от того, можно ли эти категории упорядочивать, различают признаки, измеренные в номинальной или порядковой шкалах. В соответствии с этим, данные разделяют на номинальные и порядковые.

Шкала наименований (номинальная или классификационная шкала). Данные по этой шкале определяются в терминах категорий, которые нельзя содержательно упорядочить (профессия; регион страны; город; номер студенческой группы; банк, в котором имеется вклад). Номинальная шкала используется для описания принадлежности элементов к определенным классам. Всем элементам одного и того же класса присваивается одно и то же текстовое значение или число, а элементам разных классов - разные значения или числа. Допустима любая замена чисел для обозначения классов, лишь бы это было взаимно однозначное преобразование, и каждый класс получил бы свое число. Это обстоятельство и определяет множество допустимых преобразований номинальной шкалы как множество всех взаимооднозначных функций. Нет оснований полагать, что одна категория лучше (или хуже), чем другая, поэтому при обработке таких данных применяются только операции сравнения: «равно» и «не равно».

  • Город Российской Федерации (Владивосток, Сургут, Тюмень и т.д.).
  • Группа крови человека (О, А, В, АВ).
  • Семейное положение (холост, женат, разведен, в гражданском браке).
  • Банк России (Сбербанк России, ВТБ, Газпромбанк и т.д.).
  • Федеральные округа России (Центральный, Дальневосточный и т.д.).

Пример 3.12


Данные по номинальной категориальной переменной «цвет глаз» представлены в табличной форме и в виде круговой диаграммы (piechart).

Другой тип категориальных переменных - порядковые (ординальные ) - отличаются тем, что данные измеряются в порядковой шкале. Порядковые шкалы используются для упорядочения элементов по одному или нескольким признакам. Они позволяют установить, что один элемент лучше, важнее, предпочтительнее другого или равноценен другому. Порядковая шкала отражает лишь порядок следования элементов и не дает возможности сказать, на сколько или во сколько раз один элемент предпочтительнее другого. Иными словами, в этой шкале нельзя определить меру степени предпочтительности. Для сравнения таких данных допускаются уже не только операции «равно» и «не равно», но и «больше» - «меньше» (без определения на сколько).

  • Ответы на вопросы анкеты, содержащей следующие варианты ответов: да; больше да, чем нет; больше нет, чем да; нет.
  • Оценки, полученные студентами на экзамене (отлично, хорошо, удовлетворительно, неудовлетворительно).
  • Должность, занимаемая сотрудником в научной лаборатории (младший научный сотрудник, научный сотрудник, старший научный сотрудник и т.д.);
  • Воинские звания в Российской армии (лейтенант, капитан, майор, полковник и т.д.).

Л (высокий), В (удовлетворительный), В+ (достаточный), В++ (приемлемый),

С (неудовлетворительный), D (банкротство), Е (отзыв лицензии или ликвидация))


Любое эмпирическое научное исследование начинается с того, что исследователь фиксирует выраженность интересующих его свойств у объектов исследования как правило, при помощи чисел. Таким образом, следует различать:

1. Объекты исследования (в психологии это чаще всего люди)

2. Их свойства (то, что интересует исследователя и составляет предмет изучения)

3. Признаки, отражающие в числовой шкале выраженность свойств

В зависимости от того, какая операция лежит в основе измерения признака, различают так называемые шкалы измерений. Рассмотрим наиболее употребляемые в статистике шкалы измерений.

1. Номинальная шкала (шкала наименований, шкала классификации)используется для отнесения объектов к определённому классу. Например: пол, темперамент. Если объект может относиться только к одному из двух классов, то такая шкала называется номинальной дихотомической. Например: пол или варианты ответов на вопрос (да или нет).

2. Порядковая шкала (ранговая, ординальная), используется для отнесения объектов к определённому классу в соответствии со степенью выраженности заданного свойства изучаемого объекта. Например: оценки на экзамене или уровень тревожности.

3. Количественные шкалы имеются две разновидности количественных шкал:

· Интервальная шкала

· Абсолютная шкала (шкала отношений)

Интервальная шкала позволяет классифицировать и упорядочивать объекты, а также количественно описывать различия между свойствами объектов. Для задания этой шкалы устанавливают единицу измерения и произвольную нулевую точку отсчёта. Например: температура по шкале Цельсия ( 0 С ).

Абсолютная шкала отличается от интервальной шкалы, только тем, что в ней устанавливается абсолютная нулевая точка отсчёта соответствующее полному отсутствию выраженности измеряемого свойства. Например: температура по шкале Кельвина ( 0 К ).

Определение того, в какой шкале измерен признак, является ключевым моментом анализа данных, так как выбор необходимого статистического метода зависит именно от этого. Данные полученные в одной шкале, можно перевести в другую шкалу только в следующем направлении.

В обратном направлении, это не возможно:

Поэтому нужно стараться по мере возможности измерять в количественной шкале, так как в этом случае мы сможем перейти к любой из рассмотренных шкал.

Однако при этом происходит частичная потеря столь ценной для нас эмпирической информации об индивидуальных различиях испытуемых. Следствием этого может являться падение статистической достоверности результатов исследования.

Перевод исходных данных из количественной шкалы в порядковую, называется ранжированием . Для этого сначала, необходимо упорядочить исходную выборку, а затем каждому элементу выборки присвоить ранг. То есть, число соответствующее порядковому номеру этого элемента в упорядоченной выборке.

Конец работы -

Эта тема принадлежит разделу:

Статистические методы в психологии

Факультет философии и социальных наук.. кафедра психологии.. статистические методы в психологии лекции..

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ:

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Основные этапы статистической обработки данных
1-й этап: Исходный (предварительный) анализ исследуемого реального явления. В результате этого анализа определяются: · Основные цели исследован

Способы организации выборки
Сущность статистических методов состоит в том, чтобы по некоторой части генеральной совокупности, то есть по выборке выносить суждения о свойствах генеральной совокупности в целом. Таким образом, п

Формула №6.3
после этого, в качестве требуемого количественного интервала выбирается целое число, находящееся между К1 и К2. Например: К1=7,3 и

Квантили и их интерпретация
Одним из наиболее эффективных методов обобщения исходных данных, является описание их при помощи квантилей. Квантиль – это общее, понятие частными случаями её являются: квартиль, д

Графическое представление данных
Существует 3 основных метода графического представления данных: гистограмма (столбиковая диаграмма), полигон частот, сглаженная кривая (огива). Гист

Меры изменчивости
Рассмотренные в §9 меры центральной тенденции, позволяют нам характеризовать в каком-то смысле все элементы выборки в целом. В этом случае фактически пренебрегают р

Формула №10.5
Чем больше дисперсия выборки, тем более разбросаны элементы выборки по числовой оси относительно среднего значения выборки. Пример: вычислить дисперсию следующей выборки 1,

Формула №10.6
Для нашего примера имеем: Xi

Формула №10.7
Например, если дисперсия =2,25, то стандартное отклонение будет равно, стандартное отклонение позволяет характеризовать разброс элементов выборки относительно сред

Формула №10.8
Где М и сигма константы, принимающие для соответствующей шкалы следующие значения: шкала М δ

Формула №10.9
Если β равняется нулю, то это означает, что исходная выборка (её гистограмма) является симметричной: β=0 Если β

Нормальное распределение
Значение величин представляющих исходные даны, не возможно точно предугадать, даже при полностью известных условиях эксперимента, в которых они измеряются.Мы можем лишь указать веро

Формула №11.11
Если эмпирические значения показателей асимметрии и эксцесса по абсолютной величине меньше критических значений, то делаем вывод о том, что распределение измеренного показателя не отличается от нор

Распределения, связанные с нормальным распределением
С нормальным распределением связаны многие другие распределения, среди которых в статистике чаще всего используются следующие: 1. (хи-квадрат) распределения Пирсона. 2. t-распреде


Типы статистических шкал: номинальная шкала, порядковая шкала, интервальная шкала, шкала отношений.

Номинальная шкала используется для регистрации самого низшего уровня измерений, предполагающего наличие минимальных предпосылок для измерения. При измерениях на данном уровне практически не используются числа. Здесь важно установить подобие или различие объектов по некоторому признаку, т. е. при этом имеют дело с качественными данными. Рассмотрим примеры.

Распределения учащихся по классам, по половому признаку, по месту жительства, по видам спорта, которыми они занимаются, по числу детей в семье являются примерами величин номинальной шкалы. При этом возможно распределение учащихся по двум или более признакам (двумерные или многомерные данные).

С помощью подсчета можно установить частоту той или иной категории (число мальчиков и девочек в школе; число учащихся, проживающих в каждом микрорайоне; число учащихся в каждом классе; число учащихся, занимающихся тем или иным видом спорта; количество фирм, занимающихся производством автобусов и т. д.). При этом можно определить наиболее часто встречающуюся величину (класс, в котором учится наибольшее число учащихся; вид спорта, пользующийся наибольшей популярностью у учащихся; тип автомобиля, производством которого занимается наибольшее число фирм). Категории данных номинальной шкалы обозначаются, как правило, словесно (вербально).

Порядковая , или ранговая , шкала указывает лишь последовательность носителей признака или направление степени выраженности признака.

Например, учащихся можно ранжировать по количеству правильно выполненных тестовых заданий. Пусть учащиеся А, Б, В, Г, Д правильно выполнили соответственно 21, 16, 12, 9 и 3 задания. Графически это можно изобразить так

Эта порядковая шкала имеет величины от 1 до 5, и учащиеся на ней размещены в зависимости от количества правильно выполненных заданий: А - первый, Д - пятый. Из рисунка видно, что интервалы, разделяющие места в ряду, различны по величине. По этой причине нецелесообразно складывать, вычитать, умножать и делить порядковые места.

На шкале интервалов равные интервалы отображают одинаковую меру величины измеряемого признака. Например, 1 см между 3-м и 4-м сантиметрами на шкале измерений длин имеет такой же смысл, как и 1 см между 82-м и 83-м сантиметрами. Другими словами, на шкале интервалов расстояния между соседними делениями равны. На интервальной шкале вполне осмысленным является вопрос "на сколько?". Но не всегда, пользуясь интервальной шкалой, можно формулировать вопрос "во сколько раз?". Дело в том, что на шкале интервалов устанавливаются произвольно начало отсчета (нуль шкалы), единица измерения и направление отсчета. Примером интервальной шкалы является температурная шкала по Цельсию. Разность между температурами воздуха +30 и +20 °С столь же велика, как и между -10 и -20 °С. Однако нельзя утверждать, что при температуре воздуха +30 °С в полтора раза теплее, чем при температуре +20 °С. Даже если температура воздуха равна 0 °С, нельзя утверждать, что тепла нет совсем: ведь начало отсчета выбрано произвольно.

Шкалы на большинстве физических приборов (амперметр, вольтметр и др.) являются интервальными. Шкала коэффициента интеллекта IQ является шкалой интервалов.

Шкала интервалов является метрической, с ее помощью можно выполнять сложение и вычитание. Она имеет значительные преимущества по сравнению с номинальной и порядковой шкалами.

Шкала отношений , или шкала пропорций , дает возможность устанавливать отношения значений измеряемого признака благодаря тому, что значению шкалы "0" соответствует величина, для которой измеряемый признак отсутствует. Другими словами, начало отсчета на этих шкалах выбирают непроизвольно. Примерами шкалы отношений являются меры длины (м, см и т. д.) и массы (кг, г и т. д.). Предмет длиной 100 см вдвое длиннее предмета длиной 50 см. Иногда данные нуждаются в преобразованиях. В частности, потребность в этом возникает, когда в ряду данных одно или несколько данных существенно превышают остальные. Если данные явно несимметричны, то заменяют каждое значение приведенного набора данных логарифмом этого значения с целью упростить статистический анализ. Логарифмирование преобразует "скошенные" (ассимметричные) данные в более симметричные, так как происходит "растягивание" шкалы возле нуля, малые значения, сгруппированные вместе, распределяются вдоль шкалы. В то же время логарифмирование собирает вместе большие значения на правом конце шкалы. Наиболее часто применяют десятичные и натуральные логарифмы. Равным расстояниям на логарифмической шкале соответствует на исходной шкале равные процентные увеличения, а не равные увеличения значений.

^ Проверка наличия нормального распределения.

Многочисленные методы, с помощью которых обрабатываются переменные, относящиеся к интервальной шкале, исходят из гипотезы, что их значения подчиняются нормальному распределению. При таком распределении большая часть значений группируется около некоторого среднего значения, по обе стороны от которого частота наблюдений равномерно снижается.

В качестве примера рассмотрим нормальное распределение возраста, которое строится по данным исследований гипертонии (файл hyper.sav) с помощью команд меню Graphs (Графы) Histogramm... (Гистограмма) (см. рис. 5.1).

На диаграмме нанесена кривая нормального распределения (Колокол Гаусса). Реальное распределение в большей или меньшей степени отклоняется от этой идеальной кривой. Выборки, строго подчиняющиеся нормальному распределению, на практике, как правило, не встречаются. Поэтому почти всегда необходимо выяснить, можно ли реальное распределение считать нормальным и насколько значительно заданное распределение отличается от нормального.

Перед применением любого метода, который предполагает существование нормального распределения, наличие последнего нужно проверять в первую очередь. Классическим примером статистического теста, который исходит из гипотезы о нормальном распределении, можно назвать t-тест Стьюдента, с помощью которого сравнивают две независимые выборки. Если же данные не подчиняются нормальному распределению, следует использовать соответствующий непараметрический тест, в случае двух независимых выборок - U-тест Манна и Уитни.

Если визуальное сравнение реальной гистограммы с кривой нормального распределения кажется недостаточным, можно применить тест Колмогорова-Смирнова, который находится в меню Analyze (анализ данных) в наборе непараметрических тестов (см. раздел 14.5).

Рис. 5.1: Распределение возраста

В нашем примере с распределением возрастов тест Колмогорова-Смирнова не показывает значительного отклонения от нормального распределения.

^ Зависимость и независимость выборок.

Две выборки зависят друг от друга, если каждому значению одной выборки можно закономерным и однозначным способом поставить в соответствие ровно одно значение другой выборки. Аналогично определяется зависимость нескольких выборок.

Чаще всего зависимые выборки возникают, когда измерение проводится для нескольких моментов времени. Зависимые выборки образуют значения параметров изучаемого процесса, соответствующие различным моментам времени.

В SPSS зависимые (также связанные, спаренные) выборки будут представляться разными переменными, которые сопоставляются друг с другом в соответствующем тесте на одной и той же совокупности наблюдений.

Если закономерное и однозначное соответствие между выборками невозможно, эти выборки являются независимыми. В SPSS независимые выборки содержат разные наблюдения (например, относящиеся к различным респондентам), которые обычно различаются с помощью групповой переменной, относящейся к номинальной шкале.

^ Обзор распространенных тестов для проверки гипотез о среднем.

В наиболее распространенной ситуации, когда требуется сравнить друг с другом разные выборки по их средних значениям или медианам, с учетом условий, описанных в разделе 5.1, обычно применяется один из восьми следующих тестов.

^ Переменные, относящиеся к интервальной шкале и подчиняющиеся нормальному распределению

^ Переменные, относящиеся к порядковой шкале или переменные, относящиеся к интервальной шкале, но не подчиняющиеся нормальному распределению

^ Вероятность ошибки.

В аналитической статистике разработаны методы вычисления так называемых тестовых (контрольных) величин, которые рассчитываются по определенным формулам на основе данных, содержащихся в выборках или полученных из них характеристик. Эти тестовые величины соответствуют определенным теоретическим распределениям (t-pacnpe-лелению, F-распределению, распределению X2 и т.д.), которые позволяют вычислить так называемую вероятность ошибки. Это вероятность равна проценту ошибки, которую можно допустить отвергнув нулевую гипотезу и приняв альтернативную.

Вероятность определяется в математике, как величина, находящаяся в диапазоне от 0 до 1. В практической статистике она также часто выражаются в процентах. Обычно вероятность обозначаются буквой р:

0
Вероятности ошибки, при которой допустимо отвергнуть нулевую гипотезу и принять альтернативную гипотезу, зависит от каждого конкретного случая. В значительной степени эта вероятность определяется характером исследуемой ситуации. Чем больше требуемая вероятность, с которой надо избежать ошибочного решения, тем более узкими выбираются границы вероятности ошибки, при которой отвергается нулевая гипотеза, так называемый доверительный интервал вероятности.

Существует общепринятая терминология, которая относится к доверительным интервалам вероятности. Высказывания, имеющие вероятность ошибки р


^ Вероятность ошибки

Значимость

Обозначение

р > 0.05

Не значимая

ns

р

Значимая

*

р

Очень значимая

**

р

Максимально значимая

***

^ Доверительный интервал вероятности.

Доверительный интервал - термин, используемый в математической статистике при интервальной (в отличие от точечной) оценке статистических параметров, что предпочтительнее при небольшом объёме выборки. Доверительным называют интервал, который покрывает неизвестный параметр с заданной надёжностью.

Доверительным интервалом параметра θ распределения случайной величины X с уровнем доверия 100p% [примечание 1] , порождённым выборкой (x 1 ,…,x n), называется интервал с границами (x 1 ,…,x n) и (x 1 ,…,x n), которые являются реализациями случайных величин L (X 1 ,…,X n) и U (X 1 ,…,X n), таких, что

Граничные точки доверительного интервала и называются доверительными пределами .

Интерпретация доверительного интервала, основанная на интуиции, будет следующей: если p велико (скажем, 0,95 или 0,99), то доверительный интервал почти наверняка содержит истинное значение θ .

^ Описательный (дескриптивный анализ).

Этот вид анализа включает описательное представление отдельных переменных. К нему относятся создание частотной таблицы, вычисление статистических характеристик или графическое представление. Частотные таблицы строятся для переменных, относящихся к номинальной шкале и для порядковых переменных, имеющих не слишком много категорий; об этом см. главы 6, 12 и 24.

Для переменных относящихся к номинальной шкале нельзя вычислить никаких значимых статистических характеристик. Наиболее часто для порядковых переменных и переменных, относящихся к интервальной шкале, но не подчиняющихся нормальному распределению, вычисляются медианы и оба квартиля (см. раздел 6.2); при небольшом числе категорий можно использовать вариант для концентрированных данных см. раздел 6.3).

Для переменных, относящихся к интервальной шкале и подчиняющихся нормальному распределению, чаще всего вычисляется среднее значение и стандартное отклонение пли стандартная ошибка (см. раздел 6.2). Однако следует выбрать только одну из этих двух характеристик разброса. Для переменных, относящихся ко всем статистическим шкалам, можно построить большое разнообразных графиков, на которых представлены частоты, средние значения или другие характеристики.

^ Аналитическая статистика.

Практически любой статистический анализ наряду с чисто описательными операциями включает те или иные аналитические методы (тесты значимости), при применении которых в конечном счете определяется вероятности ошибки р (см. раздел 5.3).

Большая группа тестов служит для выяснения того, различаются ли две или более различных выборки по своим средним значениям или медианам. При этом учитывается разница между независимыми выборками (разные наблюдения) и зависимыми выборками (разные переменные; см. раздел 5.1.3). В зависимости количества выборок (две или более), от того, зависимы ли выборки или нет, относятся ли переменные к интервальной или порядковой шкале, подчиняются ли нормальному распределению - применяются специализированные тесты (см. раздел 5.2).

Очень часто встречается ситуация, когда сравниваются различные группы наблюдений или значений переменных, относящихся к номинальной шкале. В этом случае строятся таблицы сопряженности (см. главу 11). Другая группа тестов касается исследования связей между двумя переменными, то есть выявления корреляций и восстановления регрессий (см. главу 15, раздел 16.1).

Кроме этих довольно простых статистических методов существуют также более сложные методы многомерного анализа, в которых обычно одновременно используется очень много переменных. К примеру, если требуется свести большое количество переменных к меньшему количеству "пучков переменных", называемых факторами, то проводится факторный анализ (глава 19). Если же наша цель, противоположна - объединить заданные наблюдения, образовав из них кластеры, то применяется кластерный анализ (глава 20).

В определенной группе многомерных тестов вводится различие между зависимой переменной, называемой также целевой и несколькими независимыми переменными (переменными влияния или прогнозирования).


^ Зависимая переменная

Независимые переменные

Многомерный метол

Дихотомическая

Любые

Двоичная логистическая регрессия (раздел 16.4); дискриминантный анализ (глава 18)

Дихотомическая



Логит-логарифмические линейные модели

С номинальной шкалой

С номинальной или порядковой шкалой

Мультиномиальная логистическая регрессия (раздел 16.5)

С порядковой шкалой

С номинальной или порядковой шкалой

Порядковая регрессия (раздел 16.6)

С интервальной шкалой

С номинальной или порядковой шкалой

Дисперсионный анализ (раздел 17.1)

С интервальной шкалой

Любые

Ковариационный анализ (раздел 17.2); множественный регрессионный анализ (раздел 16.2)

При мультиномиальной логистической регрессии и порядковой регрессии могут также использоваться ковариации, относящиеся к интервальной шкале.

Независимые переменные, относящиеся к номинальной шкале, при двоичной логистической регрессии, дискриминантном анализе и многозначном регрессионном анализе должны быть дихотомическими либо раскладываться на набор дихотомических переменных (см. раздел 16.2). Логит-логарифмические линейные модели рассматриваются не в этой книге, а во втором томе, посвященном методам исследования рынка и общественного мнения.


5.2. Типы статистических шкал

В эмпирическом исследовании могут встречаться, к примеру, следующие переменные (указано их наиболее вероятное кодирование):

Пол 1 = мужской
2 = женский
Семейное положение 1 = холост/не замужем
2 = женат/замужем
3 = вдовец/вдова
4 = разведен(а)
Курение 1 = некурящий
2 = изредка курящий
3 = интенсивно курящий
4 = очень интенсивно курящий
Месячный доход 1 = до 3000 DM
2 = 3001 - 5000 DM
3 = более 5000 DM
Коэффициент интеллекта (I.Q.)
Возраст (лет)

Рассмотрим сначала графу "Пол" . Мы видим, что назначение соответствия цифр 1 и 2 обоим полам абсолютно произвольно, их можно было поменять местами или обозначить другими цифрами. Мы, конечно, не имеем в виду, что женщины стоят на ступеньку ниже мужчин, или мужчины значат меньше, чем женщины. Следовательно, отдельным числам не соответствует никакою эмпирического значения. В этом случае говорят о переменных, относящихся к номинальной шкале . В нашем примере рассматривается переменная с номинальной шкалой, имеющая две категории. Такая переменная имеет еще одно название - дихотомическая .

Такая же ситуация и с переменной "Семейное положение" . Здесь также соответствие - между числами и категориями семейного положения не имеет никакого эмпирического значения. Но в отличии от Пола, эта переменная не является дихотомической - у нее четыре категории вместо двух. Возможности обработки переменных, относящихся к номинальной шкале очень ограничены. Собственно говоря, можно провести только частотный анализ таких переменных. К примеру, расчет среднего значения для переменной Семейное положение, совершенно бессмысленен. Переменные, относящиеся к номинальной шкале часто используются для группировки, с помощью которых совокупная выборка разбивается по категориям этих переменных. В частичных выборках проводятся одинаковые статистические тесты, результаты которых затем сравниваются друг с другом.

В качестве следующего примера рассмотрим переменную "Курение" . Здесь кодовым цифрам присваивается эмпирическое значение в том порядке, в котором они расположены в списке. Переменная Курение, в итоге, сортирована в порядке значимости снизу вверх: умеренный курильщик курит больше, нежели некурящий, а сильно курящий - больше, чем умеренный курильщик и т.д. Такие переменные, для которых используются численные значения, соответствующие постепенному изменению эмпирической значимости, относятся к порядковой шкале .

Однако эмпирическая значимость этих переменных не зависит от разницы между соседними численными значениями. Так, несмотря на то, что разница между значениями кодовых чисел для некурящего и изредка курящего и изредка курящего и интенсивно курящего в обоих случаях равна единице, нельзя утверждать, что фактическое различие между некурящим и изредка курящим и между изредка курящим и интенсивно курящим одинаково. Для этого данные понятия слишком расплывчаты.

К классическими примерами переменных с порядковой шкалой относятся также переменные, полученные в результате объединения величин в классы, как "Месячный доход" в нашем примере.

Кроме частотного анализа, переменные с порядковой шкалой допускают также вычисление определенных статистических характеристик, таких как медианы. В некоторых случаях возможно вычисление среднего значения. Если должна быть установлена связь (корреляция) с другими переменными такого рода, для этой цели можно использовать коэффициент ранговой корреляции .

Для сравнения различных выборок переменных, относящихся к порядковой шкале, могут применяться непараметрические тесты , формулы которых оперируют рангами.

Рассмотрим теперь "Коэффициент интеллекта (IQ) ". Не только его абсолютные значения отображают порядковое отношение между респондентами, но и разница между двумя значениями также имеет эмпирическую значимость. Например, если у Ганса IQ равен 80, у Фрица - 120 и у Отто - 160, можно сказать, что Фриц в сравнении с Гансом настолько же интеллектуальнее насколько Отто в сравнении с Фрицем (а именно - на 40 единиц IQ). Однако, основываясь только на том, что значение IQ у Ганса в два раза меньше, чем у Отто, исходя из определения IQ нельзя сделать вывод, что Отто вдвое умнее Ганса.

Такие переменные, у которых разность (интервал) между двумя значениями имеет эмпирическую значимость, относятся к интервальной шкале . Они могут обрабатываться любыми статистическим методами без ограничений. Так, к примеру, среднее значение является полноценным статистическим показателем для характеристики таких переменных.

Наконец, мы достигли наивысшей статистической шкалы, на которой эмпирическую значимость приобретает и отношение двух значений. Примером переменной, относящейся к такой шкале является "Возраст ": если Максу 30 лет, а Морицу 60, можно сказать, что Мориц вдвое старше Макса. Шкала, к которой относятся данные называется шкалой отношений . К этой шкале относятся все интервальные переменные, которые имеют абсолютную нулевую точку. Поэтому переменные относящиеся к интервальной шкале, как правило, имеют и шкалу отношений.

Подводя итоги, можно сказать, что существует четыре вида статистических шкал, на которых могут сравниваться численные значения:

На практике, в том числе в SPSS, различие между переменными, относящимися к интервальной шкале и шкале отношений обычно несущественно. То есть в дальнейшем практически всегда речь будет идти о переменных, относящихся к интервальной шкале .

При построении статистических показателей используют различные измерительные шкалы. Измерительная шкала - система чисел или иных элементов, принятых для измерения или оценки тех или иных величин. В определении шкал участвуют понятия равенства, порядка, расстояния между пунктами (интервалы), начала отсчета и единицы измерения. В зависимости от наличия или отсутствия этих элементов возникают различные типы шкал:

Номинальная шкала (шкала наименований). Число на номинальной шкале служит лишь для опознавания, играет роль ярлыка (метки). К таким числам неприменимы обычные правила арифметики. Номинальная шкала обладает только свойствами симметричности и транзитивности. Симметричность означает, что отношения, существующие между градациями х 1 и х 2 , имеют место и между х 2 и х 1 . Транзитивность выражается в следующем: если х 1 =х 2 , и х 2 =х 3 , то х 1 =х 3 . Примером измерения в номинальной шкале является классификация отраслей экономики, категорий работников и т.п.

Порядковая (ординальная или ранговая) шкала. Это шкала, на которой числа могут быть упорядочены. Однако определить и интерпретировать расстояние между числами на этой шкале невозможно. Например, показатель «качество продукции», принимающий значения: высшая категория (соответствие лучшим отечественным и мировым достижениям), первая категория (соответствие современным требованиям стандартов), вторая категория (морально устаревшая продукция) измеряются в ординальной шкале. Оценки: отлично, хорошо, удовлетворительно, неудовлетворительно также измеряются в ординальной шкале. Шкала порядка допускает операции: «равенство-неравенство», «больше-меньше».

Количественные (метрические) шкалы подразделяются на интервальные и пропорциональные.

Интервальная шкала (порядковая шкала с интервалом). Эта шкала позволяет не только установить порядок, но и определить интервал между числами. Величина интервала устанавливается по косвенным признакам, или на основе субъективных оценок. Интервальная шкала допускает операции: «равенство-неравенство», «больше-меньше», «равенство-неравенство интервалов» и операцию вычитания, на основе которой устанавливается величина интервала. По интервальной шкале измеряется календарное время, температура.

Пропорциональная шкала (отношений). Представляет собой интервальную шкалу с естественным началом отсчета (абсолютным нулем). Пропорциональная шкала в отличие от предыдущих шкал позволяет выяснить во сколько раз один признак больше или меньше другого. По шкале отношений можно измерить рост, вес, цену и т.д.

Метрические шкалы позволяют выполнять различные арифметические операции: сложение, умножение, деление. Такие шкалы - основа всевозможных статистических операций.

Включайся в дискуссию
Читайте также
Шкала измерений в социологии Статистические методы в психологии
Ортогональная система векторов Ортогональная система векторов
Несколько слов о стихотворениях Ф