О. В. Винославська, О. А. Бреусенко-Кузнєцов, В. Л. Зливков,
А. Ш. Апішева, О. С. Васильєва.

За наук. ред. О. В. Винославської.

Психологія

Навчальний посібник

Київ
ІНКОС
2005

Математичні методи обробки матеріалів психологічних досліджень

Статистичне групування. Дані, що були отримані в процесі психологічного дослідження, можуть бути систематизовані за допомогою простого або перехресного групування. Просте групування полягає в упорядкуванні або класифікації за однією ознакою. Залежно від гіпотези, усіх випробуваних, що увійшли до вибіркової сукупності, можна згрупувати за певними ознаками: статтю, віком, типом темпераменту, рівнем розвитку здібностей тощо.

Результат групування одиниць спостереження за будь-якою ознакою називають статистичним рядом. Ознаку, за якою групують, позначимо х.

Приклад 1. Припустимо, що х - це обсяг уваги кожного студента в академічній групі. Отримаємо неупорядкований ряд окремих спостережень:

6,8,4,7,8,5,9,6,7,7,8,7,7,6,9,5,7,8 (об'єктів).

Якщо окремі спостереження записати у порядку збільшення вказаних вище значень ознаки, то отримаємо варіаційний ряд:

4,5,5,6, б, 6,7,7,7,7,7,7,8,8,8,8,9,9 (об'єктів).

Далі можна підрахувати, як часто кожне значення цієї ознаки зустрічається в сукупності. В результаті отримаємо частотний розподіл для даної ознаки. Іноді його називають емпіричним або статистичним розподілом. Для прикладу 1 частотний розподіл має вигляд, наведений у таблиці 1.

Таблиця 1
Обсяг уваги x_i	Частота f_i	Накопичена частота _{f_{н i}}
4 5 6 7 8 9	1 2 3 6 4 2	1 3 6 12 16 18
Кількість значень k=6	Кількість студентів n=18	-

Кожне окреме значення ознаки позначають х₁, х₂, х₃, ..., х_k. У наведеному прикладі це 4,5,6,7,8,9 (об'єктів), а кількість значень k = 6.

Абсолютні числа, які показують, скільки разів зустрічається те чи інше значення ознаки х, називають частотами і позначають відповідно f₁, f₂, f₃, ..., f_k.

Відносною частотою називають долю значень ознаки в загальному числі спостережень і позначають ω₁, ω₂, ω₃, ..., ω_k.

Наприклад, для наведеного в таблиці 1 частотного розподілу частота найбільшого значення ознаки 9 об'єктів дорівнює 2, а відносна частота

ω₆=f₆/n=2/18=0,11. (1)

Відносну частоту звичайно виражають у відсотках: ω₆=11%.

Згруповані дані. Як правило, для подальшого статистичного опрацювання або більш наочного подання даних окремі значення ознак об'єднують в групи (інтервали). В такому випадку частоти співвідносять вже не з кожним окремим значенням ознаки, а з рядом значень, які потрапляють у певний інтервал. Розподіл обсягу уваги для вищенаведеного прикладу представлений у вигляді інтервального ряду в таблиці 2.

Таблиця 2
Інтервали обсягу уваги m	Частота f	Відносна частота ω, %	Накопичена частота f_н	Накопичена відносна частота ω_н, %
4-5 6-7 8-9	3 9 6	16,7 50,0 33,3	3 12 18	16,7 66,7 100,0
m=3	18	100	-	-

На відміну від простого групування, яке виконується за однією ознакою, перехресне групування являє собою зв'язування фактів за рядом ознак, що були виділені у гіпотезах. Перехресне групування дозволяє визначити тісноту зв'язків, а в деяких випадках - і напрям взаємодії.

Варіаційний аналіз. Групування - це лише перший етап статистичного аналізу отриманих даних. Наступний крок опрацювання полягає в отриманні деяких узагальнюючих характеристик, які дозволяють глибше зрозуміти особливості одиниці спостереження. Сюди перш за все відносять середнє значення ознаки, навколо якого варіюють інші її значення, а також міру розсіювання ознаки. До середніх величин у математичній статистиці відносять середнє арифметичне, медіану, моду, до показників міри розсіяння - варіаційний розмах, дисперсію, середнє квадратичне відхилення тощо.

Середнє арифметичне значення є часткою від поділу суми всіх значень ознаки на кількість вимірів. Позначається воно x. Формула для обчислення має вигляд:

x=(x₁+x₂+x₃+...+x_n)/n=(1/n)*Σx_i , (2)

де x₁, ..., х_n - значення ознаки; n - кількість вимірів (або випробуваних).

Отже, середнє значення обсягу уваги, характерне для групи студентів (приклад 1) буде таким:

x=(6+8+4+7+8+5+9+6+7+7+8+7+7+6+9+5+7+8)/18=6,9(об'єктів).

Необхідність визначення середнього значення ознаки особливо часто виникає за результатами групування. В цьому випадку користуються середнім арифметичним зваженим значенням ознаки, яке визначається за формулою:

x=(x₁f₁+x₂f₂+x₃f₃+...+x_kf_k)/(f₁+f₂+f₃+...+f_k) (3)

де x₁, x₂, x₃,..., x_k - варіанти значень ознаки; f₁, f₂, f₃, ..., f_k - частоти варіантів значень ознаки.

Для прикладу 1 середнє зважене значення обсягу уваги буде таким:

x=(4*1+5*2+6*3+7*6+8*4+9*2)/(1+2+3+6+4+2)=124/18=6,9(об'єктів).

Медіаною (Me) називають значення ознаки, яке знаходиться всередині варіаційного ряду і поділяє його строго навпіл. Щоб знайти медіану, спочатку визначають її порядковий номер. Для цього при непарному числі одиниць спостереження до суми усіх частот додається одиниця і все ділять на два. При парному числі одиниць спостереження в ряду будуть дві середні одиниці і за усіма правилами медіана має визначатися як середня із значень цих двох одиниць. Проте на практиці при парному числі одиниць спостереження медіана визначається як значення ознаки тієї одиниці, порядковий номер якої дорівнює загальній сумі частот, поділеній на 2. Знаючи порядковий номер медіани, легко за накопиченими частотами знайти її значення.

Обчислимо значення медіани для прикладу 1 (таблиця 1), Поділивши суму частот на 2, визначаємо порядковий номер медіани. Він дорівнює 18:2=9. По накопиченій частоті f_н=12 визначаємо, що всі окремі спостереження з 7 по 12 мають значення 7. Отже, медіана Me - 7.

В інтервальних рядах з різними значеннями частот; обчислення медіани складається з двох етапів: спочатку знаходять медіанний інтервал, якому відповідає перша з накопичених частот, що перевищує половину всього обсягу сукупності, а потім знаходять значення медіани за формулою

Me=x₀+h/ω_Me(1/2*Σω_i-ω_н(Me-1)) (4)

де х₀ - початок (нижня границя) медіанного інтервалу; h - величина медіанного інтервалу;

Σω_i - сума відносних частот;

ω_н(Me-1) - відносна частота, що накопичена до медіанного інтервалу;

ω_Me - відносна частота медіанного інтервалу.

Проведемо обчислення за даними таблиці 2, де в останньому стовпчику наведені відносні накопичені частоти. Перша з них, що перевищує половину сукупності, дорівнює 66,7%, Отже, медіана належить інтервалу 6-7 об'єктів. Тому

Me=6+1/50(1/2*100-16,7)=6,7 (об'єктів).

Мода. Модою (Mo) в математичній статистиці називають значення ознаки, яке частіше за все зустрічається в даній сукупності. Так, у прикладі 1 модою буде обсяг уваги 7 об'єктів, оскільки саме це значення зустрічається у виборці найчастіше.

Варіаційний розмах - це різниця між максимальним та мінімальним значеннями ознаки у даній сукупності. Для наведеного вище прикладу варіаційний розмах дорівнює 9-4=5 (об'єктів).

Дисперсія. Дисперсією називається величина, яка дорівнює середньому значенню квадрата відхилень окремих значень ознак від середньої арифметичної.

Перевірка статистичних гіпотез полягає у перевірці припущень про характер розподілу випадкових величин та про зв'язок між ними, про належність даних до однієї генеральної сукупності, про значимість відмінностей тощо.

Кореляційний аналіз призначений для оцінювання форми, знаку й тісноти зв'язку між кількома ознаками або факторами, що досліджуються. При визначенні форми зв'язку розглядається її лінійність або нелінійність.

Регресійний аналіз дозволяє вивчати залежності однієї або декількох середніх величин від інших. Поняття регресійного аналізу запровадив Ф. Гальтон, який встановив факт певного співвідношення між зростом батьків і їх дорослих дітей. Він помітив, що у батьків найнижчого зросту діти виявлялися трохи вищими, а у батьків найвищого зросту - трохи нижчими. Такого роду закономірність він назвав регресією. Регресійний аналіз застосовується переважно в емпіричних психологічних дослідженнях при розв'язанні завдань, пов'язаних з оцінюванням будь-якого впливу (наприклад, впливу мотивів на поведінку), при конструюванні психологічних тестів тощо.

Факторний аналіз - метод багатофакторної математичної статистики, який застосовується при дослідженні статистично пов'язаних ознак з метою виявлення певної кількості прихованих від безпосереднього спостереження факторів. Розроблений для потреб психології, факторний аналіз згодом набув широкого розповсюдження в економіці, медицині, соціологи та інших науках, які мають величезну кількість; змінних, з яких необхідно виділити провідні.

Основні ідеї факторного аналізу були закладені в працях відомого англійського психолога і антрополога Ф. Гальтона (1822-1911), який зробив значний внесок у дослідження індивідуальних відмінностей. Надалі продовжували розвивати факторний аналіз багато вчених, але подальшому його впровадженню в психологію ми більш за все завдячуємо Ч. Спірмену, Л. Терстоуну, Р. Кеттелу, Г. Айзенку. Необхідність застосування факторного аналізу в психології в першу чергу витікає з багатовимірності об'єктів, які вивчає ця дисципліна. За допомогою факторного аналізу не просто встановлюється зв'язок змінювання однієї змінної в залежності від іншої змінної, а визначається міра цього зв'язку і встановлюються основні фактори, що лежать в основі зазначених змін.

Основними цілями застосування факторного аналізу в психології є такі:

1. Зниження кількості змінних, що використовуються, за рахунок їх пояснення меншим числом факторів, узагальнення отриманих даних.

2. Групування, структурування і компактна візуалізація отриманих даних.

3. Опосередковане, непряме оцінювання змінних, що вивчаються, у випадку неможливості або незручності їх прямого вимірювання.

4. Генерування нових ідей на етапі прогностичного аналізу. Оцінка відповідності емпіричних даних теорії, що використовується, на етапі її підтвердження.

В процесі дослідження із застосуванням факторного аналізу можна виділити три основні етапи:

I етап - збір емпіричних даних. Слід зазначити, що використання на цьому етапі різних варіантів бальних оцінок (шкал порядку) призводить до обмежень застосування факторного аналізу, оскільки його обчислювальні алгоритми вимагають, щоб вимірювання змінних, які спостерігаються, були проведені не нижче, ніж за шкалою інтервалів. Кількість змінних, що припадають на один фактор, має бути не менше трьох. Завершується перший етап обчисленням кореляційної матриці (матриці попарних кореляцій).

II етап - власне факторизація матриці кореляцій або виділення первісних (ортогональних) факторів. Сьогодні - це повністю комп'ютеризована процедура, яку можна знайти майже в усіх сучасних статистичних програмах, зокрема, «Stadia» й «SPSS».

III етап - змістовна інтерпретація результатів факторного аналізу.

Факторний аналіз є особливо продуктивним на початкових етапах наукових досліджень, коли необхідно виділити будь-які попередні закономірності в галузі, що досліджується. Це дозволяє майбутній експеримент зробити більш досконалим порівняно з експериментом на змінних, які обрані довільно або випадково.

О. В. Винославська, О. А. Бреусенко-Кузнєцов, В. Л. Зливков,А. Ш. Апішева, О. С. Васильєва.За наук. ред. О. В. Винославської.

Психологія

Навчальний посібник

КиївІНКОС2005

Математичні методи обробки матеріалів психологічних досліджень

О. В. Винославська, О. А. Бреусенко-Кузнєцов, В. Л. Зливков,
А. Ш. Апішева, О. С. Васильєва.

За наук. ред. О. В. Винославської.

Київ
ІНКОС
2005