В. Г. Городяненко

Соціологія

Підручник

Київ
Видавничий центр «Академія»
2003

Опис інформації та обчислення узагальнюючих параметрів

В емпіричній соціології нагромаджено немало статистичних процедур, за допомогою яких розрізнені дані, що містяться в окремих анкетах чи інших матеріалах соціологічних досліджень, адаптують для узагальнення, опису, аналізу, наукової інтерпретації. За результатами узагальнень складають певні висновки, вирішуючи завдання, поставлені у дослідженні. Внаслідок цих процедур з'являється реальна змога з'ясувати тенденції у досліджуваних процесах, явищах, виробити прогнози і практичні рекомендації, що відкривають вихід соціальної інформації у соціальну практику. Найчастіше статистичні методи аналізу соціальної інформації використовують для:

— опису інформації та обчислення узагальнюючих параметрів (одновимірна статистика);

— виміру зв'язку між окремими ознаками, отриманими у відповідях на різні запитання анкети, якщо як метод збору даних застосовувалося опитування, або контент-аналіз текстів ЗМІ, якщо використовувався метод аналізу документів (двовимірна статистика);

— проведення складних математичних процедур, які дають змогу проаналізувати водночас кілька взаємопов'язаних ознак (багатовимірна статистика).

Застосування методів математичної статистики забезпечує:

— стислий опис первинної соціологічної інформації, обчислення одновимірних розподілів, наочне уявлення її у вигляді таблиць, графіків, діаграм;

— обчислення зв'язків між ознаками досліджуваного суспільного явища, оцінку їх за допомогою статистичних коефіцієнтів зв'язку, застосування кореляційного, регресійного аналізу тощо;

— встановлення латентних (прихованих) факторів, які визначають взаємозв'язки всередині групи, ознак досліджуваного явища (факторний, латентно-структурний аналіз);

— класифікацію ознак та об'єктів, побудову типологій (кластерний аналіз, дискримінантний аналіз, факторний аналіз);

— перевірку (підтвердження чи спростування) вихідних гіпотез дослідження, формулювання нових проблем;

— вироблення коротко- і довгострокових прогнозів щодо функціонування та розвитку певного суспільного явища.

Використання методів математичної статистики передбачає певний набір попередніх процедур, до яких належать: підготовка анкети, іншого первинного матеріалу до обробки, яка може здійснюватися вручну чи автоматизовано; вибір рівня майбутнього аналізу (описовий чи пояснювальний); вибір конкретних статистичних процедур для обробки інформації.

В емпіричному дослідженні соціолог вивчає певну множину об'єктів, наприклад, колектив працівників підприємства. Кожному елементу множини притаманні певні властивості (ознаки), скажімо, стать, вік, задоволеність умовами праці. Кожний об'єкт має певне значення за кожною ознакою. Так, працівник має одне з двох можливих значень ознаки «стать» (чоловіча або жіноча), одне з трьох можливих значень ознаки «задоволеність умовами праці» (задоволений, не зовсім задоволений, зовсім незадоволений), певне значення ознаки «вік» (число повних років від 18 до 80) та ін.

Як правило, для спрощення обробки всі значення ознак кодують числами, тому дані для обробки становлять прямокутну таблицю (матрицю) чисел. Кожний рядок цієї таблиці відповідає одному об'єкту, а кожний стовпчик — певній ознаці. На перетині певного рядка та стовпчика цієї таблиці знаходиться значення певної ознаки певного об'єкта.

Ознаки поділяють на якісні та кількісні. Якісні ознаки не мають кількісного виразу («стать», «задоволеність умовами праці»). Кількісні ознаки мають одиниці вимірювання. Наприклад, одиницею вимірювання кількісної ознаки «вік» є рік, «заробітна плата» — гривня. Ці ознаки ще називають ознаками, заданими у метричній шкалі.

При кодуванні значень якісної ознаки числами можливі два суттєво відмінні варіанти. У першому значення якісної ознаки можна впорядковувати, тобто для будь-якої пари значень можна зазначити, яке з них відповідає сильнішому виявленню ознаки. Наприклад, значення «задоволений» відповідає інтенсивнішому виявленню ознаки «задоволеність умовами праці», ніж значення «не зовсім задоволений». У такому разі доцільно і числові коди добирати так, щоб сильнішому виявленню ознаки відповідало більше число. Так, для ознаки «задоволеність умовами праці» можна обрати такі числові коди значень: 3 — «задоволений»; 2 — «не зовсім задоволений»; 1 — «зовсім незадоволений». Такі якісні шкали ще називають порядковими шкалами, або шкалами рангів. У другому випадку значення якісної ознаки не піддаються жодному змістовному впорядкуванню. Наприклад, ознака «стать» містить два значення — «чоловіча» та «жіноча». Для значень ознак такого типу можна добирати будь-які числові коди. Головне — щоб різні значення мали різні коди (тобто не можна кодувати два різні значення ознаки одним числом). Такі якісні шкали ще називають номінальними шкалами. Як правило, для кодування значень ознак у номінальних шкалах використовують цілі додатні числа — 1, 2, 3 і т. д.

Соціологові постійно доводиться при складанні програми дослідження обирати (або навіть самостійно конструювати) шкали. Від того, наскільки вдало це буде зроблено, значною мірою залежить результат опрацювання отриманих даних. Крім того, вибір математичного методу аналізу даних тісно пов'язаний зі шкалами відповідних ознак. Якщо такий метод не відповідає даним, це дуже суттєва методична помилка, що може звести нанівець роботу зі збору даних та обчислення результатів.

Щоб первинні дані можна було використовувати для змістового аналізу і висновків, вони повинні бути незалежно упорядковані та опрацьовані. З цією метою застосовують спеціальні статистичні методи — групування, обчислення узагальнюючих параметрів та коефіцієнтів, кореляційний, кластерний, факторний аналізи та ін. Незалежно від методу аналізу, опрацювання даних починають з попереднього впорядкування інформації, здебільшого за допомогою статистичного групування та побудови статистичних таблиць.

Структуру сукупності об'єктів з точки зору однієї виокремленої ознаки доцільно вивчати за таблицею, в якій для кожного з можливих значень ознаки зафіксовано, скільки разів зустрічаються в сукупності об'єкти, що мають відповідне значення. Таку таблицю називають таблицею одновимірного розподілу, одновимірною таблицею, варіаційним рядом. Наприклад, для ознаки «задоволеність умовами праці» одновимірна таблиця може мати такий вигляд:

Таблиця 7

Ознака: «Задоволеність умовами праці»

Кількість об'єктів — 357. Для 348 об'єктів (що становить 97,48% від загальної сукупності) відоме значення ознаки «задоволеність умовами праці». Для інших об'єктів сукупності (в даному разі їх 9) значення цієї ознаки невідоме (наприклад, інформація зібрана методом опитування, і деякі працівники підприємства не захотіли відповідати на поставлене питання). Аналіз таблиці свідчить, що задоволених умовами праці — 45 (12,60% від загальної сукупності та 12,93% від кількості працівників, які відповіли на поставлене запитання). Переважна більшість працівників повністю або частково не задоволена умовами праці.

В одновимірній таблиці часто перший або другий стовпчики відсутні (тобто в таблиці зазначають або самі значення, або їх коди);

Неможливо перелічити всі можливі значення ознак, заданих у метричних шкалах. Отже, неможливо і безпосередньо побудувати одновимірну таблицю. За таких обставин усі можливі значення ознаки розбивають на інтервали, а потім будують таблицю. Так, для сукупності працівників даного підприємства всі значення ознаки «вік» перебувають між віком наймолодшого робітника (припустимо, 18 років) та віком найстаршого робітника (припустимо, 68). Розіб'ємо їх на 4 інтервали: від 18 до 25 років, від 26 до 40 років, від 41 до 59 років та від 60 до 68 років. Тоді одновимірна таблиця, що демонструє структуру сукупності працівників за віком, матиме такий вигляд:

Таблиця 8

Ознака: «Вік (інтервал)»

У цій таблиці відсутній стовпчик, в якому зазначені коди інтервалів, а оскільки відомий вік усіх працівників (є відповідні значення для всіх об'єктів), тому третій і четвертий стовпчики збігаються. Метрична ознака розбита у даній таблиці на різні за розміром (нерівномірні) інтервали. А нерідко доцільно розбивати весь діапазон значень на інтервали однакової довжини (рівномірні інтервали).

Для полегшення аналізу великої кількості таблиць та забезпечення можливості порівняння кількох з них обчислюють узагальнюючі характеристики рядів розподілу. Найчастіше використовують характеристику «середнє значення ознаки». Для кількісної ознаки обчислюють її середнє арифметичне значення щодо всіх об'єктів сукупності. Для якісних ознак такою узагальнюючою характеристикою ряду є «мода» — значення, що найчастіше зустрічається в одновимірній таблиці.

Щоб оцінити, наскільки репрезентує середнє значення весь ряд розподілу, обчислюють статистичні показники варіації ознак. Для кількісних ознак — це дисперсія, середнє квадратичне відхилення, коефіцієнт варіації. Для якісних ознак розроблені спеціальні індекси якісної варіації. Чим більше значення відповідного показника варіації, тим розсіяніші навколо середнього значення реальні значення ознаки, а отже, тим з більшою обережністю потрібно оперувати із середнім значенням при побудові змістових висновків.

Межі варіації також дають змогу оцінити, наскільки однорідною за певною ознакою є сукупність. Якщо сукупність за певною ознакою неоднорідна, може постати потреба поділити цю сукупність на кілька однорідних за цією ознакою частин та аналізувати кожну з них окремо. Припустимо, що вивчається задоволеність умовами праці на певному підприємстві. З логічних міркувань або за результатів попередніх досліджень відомо, що заробітна плата працівника впливає на його задоволеність умовами праці. Нехай коефіцієнт варіації заробітної плати для всієї сукупності працівників дорівнює 0,7. Тоді необхідно поділити всю сукупність працівників на групи, приблизно однакові за рівнем заробітної платні (щоб у кожній групі коефіцієнт варіації зарплати був нижчим від 0,4), та аналізувати задоволеність умовами праці окремо у кожній з них.

В. Г. Городяненко

Соціологія

Підручник

КиївВидавничий центр «Академія»2003

Опис інформації та обчислення узагальнюючих параметрів

Київ
Видавничий центр «Академія»
2003