НОУ ІНТУЇТ | лекція | опис даних
5.3. Шкали вимірювання, інваріантні алгоритми і середні величини
Інваріантні алгоритми та середні величини. Основна вимога до алгоритмів аналізу даних формулюється в теорії вимірювань (див. "Різні види статистичних даних" ) Так: висновки, зроблені на основі даних, виміряних в шкалі певного типу, не повинні мінятися при припустимому перетворення шкали вимірювання цих даних. Іншими словами, висновки повинні бути інваріантні по відношенню до допустимих перетворень шкали.
Таким чином, одна з основних цілей теорії вимірювань - боротьба з суб'єктивізмом дослідника при приписуванні чисельних значень реальним об'єктам. Так, відстані можна вимірювати в аршинах, метрах, мікронах, милях, парсеках і інших одиницях виміру. Масу (вага) - у пудах, кілограмах, фунтах і ін. Ціни на товари і послуги можна вказувати в юанях, рублях, тенге, гривнях, латах, кронах, марках, доларах США та інших валютах (при фіксованих курсах перерахунку). Підкреслимо дуже важливе, хоча і цілком очевидна обставина: вибір одиниць вимірювання залежить від дослідника, тобто суб'єктивний. Статистичні висновки можуть бути адекватні реальності тільки тоді, коли вони не залежать від того, яку одиницю виміру віддасть перевагу дослідник, тобто коли вони інваріантні щодо допустимої перетворення шкали.
Виявляється, сформульоване умова є досить сильним. З багатьох алгоритмів аналізу статистичних даних йому задовольняють лише деякі. Покажемо це на прикладі порівняння середніх величин.
нехай - вибірка обсягу . Часто використовують середнє арифметичне
Використання середнього арифметичного настільки звично, що друге слово в терміні часто опускають. І кажуть про середню заробітну плату, середній дохід і інших середніх для конкретних економічних даних, маючи на увазі під "середнім" середнє арифметичне. Така традиція може призводити до помилкових висновків. Покажемо це на прикладі розрахунку середньої заробітної плати (середнього доходу) працівників умовного підприємства ( табл.5.4 ). Таблиця 5.4. Чисельність працівників різних категорій, їх заробітна плата і сумарні доходи (в ум. Од.) № п / п Категорія працівників Кількість працівників Заробітна плата Сумарні доходи 1 Низькокваліфіковані робочі 40 100 4000 2 Висококваліфіковані робітники 30 200 6000 3 Інженери і службовці -25 300 7500 4 Менеджери 4 1000 4000 5 Генеральний директор (власник) 1 18500 18500 6 Всього 100 40000
Перші три рядки в табл.5.4 навряд чи вимагають пояснень. Менеджери - це директори по напрямках, а саме з виробництва (головний інженер), по фінансам, по маркетингу і збуту, по персоналу (по кадрам). Власник сам керує підприємством в якості генерального директора. У стовпці "заробітна плата" вказані доходи одного працівника відповідної категорії, а в стовпці "сумарні доходи" - доходи всіх працівників відповідної категорії.
Фонд оплати праці становить 40000 одиниць, працівників всього 100, отже, середня заробітна плата становить 40000/100 = 400 одиниць. Однак ця середня арифметична величина явно не відповідає інтуїтивному уявленню про "середню заробітну плату". З 100 працівників лише 5 мають заробітну плату, її перевищує, а зарплата решти 95 істотно менше середньої арифметичної. Причина очевидна: заробітна плата одного людини - генерального директора - перевищує заробітну плату 95 працівників - низькокваліфікованих і висококваліфікованих робітників, інженерів і службовців.
Ситуація нагадує описану в відомому оповіданні про лікарню, в якій 10 хворих, з них у 9 температура 40 С, а один вже відмучився, лежить в морзі з температурою 0 С. Тим часом середня температура по лікарні дорівнює 36 З - краще не буває!
Сказане показує, що середнє арифметичне можна використовувати лише для досить однорідних сукупностей (без великих викидів в ту чи іншу сторону). А які середні доцільно використовувати для опису заробітної плати? Цілком природно використовувати медіану. для даних табл.5.4 медіана - середнє арифметичне зарплат 50-го і 51-го працівника, якщо заробітні плати всіх 100 працівників розташовані в порядку неспадання. Спочатку йдуть заробітні плати 40 низькокваліфікованих робітників, а потім - з 41-го до 70-го працівника - заробітні плати висококваліфікованих робітників. Отже, медіана потрапляє саме на них і дорівнює 200. У 50-ти працівників заробітна плата не перевищує 200, і у 50-ти - не менше 200, тому медіана показує "центр", біля якого групується основна маса досліджуваних величин. Ще одна середня величина - мода, найбільш часто зустрічається значення. В даному випадку це заробітна плата низькокваліфікованих робітників, тобто 100. Таким чином, для опису заробітної плати маємо три середні величини - моду (100 од.), Медіану (200 од.) І середнє арифметичне (400 од.). Для спостерігаються в реальному житті розподілів доходів і заробітної плати справедлива та ж закономірність: мода менше медіани, а медіана менше середнього арифметичного.
Для чого в технічних, економічних, медичних та інших дослідженнях використовуються середні величини? Зазвичай для того, щоб замінити сукупність чисел одним числом, щоб порівнювати сукупності за допомогою середніх.
Нехай, наприклад, - сукупність оцінок експертів, "виставлених" одному об'єкту експертизи (наприклад, одному з варіантів стратегічного розвитку фірми), - другого (іншим варіантом такого розвитку). Як порівнювати ці сукупності? Очевидно, найпростіший спосіб - за середнім значенням.
А як обчислювати середні? Відомі різні види середніх величин: середнє арифметичне, медіана, мода, середнє геометричне, середнє гармонійне, середнє квадратичне. Нагадаємо, що загальне поняття середньої величини введено французьким математиком першої половини ХІХ ст. академіком О. Коші. Воно таке: середньою величиною є будь-яка функція така, що при всіх можливих значеннях аргументів значення цієї функції не менше, ніж мінімальна з чисел , І не більше, ніж максимальне з цих чисел. Всі перераховані вище види середніх є середніми по Коші.
При допустимому перетворення шкали значення середньої величини, очевидно, змінюється. Але висновки про те, для якої сукупності середнє більше, а для якої - менше, не повинні мінятися (відповідно до вимоги інваріантності висновків, прийнятому як основна вимога в теорії вимірювань). Сформулюємо відповідну математичну задачу пошуку виду середніх величин, результат порівняння яких стійкий щодо допустимих перетворень шкали.
нехай - середнє по Коші. Нехай середнє по першій сукупності менше середнього по другій сукупності:
Тоді відповідно до теорії вимірювань для стійкості результату порівняння середніх необхідно, щоб для будь-якого допустимого перетворення з групи допустимих перетворень у відповідній шкалі було справедливо також нерівність
тобто середнє перетворених значень з перших сукупності також було менше середнього перетворених значень для другої сукупності. Причому сформульоване умова повинна бути вірно для будь-яких двох сукупностей і . І, нагадаємо, для будь-якого допустимого перетворення. Середні величини, що задовольняють сформульованим умові, назвемо допустимими (у відповідній шкалі). Відповідно до теорії вимірювань тільки такими середніми можна користуватися при аналізі думок експертів і інших даних, виміряних в розглянутій шкалою.
За допомогою математичної теорії, розвинутої в монографії [ [1.15] ], Вдається описати вид допустимих середніх в основних шкалах. Відразу ясно, що для даних, виміряних в шкалі найменувань, як середнього годиться тільки мода.
Середні величини в порядкової шкалою. Розглянемо обробку, для визначеності, думок експертів, виміряних в порядкової шкалою. Справедливо наступне твердження.
Теорема 1. З усіх середніх за Коші допустимими середніми в порядкової шкалою є тільки члени варіаційного ряду (порядкові статистики).
Теорема 1 справедлива за умови, що середнє є безперервною (за сукупністю змінних) і симетричної функцією. Останнє означає, що при перестановці аргументів значення функції не змінюється. Ця умова є цілком природним, бо середню величину ми знаходимо для сукупності (множини), а не для послідовності. Безліч не змінюється в залежності від того, в якій послідовності ми перераховуємо його елементи.
Згідно з теоремою 1 в якості середнього для даних, виміряних в порядкової шкалою, можна використовувати, зокрема, медіану (при непарному обсязі вибірки). При парному ж обсязі слід застосовувати один з двох центральних членів варіаційного ряду - як їх іноді називають, ліву медіану або праву медіану. Моду теж можна використовувати - вона завжди є членом варіаційного ряду. Але ніколи не можна розраховувати середнє арифметичне, середнє геометричне і т.д.
Наведемо чисельний приклад, що показує некоректність використання середнього арифметичного в порядкової шкалою. нехай . тоді , Що менше, ніж . Нехай строго зростаюче перетворення таке, що . Таких перетворень багато. Наприклад, можна покласти при , Що не перевищують 8, і для , Великих 8. Тоді , Що більше, ніж . Як бачимо, в результаті допустимого, тобто строго зростаючого перетворення шкали впорядкованість середніх величин змінилася.
Таким чином, теорія вимірювань виносить жорсткий вирок середньому арифметичному - використовувати його в порядкової шкалою можна. Однак ж ті, хто не знає теорії вимірювань, використовують його. Чи завжди вони помиляються? Виявляється, можна в якійсь мірі реабілітувати середнє арифметичне, якщо перейти до ймовірнісної постановці і до того ж задовольнитися результатами для великих обсягів вибірок. У монографії [ [1.15] ] Отримано також наступне твердження.
Теорема 2. нехай - незалежні однаково розподілені випадкові величини з функцією розподілу , а - незалежні однаково розподілені випадкові величини з функцією розподілу , Причому вибірки і незалежні між собою і . Для того, щоб ймовірність події
прагнула до 1 при для будь-якої строго зростаючої безперервної функції , Що задовольняє умові необхідно і достатньо, щоб при всіх виконувалося нерівність , Причому існувало число , Для якого .
Примітка. Умова з верхньою межею носить чисто внутріматематіческіе характер. фактично функція - довільне припустиме перетворення в порядкової шкалою.
Згідно з теоремою 2 середнім арифметичним можна користуватися і в порядкової шкалою, якщо порівнюються вибірки з двох розподілів, які відповідають наведеним в теоремі нерівності. Простіше кажучи, одна з функцій розподілу повинна завжди лежати над іншою. Функції розподілу не можуть перетинатися, їм дозволяється лише торкатися один одного. Це умова виконана, наприклад, якщо функції розподілу відрізняються тільки зрушенням, тобто
при деякому . Остання умова виконується, якщо два значення деякої величини вимірюються за допомогою одного і того ж засоби вимірювання, у якого розподіл похибок не змінюється при переході від вимірювання одного значення розглянутої величини до вимірювання іншого.
Середні за Колмогорова. Природна система аксіом (вимог до середніх величин) призводить до так званим асоціативне середнім. Їх загальний вигляд знайшов в 1930 р А.Н.Колмогоров [ [5.9] ]. Тепер їх називають "середніми за Колмогорова". Вони є узагальненням кількох з перелічених вище середніх.
для чисел середнє за Колмогорова обчислюється за формулою
де - строго монотонна функція (тобто строго зростаюча або строго спадна), - функція, обернена до . Серед середніх за Колмогорова - багато добре відомих персонажів. Так, якщо , То середнє за Колмогорова - це середнє арифметичне, якщо - середнє геометричне, якщо - середнє гармонійне, якщо - середньоквадратичне, і т.д. (В останніх трьох випадках усереднюються позитивні величини). Середнє по Колмогорова - окремий випадок середнього по Коші. З іншого боку, такі популярні середні, як медіана і мода, не можна уявити у вигляді середніх за Колмогорова. У монографії [ [1.15] ] Доведені наступні твердження.
Теорема 3. При справедливості деяких внутріматематіческіе умов регулярності в шкалі інтервалів з усіх середніх за Колмогорова допустимим є тільки середнє арифметичне.
Таким чином, середнє геометричне або середньоквадратичне температур (в шкалою Цельсія), потенційних енергій або координат точок не мають сенсу. В якості середнього треба застосовувати середнє арифметичне. А також можна використовувати медіану або моду.
Теорема 4. При справедливості деяких внутріматематіческіе умов регулярності в шкалі відносин з усіх середніх за Колмогорова допустимими є тільки статечні середні з і середнє геометричне.
Зауваження. Середнє геометричне є межею статечних середніх при .
Чи є середні за Колмогорова, якими можна користуватися в шкалі відносин? Звичайно є. Наприклад, з .
Аналогічно середнім величинам можуть бути вивчені і інші статистичні характеристики - показники розкиду, зв'язку, відстані і ін. (Див., Наприклад, [ [1.15] ]). Неважко показати, наприклад, що коефіцієнт кореляції не змінюється при будь-якому допустимому перетворення в шкалі інтервалів, як і ставлення дисперсій. Дисперсія не змінюється в шкалі різниць, коефіцієнт варіації - в шкалі відносин, і т.д.
Наведені вище результати про середні величини широко застосовуються, причому не тільки в економіці, менеджменті, теорії експертних оцінок або соціології, а й в інженерній справі, наприклад, для аналізу методів агрегування датчиків в АСУ ТП доменних печей. Велико прикладне значення теорії вимірювань в задачах стандартизації та управління якістю, зокрема, в кваліметрії. Тут є і цікаві теоретичні результати. Так, наприклад, будь-яка зміна коефіцієнтів вагомості одиничних показників якості продукції призводить до зміни впорядкування виробів по середньозваженому показнику (ця теорема доведена проф. В.В. Подиновский).
При підготовці та прийнятті рішень необхідно використовувати тільки інваріантні алгоритми обробки даних. У цьому підрозділі показано, що вимога інваріантності виділяє з багатьох алгоритмів усереднення лише деякі, що відповідають використовуваним шкалами вимірювання. Інваріантні алгоритми в загальному випадку розглядаються в математичній теорії вимірювань [ [5.25] ]. Націлене на прикладні дослідження виклад теорії вимірювань дається в монографіях [ [1.15] , [2.15] ].
А які середні доцільно використовувати для опису заробітної плати?Для чого в технічних, економічних, медичних та інших дослідженнях використовуються середні величини?
Як порівнювати ці сукупності?
А як обчислювати середні?
Чи завжди вони помиляються?
Чи є середні за Колмогорова, якими можна користуватися в шкалі відносин?