Головна |
« Попередня | Наступна » | |
9.6. МНОЖИННА КОРЕЛЯЦІЯ |
||
Якщо позначити фактори хи х2, х3, хт, то лінійне рівняння множинної залежності може бути записано так: yXtiX2 ... Хт = b0 + biXi + b2X2-\-b3x3 + ... + Ьтхт. Позначимо номер спостереження (t = l, 2, 3, ..., м), номер незалежної змінної 0 = 1, 2, 3 ... .. т). Тоді матриці результатів спостережень можна записати так: х \ \ # 12 --- ХШ Х2 \ Х22-? - Х2т хз \ # 32 - - - хзт Х = (Х ^) = # «1 Х.п2 - - - Хп Y = (Yi) = У \ У2 Уп 207 206 Введемо тепер матричні позначення. Нехай X - матриця незалежних змінних (факторів), розмір якої визначається числом спостережень п і числом змінних т. Y-вектор залежної змінної. Транспоніруем матрицю X і позначимо її Хт. Система нормальних рівнянь у матричній формі записується таким чином: XTXB = XTY, де В - матриця-стовпець з коефіцієнтів регресії bo, bi, b2 ... . bm. Bo bi B = b2 Для визначення елементів матриці В необхідно знайти матрицю, зворотну матриці ХТХ, тобто (ХТХ) "! і вектор XTY: 2 Хц 2 ХцХг2 '' '2 ХцХт»' »» 2 УгХц i х * х = 2 xi2xn 2 xf2 - - -2 x ^ xim г ii 2 XimXii 2 XimXi2'' '2 Xim iii; A7K = 2 ytxi2 i -? - a i У рівнянні регресії зазвичай є вільний член, який ми позначили Ь0. Щоб знайти оцінку цього параметра, розширимо матрицю X, ввівши в неї змінну xio = l. Тоді матрицю X в розгорнутому вигляді можна записати в наступному вигляді: 1 X2J ДГ22 '"" * 2m +1 ЛГ31 X32 - -? X, Х = л3т Тоді 1 ДГщ Хп2 '- п 2хг1 2Xf | 2xjf 2Xjm 2 Xi \ Xim - 2 xirrt ^, ХцХ {г 2 Xim 208 * TY = 2y < 2 У \ Хц 2 ytXim Наступним етапом буде визначення матриці (ХТХ) _1, зворотної матриці ХТХ. Знайшовши зворотну матрицю (Х ^) -1, можна визначити елементи матриці В: В = (XTXJ-^ XTY). Після того як обчислені коефіцієнти регресії, запишемо Л матричне рівняння: Y = XB, де Л У1 ЬоХю biXl2 -? - bmxxm Л ЬоХ20 btx2i - - 'ЬтХ2т У2 Л b0Xno & l * nl - - Уп - bmXnm Y = У - вектор-стовпець значень результативної ознаки, отриманих за рівнянням регресії. п Л 2 (у,-К) 2 може бути знайдена в такий спосіб : 1 д л л л л л (yY) T (yY) = YiY-Y'ry-yiY + yiY - л Використовуючи матричні рівняння Y = XB і В = (XTX) w4XTY, отримаємо: YTY = YTY = (ХВ) TY = BTXTY. Тоді залишкова сума квадратів дорівнюватиме: BTXTY-2BTXTY + YTY = YTY - BTXTY. Знаючи параметри рівняння множинної залежності, можна розрахувати значення індексу кореляції за такою формулою: 1 = 2 'о », (9.2 Н де S2A-дисперсія емпіричних значень щодо зна-у * 1 чений, розрахованих за корреляционному рівнянню, яка визначається діленням залишкової суми квадратів на (я-т- 1); а2у - дисперсія емпіричних значень результативної ознаки. За параметрами отриманого рівняння ми можемо оцінити частку кожного з факторів у зміні рівня результативного показника у. Це може бути зроблено шляхом прямої оцінки по 14. Замовлення 47S9 209 величиною коефіцієнтів регресії при кожному з факторів, а також за коефіцієнтами еластичності Ех, і стандартизованим приватним коефіцієнтом регресії R- коефіцієнтам. Коефіцієнти рівняння множинної регресії показують ступінь впливу кожного фактора на аналізований показник при середньому рівні інших факторів. Приватні коефіцієнти еластичності показують, наскільки в середньому змінюється функція зі зміною аргументу від середнього значення на один відсоток при фіксованому положенні інших змінних, і розраховуються за формулою- Ех. = Bj - 'у Р-коефіцієнти показують, на яку частину середнього Квадрат-чеського відхилення ау зміниться залежна змінна у зі зміною відповідного фактора на величину свого середньо-квадратичного відхилення oXJ-Цей коефіцієнт дозволяє порівнювати вплив колеблемости різних факторів на варіацію досліджуваного показника. Fc = * r-- (9.22) Л] ОУ При побудові багатофакторних кореляційних моделей однією з передумов обгрунтованості кінцевих результатів є вимога можливо меншою коррелированности включених в модель ознак-факторів (відсутність мультіколлі-неарності). У разі наявності лінійної залежності між факторами система нормальних рівнянь не матиме однозначного рішення, в результаті чого коефіцієнти регресії й інші оцінки виявляться нестійкими. Крім того, наявність взаємозв'язку факторів ускладнює економічну інтерпретацію рівняння зв'язку, так як зміна одного з факторів тягне, як правило, зміна факторів, з ним пов'язаних. Для виключення муль-тіколлінеарності було запропоновано кілька методів. На практиці найчастіше використовують чисто емпіричний підхід до вирішення цієї проблеми1. Розглядається матриця парних коефіцієнтів кореляції (індекс 0 присвоєно результативному ознакою у), за якою можна оцінити ступінь взаємної коррелированности ознак-факторів (див. табл. 9.13). Якщо величина парного коефіцієнта, що враховує ступінь тісноти зв'язку між двома факторними ознаками, за абсолютною величиною 0,8 і більше, то такі фактори вважаються кіл-лінеарного. 210 ч Таблиця 9.13 ФАКТОРИ У X, Х1 XM У 1 ПО АЛЕ. . . ГО. . . Г ТО Х \ ПО 1 П2. . . ГЦ. . . Г ml Х2 П2 1. . . Г »? - - Гт2 ГО Гц ГЦ. . . 1. . . rmf> - - XM Г ТО Гт! Гт2. . . . . . 1 кореляції за значеннями парних коефіцієнтів може бути визначена таким чином: 1 г10 Г20 '' 'rm0 FLO 1 r12' '"ГП1? 20 r \ 1 лютого"' 'Гш2 # 2 = 1 - rто ГТ2 1 1 '12 ' 1т Г \ 1 лютого - ТТ2 F ml ГТ2 1 (9.23) Величина R2 звана коефіцієнтом детермінації, показує, яка частина загальної дисперсії результативної ознаки обумовлена варіацією ознак-факторів, включених в аналізованих рівняння кореляційної залежності. Величина сукупного коефіцієнта кореляції змінюється в межах від 0 до 1 і чисельно не може бути менше, ніж будь-який з утворюють його парних коефіцієнтів кореляції. Для випадку залежно результативної ознаки від двох факторних ознак формула сукупного коефіцієнта кореляції має вигляд: 4 * 2 = У 2 лютого г10 + г го-2? 10? ГГО - Гц (9.24) 'Розрахунок параметрів рівняння залежності для такого варіанту можна вести за формулами, в яких використовуються вже ви 14 * 211 чисельні значення парних коефіцієнтів кореляції і середніх квадратичних відхилень. Так для рівняння виду yXl, n = b0 + biXi + b2x2 параметри Оо. 0ь »2 можуть бути знайдені за такими формулами: 6, = - Ох, 1-Л2 12 січня , Су Г20 - Г10-Г \ г Ох, 1-Г2 2 грудня b0 = y-blxi-b2x2, де оу, aXl, Ах2-середні квадратичні відхилення відповідно ознак у, xi і х2; г10, Г20, г12 - парні коефіцієнти кореляції. Для більш глибокого дослідження зв'язків між явищами доцільно встановити ступінь тісноти зв'язку між результативною ознакою у і кожним з факторних ознак при виключенні впливу інших факторних ознак. Для вирішення поставленого завдання визначають так звані коефіцієнти приватної кореляції, що виявляють ступінь «чистого» впливу факторного ознаки на результативний ознака. Для розрахунку приватних коефіцієнтів кореляції можуть бути використані парні коефіцієнти кореляції. Для випадку залежності у від двох ознак можнр буде обчислити два коефіцієнти приватної кореляції: 1) приватний коефіцієнт кореляції ryXl.xl між результативною ознакою у та фактором х \ при елімінування фактора х2 показує, яку частину колеблемость у , викликана фактором х \, складає в колеблемости у під дією всіх факторів, крім фактора х2. Wx2 = ^ = r2i2) (1_; 22 ()) 2) другий приватний коефіцієнт кореляції ryXi.Xi характеризує залежність результативної ознаки від фактора х2 при виключенні впливу фактора Х \. Г УГГ-xi '? У (1-г2.о) (1-г2, 2) Для загального випадку приватні коефіцієнти кореляції можна визначити таким чином: г '= \ f V * m + l * l. * 2 ... * m V l_ # 2m '(9.25) де R2m - коефіцієнт детермінації результативної ознаки у з комплексом факторних ознак хи х2 ... xm; R2m + i - коефіцієнт детермінації результативної ознаки у з комплексом ознак хи х2, хт, хт + і Гухт +1. Х1> Х2, ...> Хт-приватний коефіцієнт кореляції у с факторингу ознакою xm + i при виключенні впливу факторних ознак х \, х2, ..., хт. При малих значеннях rvxm + l.XilX ... * m немає сенсу вводити в рівняння (т +1) фактор, так як ефективність нового рівняння регресії, що характеризує залежність від (m + l) чинників, зростає незначно. Побудова багатофакторних регресійних моделей дозволяє дати кількісний опис основних закономірностей досліджуваних явищ, виділити істотні фактори, що обумовлюють зміну економічних показників, і оцінити їх вплив. В-основному отримані моделі використовуються у двох напрямках-для порівняльного аналізу та прогнозування. Наприклад, для виявлення внутрішньогалузевих резервів підвищення ефективності виробництва розраховується рівняння множинної залежності, що розглядається в якості економіко-статистичної моделі - аналізованого показника ефективності і характеризує основні закономірності у формуванні цього показника для сукупності підприємств галузі. На основі такого рівняння можна проаналізувати і порівняти вплив кожного фактора на підвищення ефективності в середньому по галузі. Розбивши всі підприємства на групи, що розрізняються за умовами виробництва (наприклад, великі, середні, дрібні) або результатами виробничої діяльності (наприклад, передові, середні, відстаючі), можна за допомогою моделі відповідного показника ефективності порівняти результати діяльності цих груп підприємств між собою і зі середнім галузевим рівнем. Для цього в кожній виділеній групі знаходять середні значення результативних показників і визначають їх величину факторів. Множачи різниця середніх значень одних і тих же факторних ознак за різними групами на величину відповідних коефіцієнтів регресії в багатофакторної регресійної моделі, отримаємо ефект впливу на результативний показник різниці в рівнях факторів по групах. За результатами такого порівняння можна дати об'єктивну оцінку можливостей підвищення ефективності виробництва і виявити внутрішньогосподарські резерви в цілому по. галузі. Застосування регресійних моделей в прогнозуванні вимагає обережності в тих випадках, коли ми стикаємося з виходом за межі значень ознак, на основі яких було розраховано рівняння залежності. Необхідна перевірка можливості екстраполяції, пов'язана з оцінкою незмінності загальних умов формування рівнів ознак у сукупності. 212 |
||
« Попередня | Наступна » | |
|