Задание 1 3
Задание 2 11
Задание 1
Используя фактические значения независимых переменных (x_1 и x_2) и результирующего показателя (y), провести эконометрическое исследование зависимости y от x_1 и x_2:
Выбрать в качестве уравнения взаимосвязи переменных x_1, x_2 и y линейное регрессионное уравнение вида y=a_0+a_1 x_1+a_2 x_2+ε.
Найти коэффициенты парной корреляции факторов и построить матрицу парных коэффициентов корреляции. Сделать выводы о связи переменных уравнения регрессии
Рассчитать коэффициенты a ̂_0,a ̂_1,a ̂_2 выбранного уравнения. Для этого составить систему нормальных уравнений и найти ее решение методом определителей. Построить модель прогноза.
Вычислить индекс множественной корреляции.
Оценить качество построенного уравнения:
определить значимость коэффициентов регрессии с помощью t-критерия Стьюдента (при уровне значимости α=0.05);
с помощью F-критерия Фишера оценить статистическую надежность построенного уравнения (при уровне значимости α=0.05);
рассчитать частные критерии Фишера и оценить целесообразность включения в построенное уравнение фактора x_1 после фактора x_2 и фактора x_2 после фактора x_1;
оценить значимость коэффициентов при переменных x_1 и x_2 уравнения через значения частных критериев Фишера. Сравнить полученные результаты с результатами оценки значимости коэффициентов по критерию Стьюдента.
Рассчитать средние коэффициенты эластичности и с их помощью оценить степень влияния независимых переменных x_1 и x_2 на зависимую переменную y.
Построить частные уравнения регрессии.
Сделать все необходимые выводы по результатам выполнения каждого из пунктов задания.
В таблице 1 представлены данные (в у.е.) о стоимости основных фондов (x_1), численности рабочих (x_2) и выпуске продукции (y).
Таблица 1. Исходные данные
Выпуск продукции 7 7 7 8 8 9 9 12 12 14
Стоимость основных фондов 3,9 3,7 3,8 5,4 5,3 6 6,8 8 8,1 9,6
Численность рабочих 10 15 17 19 20 21 22 28 30 32
Получаемые результаты в ходе вычислений будут записываться в таблицу 2. Все расчеты произведены в сопутствующем файле Excel.
Таблица 2. Вычисления
1 2 3 4 5 6 7 8 9 10 Сумма Среднее σ
y 7 7 7 8 8 9 9 12 12 14 93 9,3 2,36854
x_1 3,9 3,7 3,8 5,4 5,3 6 6,8 8 8,1 9,6 60,6 6,06 1,93298
x_2 10 15 17 19 20 21 22 28 30 32 214 21,4 6,54523
yx_1 27,3 25,9 26,6 43,2 42,4 54 61,2 96 97,2 134,4 608,2 60,82 -
yx_2 70 105 119 152 160 189 198 336 360 448 2137 213,7 -
x_1 x_2 39 55,5 64,6 102,6 106 126 149,6 224 243 307,2 1417,5 141,75 -
x_1^2 15,21 13,69 14,44 29,16 28,09 36 46,24 64 65,61 92,16 404,6 - -
x_2^2 100 225 289 361 400 441 484 784 900 1024 5008 - -
(x_1-¯(x_1 ))^2 4,6656 5,5696 5,1076 0,4356 0,5776 0,0036 0,5476 3,7636 4,1616 12,532 37,36 - -
(x_2-¯(x_2 ))^2 129,96 40,96 19,36 5,76 1,96 0,16 0,36 43,56 73,96 112,36 428,4 - -
y ̂ 6,4122 6,5685 6,8053 8,4949 8,4681 9,216 10,061 11,643 11,88 13,473 93,02 - -
(y-y ̂ )^2 0,3456 0,1862 0,0379 0,2449 0,2191 0,0467 1,1253 0,1274 0,0144 0,2782 2,626 - -
(y-¯y)^2 5,29 5,29 5,29 1,69 1,69 0,09 0,09 7,29 7,29 22,09 56,1 - -
Коэффициенты парной корреляции вычисляются по формулам:
r_(yx_i )=(¯(yx_i )-¯y∙¯(x_i ))/(σ_y∙σ_(x_i ) ),r_(x_1 x_2 )=(¯(x_1 x_2 )-¯(x_1 )∙¯(x_2 ))/(σ_(x_1 )∙σ_(x_2 ) )
Среднеквадратические отклонения вычисляется по формулам:
σ_y=√((∑▒(y-¯y)^2 )/N),σ_(x_i )=√((∑▒(x_i-¯(x_i ))^2 )/N)
Пользуясь средствами MS Excel были получены значения коэффициентов парной корреляции:
r_(yx_1 )=0,9746
r_(yx_2 )=0,9469
r_(x_1 x_2 )=0,9537
Данные коэффициенты записываются в матрицу:
(■(1&r_(yx_1 )&r_(yx_2 )@r_(yx_1 )&1&r_(x_1 x_2 )@r_(yx_2 )&r_(x_1 x_2 )&1))=(■(1&0,9746&0,9469@0,9746&1&0,9537@0,9469&0,9537&1))
Примечательно, что данная матрица является симметричной.
Для вычисления оценок неизвестных коэффициентов уравнения составляется система нормальных уравнений:
{█(a_0 N+a_1 ∑▒x_1 +a_2 ∑▒x_2 =∑▒y@a_0 ∑▒x_1 +a_1 ∑▒x_1^2 +a_2 ∑▒〖x_1 x_2 〗=∑▒〖yx_1 〗@a_0 ∑▒x_2 +a_1 ∑▒x_1 x_2+a_2 ∑▒x_2^2 =∑▒〖yx_2 〗)┤
То есть:
{█(10∙a_0+60,6∙a_1+214∙a_2=93@60,6∙a_0+404,6∙a_1+1417,5∙a_2=608,2@214∙a_0+1417,5∙a_1+5008∙a_2=2137)┤
Для решение данной СЛАУ предполагается использовать метод определителей:
Определитель основной системы равен:
∆=|■(10&60,6&214@60,6&404,6&1417,5@214&1417,5&5008)|=10∙(404,6∙5008-〖1417,5〗^2 )-60,6∙(60,6∙5008-1417,5∙214)+214∙(60,6∙1417,5-404,6∙214)=169305,5-8471,88-146354,6=14479,02
Вспомогательные определители:
∆_(a_0 )=|■(93&60,6&214@608,2&404,6&1417,5@2137&1417,5&5008)|=93∙(404,6∙5008-〖1417,5〗^2 )-60,6∙(608,2∙5008-1417,5∙2137)+214∙(608,2∙1417,5-404,6∙2137)=1574541,15-1010086,86-536433,8=28020,49
∆_(a_1 )=|■(10&93&214@60,6&608,2&1417,5@214&2137&5008)|=10∙(608,2∙5008-1417,5∙2137)-93∙(60,6∙5008-1417,5∙214)+214∙(60,6∙2137-608,2∙214)=166681-13001,4-139656,4=14023,2
∆_(a_2 )=|■(10&60,6&93@60,6&404,6&608,2@214&1417,5&2137)|=10∙(404,6∙2137-608,2∙1417,5)-60,6∙(60,6∙2137-608,2∙214)+93∙(60,6∙1417,5-404,6∙214)=25067+39547,66-63602,7=1011,96
Тогда:
a ̂_0=∆_(a_0 )/∆=28020,49/14479,02≈1,935
a ̂_1=∆_(a_1 )/∆=14023,2/14479,02≈0,9685
a ̂_2=∆_(a_2 )/∆=1011,96/14479,02≈0,07
Тогда уравнение примет вид:
y ̂=a ̂_0+a ̂_1 x_1+a ̂_2 x_2
y ̂=1,935+0,9685x_1+0,07x_2
Вывод: при увеличении стоимости основных фондов (x_1) на 1 единицу выпуск продукции (y) вырастет на 0,9685%; при увеличении численности рабочих (x_2) на 1 единицу выпуск продукции (y) вырастет на 0,07%.
Соответствующие данные заносятся в таблицу. Тогда индекс множественной корреляции рассчитается по формуле:
R^2=1-(∑▒(y-y ̂ )^2 )/(∑▒(y-¯y)^2 )=1-2,626/56,1=0,9532
R=√0,9532=0,9763
Вывод: выпуск продукции (y) на 97,63% объясняется влиянием стоимости основных фондов (x_1) и численностью. рабочих (x_2), на 2,37% - изменением факторов, не включенных в модель
Расчетное значение F-критерия Фишера:
F_расч=R^2/(1-R^2 )∙(N-3)/2=71,28
При этом критическое значение F-критерия Фишера получено средствами MS Excel:
F_крит=4,74
Вывод: полученное расчетное значение F-критерия Фишера больше критического значения. Это означает, что уравнение регрессии является статистически значимым.
Частные критерии Фишера:
F_(x_i )=(R^2-r_(yx_j)^2)/(1-R^2 )∙(N-3),i≠j
Пользуясь средствами MS Excel, были получены ответы:
F_(x_1 )=8,4519
F_(x_2 )=0,5044
Вывод: F_(x_1 )=8,4519>F_крит=4,74 – включение фактора x_1 статистически оправдано; F_(x_2 )=0,5044