Фрагмент для ознакомления
2
Задача 1
Задания:
1) Постройте поле корреляции результативного и факторного признаков.
2) Определите параметры уравнения парной линейной регрессии. Дайте интерпретацию найденных параметров и всего уравнения в целом.
3) Постройте теоретическую линию регрессии, совместив ее с полем корреляции. Сделайте выводы.
4) Рассчитайте линейный коэффициент корреляции и поясните его смысл. Определите коэффициент детерминации и дайте его интерпретацию.
5) С вероятностью 0,95 оцените статистическую значимость коэффициента регрессии и уравнения регрессии в целом. Сделайте выводы.
6) С вероятностью 0,95 постройте доверительный интервал для прогноза оценки и доверительный интервал генерального значения ( -задается отдельно в условии каждой задачи).
7) Определите значение коэффициента эластичности и объясните его.
2. Компанию по прокату автомобилей интересует зависимость между пробегом автомобилей и стоимостью ежемесячного обслуживания. Для выяснения характера этой связи было отобрано 15 автомобилей. Результаты исследования представлены в таблице 1:
Исходные данные Таблица 1
Пробег, тыс. км 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Стоимость обслуживания, у.е. 13 16 15 20 19 21 26 24 30 32 30 35 34 40 39
К пункту 6. Значение = 18,5.
Решение.
1) Построим поле корреляции результата и фактора используя данные в таблице.
На основе построенного поля корреляции делаем вывод о том, что в данном случае, между результативным и факторным признаками имеет место прямая, тесная, линейная, корреляционная связь.
2) Определим параметры уравнения парной линейной регрессии и укажем интерпретацию найденных параметров и всего уравнения в целом.
Оценку параметров уравнения парной линейной регрессии произведём методом наименьших квадратов (МНК):
y ̂_i=a+bx_i, где a и b – оценки параметров модели.
Величины, минимизирующие суммы квадратов отклонений от для случая парной линейной регрессии, находим по формулам:
а значения ошибок, называемые остатками, рассчитаем по формуле:
Расчёт необходимых данных проведём в следующей таблице 2.
Таблица 2
№ п/п xi yi x_i-x ̃ y_i-y ̃ (x_i-x ̃ )(y_i-y ̃ ) (x_i-x ̃ )^2 y ̂_i e_i=y_i-y ̂_i
1 6 13 -7 -13,267 92,87 49 12,77 0,233
2 7 16 -6 -10,267 61,6 36 14,7 1,305
3 8 15 -5 -11,267 56,33 25 16,62 -1,62
4 9 20 -4 -6,2667 25,07 16 18,55 1,448
5 10 19 -3 -7,2667 21,8 9 20,48 -1,48
6 11 21 -2 -5,2667 10,53 4 22,41 -1,41
7 12 26 -1 -0,2667 0,267 1 24,34 1,662
8 13 24 0 -2,2667 0 0 26,27 -2,27
9 14 30 1 3,7333 3,733 1 28,2 1,805
10 15 32 2 5,7333 11,47 4 30,12 1,876
11 16 30 3 3,7333 11,2 9 32,05 -2,05
12 17 35 4 8,7333 34,93 16 33,98 1,019
13 18 34 5 7,7333 38,67 25 35,91 -1,91
14 19 40 6 13,733 82,4 36 37,84 2,162
15 20 39 7 12,733 89,13 49 39,77 -0,77
Сумма 195 394 540 280 394 0
Средние 13 26,27
Используя полученные данные таблицы 2, получаем, что
Отсюда уравнение регрессии имеет вид:
Таким образом, получаем следующее уравнение регрессии:
Коэффициент регрессии линейной функции b=1,929 является абсолютным показателем силы связи, который характеризует абсолютное изменение результата при изменении факторного признака x на единицу своего изменения и в данном случае он показывает, что при увеличении расстояния на 1 тыс. км. стоимость ежемесячного обслуживания компании по прокату автомобилей в среднем увеличивается на 1,929 условных денежных единиц, а свободный член уравнения a=1,195 можно трактовать как влияние на величину расходов компании других, неучтённых в данной модели факторов.
3) Построим теоретическую линию регрессии, совместив ее с полем корреляции.
Так как эмпирические точки находятся вблизи теоретической прямой, то уравнение регрессии хорошо аппроксимирует данные.
4) Рассчитаем линейный коэффициент корреляции и поясним его смысл, а также вычислим коэффициент детерминации и дадим его интерпретацию.
Линейный коэффициент корреляции находим по формуле:
Найдём σ_x и σ_y по формулам σ_x=√((x^2 ) ̃-(x ̃ )^2 ), σ_y=√((y^2 ) ̃-(y ̃ )^2 ), для чего составим вспомогательную таблицу 3.
Таблица 3
№ п/п xi yi x ̃^2 y ̃^2
1 6 13 36 169
2 7 16 49 256
3 8 15 64 225
4 9 20 81 400
5 10 19 100 361
6 11 21 121 441
7 12 26 144 676
8 13 24 169 576
9 14 30 196 900
10 15 32 225 1024
11 16 30 256 900
12 17 35 289 1225
13 18 34 324 1156
14 19 40 361 1600
15 20 39 400 1521
Сумма 195 394 2815 11430
Средние 13 26,27 187,667 762
σ_x=√((x^2 ) ̃-(x ̃ )^2 )=√(187,667-169)=4,320;
σ_y=√((y^2 ) ̃-(y ̃ )^2 )=√(762-26,27)=8,479.
Отсюда
r=(∑▒(x_i-x ̃ )(y_i-y ̃ ) )/(nσ_x σ_y )=540/(15·4,320·8,479)=540/549,439=0,98.
Итак, r=0,98.
Коэффициент корреляции указывает на наличие прямой связи между пробегом автомобиля и стоимостью месячного обслуживания, причём эта связь весьма высокая по тесноте, так как r>0,9.
Рассчитаем коэффициент детерминации по формуле:
R^2=1-∑▒(y_i-y ̂_i )^2 yi-y2, для чего составим вспомогательную таблицу 4.
Таблица 4
№ п/п y_i-y ̃ (y_i-y ̃ )^2 y_i-y ̂_i (y_i-y ̂_i )^2
1 -13,267 176,0133 0,233 0,054289
2 -10,267 105,4113 1,305 1,703025
3 -11,267 126,9453 -1,62 2,6244
4 -6,2667 39,27153 1,448 2,096704
5 -7,2667 52,80493 -1,48 2,1904
6 -5,2667 27,73813 -1,41 1,9881
7 -0,2667 0,071129 1,662 2,762244
8 -2,2667 5,137929 -2,27 5,1529
9 3,7333 13,93753 1,805 3,258025
10 5,7333 32,87073 1,876 3,519376
11 3,7333 13,93753 -2,05 4,2025
12 8,7333 76,27053 1,019 1,038361
13 7,7333 59,80393 -1,91 3,6481
14 13,733 188,5953 2,162 4,674244
15 12,733 162,1293 -0,77 0,5929
Сумма - 1080,938 - 39,50557
Среднее - 72,063 - 2,633705
Отсюда