Фрагмент для ознакомления
2
Задание №1
Парная линейная регрессия и корреляция
На основе исходных данных (учебное пособие, приложение 2, стр. 78) построить графическую модель и математическую модель в виде парной линейной регрессии. Оценить тесноту связи между фактором и результирующим признаком. Оценить (по двум параметрам) качество построенной модели. С помощью коэффициента эластичности определить силу влияния фактора на результат. Провести оценку статистической значимости уравнения регрессии с помощью критерия Фишера. Пример расчетов в разделе 1.2 учебного пособия (стр. 13-16). С помощью встроенных функций Excel (учебное пособие, раздел 1.3, стр. 17) оценить правильность
проведенных расчетов
На построенной графической модели видно, что между фактором и результирующим признаком присутствует ярко выраженная прямая линейная зависимость.
Для расчета параметров уравнения линейной регрессии строим расчетную таблицу (таблица 1.).
Основываясь на данных таблицы 1 находим параметры уравнения линейной регрессии.
b=(¯(y·x)-¯y·¯x)/(¯(x^2 )-(¯x)^2 )=(298,431-43,74·6,31)/(44,307-〖6,31〗^2)=22,4316/4,4909=4,99.
a=¯y-b·¯x=43,74-4,99·6,31=12,22.
Получено уравнение регрессии: y ̃_x =12,22 + 4,99 · x.
С увеличением фактора на единицу результирующий признак
возрастет в среднем на 5 единиц.
Подставляя в уравнение регрессии фактические значения х, определим
теоретические (расчетные) значения y ̃_x (столбец 6 таблицы 1.).
Тесноту линейной связи оценим с помощью коэффициента корреляции:
r_xy=b·√(¯(x^2 )-(¯x)^2 )y2-y2=4,99·44,307-6,3122025,248-43,742≈0,9999.
Это означает, что связь между результирующим признаком и фактором прямая и тесная.
Качество модели определяет средняя ошибка аппроксимации и коэффициент детерминации. Учитывая столбец 8 таблицы 1, находим среднюю ошибку аппроксимации:
¯A=1/n·∑▒A_i ·100%=1/n·∑▒〖|(y-y ̃_x)/y|·100%=0,0254/10〗·100%≈0,2541%.
Так как ¯A не превышает 8-10%, то качество модели хорошее.
Коэффициент детерминации R2 для линейной регрессии равен квадрату коэффициента корреляции. В данном случае R^2=r_xy^2=〖0,99〗^2=0,98 и таким образом, в 98% случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии – высокая.
С помощью коэффициента эластичности ¯Э определим силу влияния фактора на результативный показатель.
¯Э=b·|¯x/¯y|=4,99·6,31/43,74=0,72%.
Таким образом, средний коэффициент эластичности показывает, что в среднем при повышении фактора x на 1% от своего среднего значения результативный показатель y увеличивается на 0,72% от своего среднего значения.
Рассчитаем F-критерий:
F_факт=(r_xy^2)/(1-r_xy^2 )·(n-2)=0,9999/(1-0,9999)·(10-2)≈53407,42.
Учитывая, что k1 = 1, k2 = n - 2 = 10 – 2 = 8 и α = 0,05 по таблице находим, что F_табл≈5,3177
Так как F_факт>F_табл то нулевую гипотезу об отсутствии связи признаков отклоняем и делаем вывод о том, что связь между фактором и результативным признаками является существенной.
Проверим правильность расчётов с помощью встроенных функций Excel (см. файл проверки правильности расчётов в Excel). Правильность расчётов подтверждается.