Фрагмент для ознакомления
2
Задание 1
По ряду районов края определены: среднесуточное количество йода в воде и пище и пораженность населения заболеванием щитовидной железы. Данные приведены в таблице. Для оценки тесноты связи пораженности заболеванием щитовидной железы с количеством йода в воде и пище определите коэффициент корреляции рангов Спирмена и Кендэла и проверьте его значимость при α = 0,05.
5.
Номер района Количество йода в воде и пище, усл. ед. Пораженность населения заболеванием щитовидной железы, %
1 101 0,2
2 178 0,6
3 155 1,1
4 140 0,8
5 126 2,5
6 81 4,4
7 171 16,9
Решение.
Коэффициент ранговой корреляции Спирмена.
Присвоим ранги признаку Y и фактору X.
X Y ранг X, dx ранг Y, dy
101 0,2 2 1
178 0,6 7 2
155 1,1 5 4
140 0,8 4 3
126 2,5 3 5
81 4,4 1 6
171 16,9 6 7
Матрица рангов.
ранг X, dx ранг Y, dy (dx - dy)2
2 1 1
7 2 25
5 4 1
4 3 1
3 5 4
1 6 25
6 7 1
28 28 58
Проверка правильности составления матрицы на основе исчисления контрольной суммы:
xij=(1+n)n/2=1+772=28.
Сумма по столбцам матрицы равны между собой и контрольной сумме, значит, матрица составлена правильно.
По формуле вычислим коэффициент ранговой корреляции Спирмена.
p=1-6·(∑▒d^2 )/(n^3-n)
p=1-6·58/(7^3-7)=-0,0357.
Связь между признаком Y и фактором X слабая и обратная
Оценка коэффициента ранговой корреляции Спирмена.
Значимость коэффициента ранговой корреляции Спирмена
Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции Спирмена при конкурирующей гипотезе Hi. p ≠ 0, надо вычислить критическую точку:
где n – объем выборки; p – выборочный коэффициент ранговой корреляции Спирмена: t(α, k) – критическая точка двусторонней критической области, которую находят по таблице критических точек распределения Стьюдента, по уровню значимости α и числу степеней свободы k = n – 2.
Если |p| < Тkp – нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима.
Если |p| > Tkp – нулевую гипотезу отвергают. Между качественными признаками существует значимая ранговая корреляционная связь.
По таблице Стьюдента находим t(α/2; k) = (0,05/2; 5) = 2,571
T_kp=2,571·√((1-〖0,0357〗^2)/(7-2))=1,15.
Поскольку Tkp > p, то принимаем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически – не значим и ранговая корреляционная связь между оценками по двум тестам незначимая.
Коэффициент Кендэла
Присвоим ранги признаку Y и фактору X.
Расположим объекты так, чтобы их ранги по X представили натуральный ряд. Так как оценки, приписываемые каждой паре этого ряда, положительные, значения «+1», входящие в Р, будут порождаться только теми парами, ранги которых по Y образуют прямой порядок.
Их легко подсчитать, сопоставляя последовательно ранги каждого объекта в ряду Y с стальными.
Коэффициент Кендэла.
В общем случае расчет τ (точнее Р или Q) даже для N порядка 10 оказывается громоздким. Покажем, как упростить вычисления.
или
Решение.
Упорядочим данные по X.
В ряду Y справа от 6 расположено 1 рангов, превосходящих 6, следовательно, 6 породит в Р слагаемое 1.
Справа от 1 стоят 5 ранга, превосходящих 1 (это 5, 3, 4, 7, 2), т.е. в Р войдет 5 и т.д. В итоге Р = 10 и с использованием формул имеем:
X Y ранг X, dx ранг Y, dy P Q
81 4,4 1 6 1 5
101 0,2 2 1 5 0
126 2,5 3 5 1 3
140 0,8 4 3 2 1
155 1,1 5 4 1 1
171 16,9 6 7 0 1
178 0,6 7 2 0 0
10 11
τ=(10-11)/(1/2 7(7-1))=-0,05.
По упрощенным формулам:
τ=1-(4·11)/(7(7-1))=-0,05
τ=(4·10)/(7(7-1))-1=-0,05.
Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции Кендалла