Фрагмент для ознакомления
2
Введение
Актуальность темы корреляционного анализа обусловлена широким использованием этого метода в современных исследованиях.
Некоторые причины актуальности:
Возможность устанавливать истинные взаимосвязи. Корреляционный анализ позволяет определить, существует ли связь между показателями и насколько она сильна.
Применение в различных областях. Метод используется в экономике, социологии, психологии, естественных науках.
Помощь в принятии управленческих решений. Результаты корреляционного анализа позволяют анализировать причины возникновения и изменения тех или иных явлений, на основании чего принимаются более взвешенные и обоснованные решения.
Возможность прогнозирования. С помощью корреляционного анализа можно выявлять износ оборудования, а также слабые звенья во взаимосвязи всех единиц производства.
Таким образом, актуальность темы корреляционного анализа связана с его значимостью в разных сферах и возможностью использования для решения важных задач.
В данной работе мы рассмотрим теоретические аспекты корреляционного анализа, примеры его практического применения, а так же инструменты и программное обеспечение для проведения корреляционного анализа.
1. Теоретические основы корреляционного анализа
1.1. Понятие корреляции и корреляционной зависимости
Корреляция (от лат. correlatio — «соотношение») — это статистическая взаимосвязь двух или более случайных величин, при этом изменения значений одной или нескольких из этих величин сопутствуют систематическому изменению значений другой или других величин.
Другими словами, корреляция описывает степень связи между переменными и позволяет понять, как одна величина изменяется при изменении другой.
Корреляция может быть:
Положительной — когда один показатель растёт, другой тоже растёт.
Отрицательной — когда одна переменная растёт, другая уменьшается.
Нейтральной — изменения не связаны друг с другом.
Корреляцию используют, чтобы оценить зависимость переменных друг от друга.
Таким образом, корреляция — это взаимосвязь между двумя переменными, при которой изменение одной из них сопровождается изменением в другой. При корреляции эти изменения могут происходить без прямого влияния одной переменной на другую.
Причинно-следственная связь подразумевает, что изменение одной переменной (причины) вызывает изменение другой переменной (следствия).
Отличие корреляции от причинно-следственной связи в том, что причинно-следственная связь всегда подразумевает наличие корреляции, а корреляция не обязательно означает наличие причинно-следственной связи.
Чтобы подтвердить наличие причинной связи, необходимо проводить дополнительные исследования и контролируемые эксперименты.
Таким образом, мы рассмотрим, какие существуют виды корреляционных зависимостей:
Прямая причинно-следственная связь. Переменная Х определяет значение переменной У. Пример: наличие воды ускоряет рост растений, яд вызывает смерть, температура воздуха прямо влияет на скорость таяния льда.
Обратная причинно-следственная связь. Переменная У определяет значение переменной Х. Пример: исследователь может думать, что чрезмерное потребление кофе вызывает нервозность, но, возможно, очень нервный человек выпивает кофе, чтобы успокоить свои нервы.
Связь, вызванная третьей (скрытой) переменной. Пример: существует зависимость между числом утонувших людей и числом выпитых безалкогольных напитков в летнее время.
Связь, вызванная несколькими скрытыми переменными. Пример: исследователь может обнаружить значимую связь между оценками студентов в университете и оценками в школе. Но действуют и другие переменные: IQ, количество часов занятий, влияние родителей, мотивация, возраст, авторитет преподавателей.
Связи нет, наблюдаемая зависимость случайна. Пример: исследователь может найти связь между увеличением количества людей, которые занимаются спортом и увеличением количества людей, которые совершают преступления.
Также корреляционные связи различаются по форме, направлению и степени (силе):
По форме связь может быть прямолинейной или криволинейной. Прямолинейной может быть, например, связь между количеством тренировок на тренажёре и количеством правильно решаемых задач в контрольной сессии. Криволинейной может быть, например, связь между уровнем мотивации и эффективностью выполнения задачи.
По направлению связь может быть положительной (прямой) и отрицательной (обратной). При положительной корреляции более высоким значениям одного признака соответствуют более высокие значения другого, а более низким значениям одного признака — низкие значения другого. При отрицательной корреляции соотношения обратные.
По силе взаимодействия различаются слабые и сильные связи. Эта формальная характеристика выражается конкретными величинами и интерпретируется в соответствии с общепринятыми критериями силы связи для конкретных показателей.
1.2. Виды и типы коэффициентов корреляции
Коэффициенты корреляции — показатели, которые выражают силу корреляции между переменными. Они принимают значения в диапазоне от -1 до +1, где ±1 указывает на максимально возможную корреляцию, а 0 указывает на отсутствие корреляции.
Некоторые виды и типы коэффициентов корреляции представлены в таблице 1.
Таблица 1.
Виды коэффициентов корреляции
Наименование Характеристика
Коэффициент корреляции Пирсона Самый популярный в статистике, описывается буквой r и показывает прямолинейную связь между переменными. Принимает значение от -1 до 1. Чем ближе значение к 1, тем выше положительная корреляция между показателями. Если оно ближе к -1 — корреляция отрицательная. Значение, близкое к 0, включая сам ноль, говорит, что корреляции нет.
Коэффициент корреляции Кендалла Описывается буквой t и показывает корреляцию между факторами, которые можно ранжировать по какому-то признаку. Вместо значений показателя используют ранги — номера, присвоенные значениям при ранжировании. Значение коэффициента — тоже от -1 до 1. Подходит только для оценки линейной связи.
Коэффициент ранговой корреляции Спирмена Описывается буквой p. Предназначен для оценки ранжированных показателей, но больше подходит для малых выборок. Использует непараметрические методы, которые могут обрабатывать данные низкого качества — с погрешностями, малым количеством информации и так далее.
Коэффициенты корреляции существуют только для линейной корреляции, когда график одного показателя как бы «повторяет» другой. Для оценки нелинейной корреляции не пользуются коэффициентами, а используют более общий показатель — корреляционное отношение.
Также существуют и другие коэффициенты корреляции:
Частичная корреляция. Используется для выявления взаимосвязи между двумя переменными при учёте влияния одной или нескольких дополнительных переменных. Коэффициент частной корреляции принимает значение в диапазоне от -1 до 1. Значение -1 передаёт идеальную отрицательную корреляцию, значение 1 — идеальную положительную линейную зависимость, а значение 0 показывает, что линейной зависимости нет.
Множественная корреляция. Позволяет изучить зависимость результативного признака от ряда признаков-факторов. Коэффициент множественной корреляции является всегда положительным числом и может принимать любое значение в пределах между 0 и 1. Чем ближе он к единице, тем теснее зависимость.
Тетрахорическая корреляция. Используется в образовательных и психологических тестах, где обычно используют вопросы с ответами типа да/нет. Обычно коэффициент тетрахорической корреляции больше, чем стандартный коэффициент корреляции, но его применяют, например, при математическом моделировании.
Коэффициент контингенции. Применяется в том случае, когда хотя бы одно значение из четырёх показателей в «таблице четырёх полей» отсутствует. По абсолютной величине коэффициент контингенции всегда меньше коэффициента ассоциации и изменяется от (—1) до (+1). Чем ближе к 1 или (—1), тем сильнее связаны между собой изучаемые признаки.
Коэффициент взаимной сопряжённости Чупрова. Применяется для измерения тесноты связи между варьированием двух атрибутивных признаков, когда это варьирование образует несколько (три и более) групп. Числовое значение коэффициента изменяется от 0 до 1, но уже при значении 0,3 можно говорить о тесной связи между вариацией изучаемых качественных признаков.
Коэффициент Крамера. Подходит для анализа более сложных зависимостей между переменными. Диапазон значений коэффициента Крамера — от 0 до 1. Высокие значения коэффициента Крамера могут свидетельствовать о сильной взаимосвязи между признаками, даже если линейная корреляция отсутствует [6].
Применение коэффициентов корреляции широко в таких областях, как финансы, здравоохранение и социальные науки, для выявления взаимосвязей между переменными. Например, коэффициент корреляции может помочь инвесторам понять взаимосвязь между ценами на активы или помочь исследователям определить, как факторы образа жизни влияют на результаты здоровья.
Фрагмент для ознакомления
3
Список литературы
1.Айвазян С.А. Прикладная статистика. Основы эконометрики. В 2 т. М.: Юрайт, 2021.
2.Доугерти К. Введение в эконометрику. М.: ИНФРА-М, 2020.
3.Кремер Н.Ш. Теория вероятностей и математическая статистика. М.: Юрайт, 2022.
4.Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. М.: Дело, 2021.
5.Гмурман В.Е. Теория вероятностей и математическая статистика. М.: Юрайт, 2020.
6.Колемаев В.А., Староверов О.В. Теория вероятностей и математическая статистика. М.: Проспект, 2021.
7.Орлов А.И. Эконометрика. М.: Экзамен, 2020.
8.Чистяков В.П. Курс теории вероятностей. М.: Лань, 2021.
9.Гланц С. Медико-биологическая статистика. М.: Практика, 2020.
10.Драгослав Л. Статистический анализ данных в R. М.: ДМК Пресс, 2022.
11.Кендалл М., Стюарт А. Статистические выводы и связи. М.: Либроком, 2019.
12.Левин Б.Р. Теоретические основы статистического радиотехники. М.: Ленанд, 2018.
13.Тюрин Ю.Н., Макаров А.А. Статистический анализ данных на компьютере. М.: ИНФРА-М, 2017.
14.Айвазян С.А., Иванова С.С. Прикладная статистика для экономистов-исследователей. М.: МЦСТ, 2016.
15.Гланц С., Сакетт Д.Л. Как читать медицинскую литературу с критической позиции. М.: ГЭОТАР-Медиа, 2015.
16.Дрейпер Н., Смит Г. Прикладной регрессионный анализ. В 2 кн. М.: Диалектика, 2014.
17.Кендалл М.Дж., Стюарт А. Многомерный статистический анализ и временные ряды. М.: Либроком, 2013.
18.Мастицкий С.Э., Сошникова Л.А. STATISTICA 6. Статистический анализ данных. М.: Бином. Лаборатория знаний, 2012.
19.Реброва И.В. Статистический анализ данных в MS Excel. М.: БИНОМ. Лаборатория знаний, 2011.
20.Тюрин Ю.Н. Статистический анализ данных на компьютере. М.: ИНФРА-М, 2010.