Фрагмент для ознакомления
2
Введение
Математическая статистика - это наука о математических методах систематизации и использования статистических данных для научных и практических выводов. Во многих своих разделах математическая статистика опирается на теорию вероятностей, которая позволяет оценить надежность и точность выводов, сделанных на основе ограниченных статистических данных (например, оценить размер выборки, необходимый для получения результатов с точностью, требуемой при выборочном опросе).
В теории вероятностей рассматриваются случайные величины с заданным распределением или случайные эксперименты, свойства которых полностью известны. Предметом теории вероятностей являются свойства и отношения этих величин (распределений).
Но часто эксперимент представляет собой черный ящик, дающий только результаты, по которым необходимо сделать вывод о свойствах самого эксперимента.
У наблюдателя есть набор числовых результатов (или их можно сделать числовыми), полученных путем повторения одного и того же случайного эксперимента в тех же условиях.
1.Методы математической статистики
Математическая статистика - это наука о математических методах анализа данных, полученных в ходе массовых наблюдений (измерений, экспериментов). В зависимости от математической природы конкретных результатов наблюдений математическая статистика делится на числовую статистику, многомерный статистический анализ, анализ функций (процессов) и временных рядов, статистику объектов нечисловой природы.
Значительная часть математической статистики основана на вероятностных моделях. Выделяются общие задачи описания данных, оценки и проверки гипотез. Также рассматриваются более частные задачи, связанные с проведением выборочных опросов, восстановлением зависимостей, созданием и использованием классификаций (типологий) и т. д.
Чтобы описать данные, создайте таблицы, графики, другие визуальные представления, например поля корреляции. Вероятностные модели обычно не применяются. Некоторые методы описания данных основаны на передовой теории и возможностях современных компьютеров. [1]
К ним относятся кластерный анализ, целью которого является выделение групп объектов, которые выглядят одинаково, и многомерный масштаб, который позволяет визуализировать объекты на плоскости, искажая как можно меньше расстояний между ними.
Методы оценки и проверки гипотез основаны на вероятностных моделях генерации данных. Эти модели делятся на параметрические и непараметрические. Параметрические модели предполагают, что изучаемые объекты описываются функциями распределения, которые зависят от небольшого числа (1-4) числовых параметров. В непараметрических моделях функции распределения должны быть произвольными непрерывными. Математическая статистика оценивает параметры и характеристики распределения (математическое ожидание, медиана, дисперсия, квантили и т. д.), плотности и функции распределения, зависимости между переменными (на основе линейных и непараметрических коэффициентов корреляции, а также параметрических или непараметрических оценок переменных). функции, выражающие зависимости) и т. д.
В математической статистике существует общая теория проверки гипотез и большое количество методов, посвященных проверке конкретных гипотез. Рассмотрим гипотезу о значениях параметров и характеристик, о проверке однородности (т. е. о совпадении характеристик или функций распределения в обеих выборках), об эмпирическом согласии функции распределения с функцией распределения или параметрической функцией семейства распределения.
Большое значение имеет раздел математической статистики, посвященный выборочным опросам, свойствам различных схем организации выборки и разработке соответствующих методов оценки и проверки гипотез.
Проблемы восстановления зависимостей активно изучались на протяжении более 200 лет, начиная с разработки метода наименьших квадратов К. Гауссом в 1794 году. В настоящее время наиболее релевантными методами поиска информативного подмножества переменных являются непараметрические методы.[2]
Разработка методов аппроксимации данных и уменьшения размерности описания началась более 100 лет назад, когда К. Пирсон создал метод основных компонентов. Позже были разработаны факторный анализ и многочисленные нелинейные обобщения.
Фрагмент для ознакомления
3
1. Баврин, И.И. Краткий курс теории вероятностей и математическая статистика / И.И. Баврин, В.Л. Матросов. - М.: [не указано], 2020. - 980 c.
2. Боровков, А. А. Математическая статистика / А.А. Боровков. - М.: ФИЗМАТЛИТ, 2019. - 704 c.
3. Боровков, А.А. Математическая статистика: оценка параметров, проверка гипотез / А.А. Боровков. - М.: [не указано], 2019. - 642 c.
4. Ван, дер Варден Б.Л. Математическая статистика / Ван дер Б.Л. Варден. - М.: [не указано], 2021. - 904 c.
5. Гнеденко, Б.В. Беседы о математической статистике / Б.В. Гнеденко. - Москва: ИЛ, 2019. - 774 c.