Введение в регрессионный анализ
Дорогие студенты!
Это страница обязательного курса «Введение в регрессионный анализ», читаемого на программе «Политология» 2 курса бакалавриата в 1 модуле 2022-2023 учебного года.
Лекции читает: Макаров Алексей Алексеевич.
Семинары ведёт: Тамбовцева Алла Андреевна.
Гостевые лекторы: Стукал Денис Константинович, Сальникова Дарья Вячеславовна, Седашов Евгений Александрович.
Содержание
Правила игры
- Формула оценки: Итог = 0.15 * ДЗ1 + 0.15 * ДЗ2 + 0.25 * ДЗ3 + 0.15 * Проверочная работа + 0.3 * Экзамен.
- Подробные пояснения по формам контроля можно посмотреть здесь.
- Домашние задания сдаются в электронном виде через запросы Dropbox.
- Домашнее задание можно сдать в течение суток после дедлайна с потерей 2 баллов от полученной оценки. Работы, сданные позже, не проверяются.
Программное обеспечение
Для работы на этом курсе необходимо установить (именно в таком порядке): R и RStudio. Если у вас уже установлена более ранняя версия R или RStudio, специально переустанавливать их не нужно, они подходят для работы в рамках курса. Ссылки для скачивания:
- R: для Windows, для Mac OS (файл R-4.2.1.pkg);
- RStudio: для разных систем.
При желании можно воспользоваться облачной версией RStudio Cloud.
Введение в R и RStudio:
- Интерфейс RStudio, работа с консолью, сохранение выборки в виде числового вектора и её описание (видео).
- Создание файла с кодом, загрузка данных из csv-файла, предварительное знакомство с данными (видео, CSV).
- Примеры построения графиков в R (видео).
Материалы занятий
Неделя 1. Введение в регрессионный анализ.
Лекция 1. Повторение основных понятий статистики. Коэффициент корреляции Пирсона и парная линейная регрессия. Метод наименьших квадратов.
- что почитать по теме
Практикум 1. Введение в работу с данными. Коэффициент корреляции Пирсона и парная линейная регрессия.
- файл с данными canada.csv, файл с кодом regression-practice01.R, конспект practice01.pdf
- все файлы в одной папке на Dropbox
Дополнительно: список цветов в R, палитра цветов от Google.
Неделя 2. Парная линейная регрессия. Условия Гаусса-Маркова.
Лекция 2. Парная линейная регрессия. Условия Гаусса-Маркова. Распределение оценок коэффициентов модели. Анализ остатков.
- что почитать по теме
Практикум 2. Парная линейная регрессия. Анализ остатков модели.
- семинарский листок, запись семинаров
- файл с данными canada.csv, файл с кодом regression-practice02.R, конспект [practice02.pdf]
- все файлы в одной папке на Dropbox
Неделя 3. Оценка качества модели. Парная регрессия с бинарным предиктором.
Лекция 3. Качество модели: ANOVA-таблица и коэффициент детерминации. Парная регрессия с бинарным предиктором.
- что почитать по теме
Практикум 3. Анализ остатков модели. Качество линейной модели и ANOVA-таблица. Парная линейная модель с бинарным предиктором.
- семинарский листок, [решения], запись семинаров
- файл с данными life_expect.csv, файл с кодом regression-practice03.R
- все файлы в одной папке на Dropbox
Памятки по темам
- Повторение. Введение в парную линейную регрессию (по мотивам лекции 1). PDF.
- Парная линейная регрессия: основные понятия и формулы, условия Гаусса-Маркова, распределение оценок коэффициентов модели, проверка гипотезы о значимости коэффициента регрессии (по мотивам лекции 2). PDF.
- ANOVA-таблица и коэффициент детерминации (по мотивам лекции 3). PDF.