Введение в регрессионный анализ
Дорогие студенты!
Это страница обязательного курса «Введение в регрессионный анализ», читаемого на программе «Политология» 2 курса бакалавриата в 1 модуле 2022-2023 учебного года.
Лекции читает: Макаров Алексей Алексеевич.
Семинары ведёт: Тамбовцева Алла Андреевна.
Гостевые лекторы: Стукал Денис Константинович, Сальникова Дарья Вячеславовна, Седашов Евгений Александрович.
Содержание
- 1 Правила игры
- 2 Программное обеспечение
- 3 Материалы занятий
- 3.1 Неделя 1. Введение в регрессионный анализ.
- 3.2 Неделя 2. Парная линейная регрессия. Условия Гаусса-Маркова.
- 3.3 Неделя 3. Оценка качества модели. Парная регрессия с бинарным предиктором.
- 3.4 Неделя 4. Множественная регрессия.
- 3.5 Неделя 5. Множественная регрессия. Гетероскедастичность и влиятельные наблюдения.
- 3.6 Неделя 6. Проверка условий Гаусса-Маркова для множественной регрессии.
- 3.7 Памятки по темам
- 4 Домашние задания
Правила игры
- Формула оценки: Итог = 0.15 * ДЗ1 + 0.15 * ДЗ2 + 0.25 * ДЗ3 + 0.15 * Проверочная работа + 0.3 * Экзамен.
- Подробные пояснения по формам контроля можно посмотреть здесь.
- Домашние задания сдаются в электронном виде через запросы Dropbox.
- Домашнее задание можно сдать в течение суток после дедлайна с потерей 2 баллов от полученной оценки. Работы, сданные позже, не проверяются.
Программное обеспечение
Для работы на этом курсе необходимо установить (именно в таком порядке): R и RStudio. Если у вас уже установлена более ранняя версия R или RStudio, специально переустанавливать их не нужно, они подходят для работы в рамках курса. Ссылки для скачивания:
- R: для Windows, для Mac OS (файл R-4.2.1.pkg);
- RStudio: для разных систем.
При желании можно воспользоваться облачной версией RStudio Cloud.
Введение в R и RStudio:
- Интерфейс RStudio, работа с консолью, сохранение выборки в виде числового вектора и её описание (видео).
- Создание файла с кодом, загрузка данных из csv-файла, предварительное знакомство с данными (видео, CSV).
- Примеры построения графиков в R (видео).
Материалы занятий
Неделя 1. Введение в регрессионный анализ.
Лекция 1. Коэффициент корреляции Пирсона и парная линейная регрессия. Метод наименьших квадратов.
Практикум 1. Введение в работу с данными. Коэффициент корреляции Пирсона и парная линейная регрессия.
- файл с данными canada.csv, файл с кодом regression-practice01.R, конспект practice01.pdf
- все файлы в одной папке на Dropbox
- дополнительно: список цветов в R, палитра цветов от Google.
Что почитать по теме.
Неделя 2. Парная линейная регрессия. Условия Гаусса-Маркова.
Лекция 2. Парная линейная регрессия. Условия Гаусса-Маркова. Распределение оценок коэффициентов модели.
Практикум 2. Парная линейная регрессия. Анализ остатков модели.
- видеозапись семинаров
- файл с данными canada.csv, файл с кодом regression-practice02.R.
- все файлы в одной папке на Dropbox
Что почитать по теме.
Неделя 3. Оценка качества модели. Парная регрессия с бинарным предиктором.
Лекция 3. Качество модели: ANOVA-таблица и коэффициент детерминации. Парная регрессия с бинарным предиктором.
Практикум 3. Анализ остатков модели. Качество линейной модели и ANOVA-таблица.
- семинарский листок, решения, запись семинаров
- файл с данными life_expect.csv, файл с кодом regression-practice03.R, конспект practice03.pdf
- все файлы в одной папке на Dropbox
Что почитать по теме
Неделя 4. Множественная регрессия.
Лекция 4. Множественная регрессия.
Практикум 4. Парная линейная модель с бинарным предиктором. Множественная регрессия.
- запись семинаров
- файл с данными canada.csv, файл с кодом regression-practice04.R
- визуализация для множественной регрессии
Неделя 5. Множественная регрессия. Гетероскедастичность и влиятельные наблюдения.
Лекция 5. Гетероскедастичность и влиятельные наблюдения.
- что почитать по теме
Практикум 5. Множественная регрессия на экспериментальных данных. Выявление гетероскедастичности.
- запись семинаров
- файл с данными diet.csv, файл с кодом regression-practice05.R
Неделя 6. Проверка условий Гаусса-Маркова для множественной регрессии.
Лекция 6. Проверка условий Гаусса-Маркова для множественной регрессии. Проверка нормальности остатков модели.
- что почитать по теме
Практикум 6. Проверка условий Гаусса-Маркова для множественной регрессии.
- запись семинаров, не во всех группах все записалось, рекомендую смотреть запись группы 214
- файл с данными Salaries.csv, файл с кодом regression-practice06.R, конспект regression-practice06.pdf
Памятки по темам
- Парная линейная регрессия: основные понятия и формулы, условия Гаусса-Маркова, распределение оценок коэффициентов модели, проверка гипотезы о значимости коэффициента регрессии (по мотивам лекции 2). PDF.
Домашние задания
Домашнее задание | Условия | Дедлайн | Куда сдавать |
---|---|---|---|
Домашнее задание 1 | варианты данные | 6 октября 23:59 | по группам: 211 212 213 214 |
Домашнее задание 2 | задание | 15 октября 23:59 | по группам: 211 212 213 214 |
Домашнее задание 3 | задание данные | 23 октября 23:59 или 26 октября 15:00 | по группам: 211 212 213 214 |