Введение в регрессионный анализ: различия между версиями
Строка 92: | Строка 92: | ||
* [https://www.dropbox.com/sh/zk19xymwzjh38br/AAD45A-p_v9jXcqzd1E8u5qaa?dl=0 видеозапись] семинаров, не везде все записалось, рекомендую запись группы 214 | * [https://www.dropbox.com/sh/zk19xymwzjh38br/AAD45A-p_v9jXcqzd1E8u5qaa?dl=0 видеозапись] семинаров, не везде все записалось, рекомендую запись группы 214 | ||
− | * файл с данными [https://www.dropbox.com/s/ktzkqae6sprx92m/Salaries.csv?dl=0 Salaries.csv], файл с кодом [https://www.dropbox.com/s/dteqxaxzmrgwkzm/regression-practice06.R?dl=0 regression-practice06.R], конспект [https://github.com/allatambov/IntroToReg22/blob/main/practice06.pdf regression-practice06.pdf] (если не открывается – [ | + | * файл с данными [https://www.dropbox.com/s/ktzkqae6sprx92m/Salaries.csv?dl=0 Salaries.csv], файл с кодом [https://www.dropbox.com/s/dteqxaxzmrgwkzm/regression-practice06.R?dl=0 regression-practice06.R], конспект [https://github.com/allatambov/IntroToReg22/blob/main/practice06.pdf regression-practice06.pdf] (если не открывается – [https://www.dropbox.com/s/iprst99b0p5twt3/practice06.pdf?dl=0 здесь]). |
Что [https://github.com/allatambov/IntroToReg22/blob/main/read06.md почитать] по теме | Что [https://github.com/allatambov/IntroToReg22/blob/main/read06.md почитать] по теме |
Текущая версия на 01:21, 23 октября 2022
Дорогие студенты!
Это страница обязательного курса «Введение в регрессионный анализ», читаемого на программе «Политология» 2 курса бакалавриата в 1 модуле 2022-2023 учебного года.
Лекции читает: Макаров Алексей Алексеевич.
Семинары ведёт: Тамбовцева Алла Андреевна.
Гостевые лекторы: Стукал Денис Константинович, Сальникова Дарья Вячеславовна, Седашов Евгений Александрович.
Содержание
- 1 Правила игры
- 2 Программное обеспечение
- 3 Материалы занятий
- 3.1 Неделя 1. Введение в регрессионный анализ.
- 3.2 Неделя 2. Парная линейная регрессия. Условия Гаусса-Маркова.
- 3.3 Неделя 3. Оценка качества модели. Парная регрессия с бинарным предиктором.
- 3.4 Неделя 4. Парная регрессия с бинарным предиктором. Множественная регрессия.
- 3.5 Неделя 5. Гетероскедастичность и влиятельные наблюдения.
- 3.6 Неделя 6. Проверка условий Гаусса-Маркова для множественной регрессии.
- 3.7 Неделя 7. Difference-in-Differences
- 3.8 Памятки по темам
- 4 Домашние задания
Правила игры
- Формула оценки: Итог = 0.15 * ДЗ1 + 0.15 * ДЗ2 + 0.25 * ДЗ3 + 0.15 * Проверочная работа + 0.3 * Экзамен.
- Подробные пояснения по формам контроля можно посмотреть здесь.
- Домашние задания сдаются в электронном виде через запросы Dropbox.
- Домашнее задание можно сдать в течение суток после дедлайна с потерей 2 баллов от полученной оценки. Работы, сданные позже, не проверяются.
Программное обеспечение
Для работы на этом курсе необходимо установить (именно в таком порядке): R и RStudio. Если у вас уже установлена более ранняя версия R или RStudio, специально переустанавливать их не нужно, они подходят для работы в рамках курса. Ссылки для скачивания:
- R: для Windows, для Mac OS (файл R-4.2.1.pkg);
- RStudio: для разных систем.
При желании можно воспользоваться облачной версией RStudio Cloud.
Введение в R и RStudio:
- Интерфейс RStudio, работа с консолью, сохранение выборки в виде числового вектора и её описание (видео).
- Создание файла с кодом, загрузка данных из csv-файла, предварительное знакомство с данными (видео, CSV).
- Примеры построения графиков в R (видео).
Материалы занятий
Неделя 1. Введение в регрессионный анализ.
Лекция 1. Коэффициент корреляции Пирсона и парная линейная регрессия. Метод наименьших квадратов.
Практикум 1. Введение в работу с данными. Коэффициент корреляции Пирсона и парная линейная регрессия.
- файл с данными canada.csv, файл с кодом regression-practice01.R, конспект practice01.pdf
- список цветов в R, палитра цветов от Google.
Что почитать по теме.
Неделя 2. Парная линейная регрессия. Условия Гаусса-Маркова.
Лекция 2. Парная линейная регрессия. Условия Гаусса-Маркова. Распределение оценок коэффициентов модели.
Практикум 2. Парная линейная регрессия. Анализ остатков модели.
- видеозапись семинаров
- файл с данными canada.csv, файл с кодом regression-practice02.R.
Что почитать по теме.
Неделя 3. Оценка качества модели. Парная регрессия с бинарным предиктором.
Лекция 3. Качество модели: ANOVA-таблица и коэффициент детерминации. Парная регрессия с бинарным предиктором.
Практикум 3. Анализ остатков модели. Качество линейной модели и ANOVA-таблица.
- семинарский листок, решения, видеозапись семинаров
- файл с данными life_expect.csv, файл с кодом regression-practice03.R, конспект practice03.pdf
Что почитать по теме
Неделя 4. Парная регрессия с бинарным предиктором. Множественная регрессия.
Лекция 4. Парная регрессия с бинарным предиктором. Множественная регрессия.
Практикум 4. Парная линейная модель с бинарным предиктором. Множественная регрессия.
- видеозапись семинаров
- файл с данными canada.csv, файл с кодом regression-practice04.R
- визуализация для множественной регрессии
Неделя 5. Гетероскедастичность и влиятельные наблюдения.
Лекция 5. Гетероскедастичность и влиятельные наблюдения.
Практикум 5. Множественная регрессия на экспериментальных данных. Выявление гетероскедастичности.
- видеозапись семинаров
- файл с данными diet.csv, файл с кодом regression-practice05.R
Что почитать по теме
Неделя 6. Проверка условий Гаусса-Маркова для множественной регрессии.
Лекция 6. Проверка условий Гаусса-Маркова для множественной регрессии. Проверка нормальности остатков модели.
Практикум 6. Проверка условий Гаусса-Маркова для множественной регрессии.
- видеозапись семинаров, не везде все записалось, рекомендую запись группы 214
- файл с данными Salaries.csv, файл с кодом regression-practice06.R, конспект regression-practice06.pdf (если не открывается – здесь).
Что почитать по теме
Неделя 7. Difference-in-Differences
- видеозапись семинаров
- файл с данными draca_upd.csv, файл с кодом regression-practice07.R
Что [почитать] по теме
Памятки по темам
- Парная линейная регрессия: основные понятия и формулы, условия Гаусса-Маркова, распределение оценок коэффициентов модели PDF.
Домашние задания
Домашнее задание | Условия | Дедлайн | Куда сдавать |
---|---|---|---|
Домашнее задание 1 | варианты данные | 6 октября 23:59 | по группам: 211 212 213 214 |
Домашнее задание 2 | задание | 15 октября 23:59 | по группам: 211 212 213 214 |
Домашнее задание 3 | задание данные | 23 октября 23:59 или 26 октября 15:00 | по группам: 211 212 213 214 |