Введение в регрессионный анализ: различия между версиями
(не показаны 4 промежуточные версии этого же участника) | |||
Строка 38: | Строка 38: | ||
* файл с данными [https://raw.githubusercontent.com/allatambov/IntroToReg22/main/canada.csv canada.csv], файл с кодом [https://www.dropbox.com/s/ngwwhm0w54hpzau/regression-practice01.R?dl=0 regression-practice01.R], конспект [https://github.com/allatambov/IntroToReg22/blob/main/practice-01.pdf practice01.pdf] | * файл с данными [https://raw.githubusercontent.com/allatambov/IntroToReg22/main/canada.csv canada.csv], файл с кодом [https://www.dropbox.com/s/ngwwhm0w54hpzau/regression-practice01.R?dl=0 regression-practice01.R], конспект [https://github.com/allatambov/IntroToReg22/blob/main/practice-01.pdf practice01.pdf] | ||
− | * | + | * [http://www.stat.columbia.edu/~tzheng/files/Rcolor.pdf список] цветов в R, [https://g.co/kgs/XRJz41 палитра] цветов от Google. |
− | |||
Что [https://github.com/allatambov/IntroToReg22/blob/main/read01.md почитать] по теме. | Что [https://github.com/allatambov/IntroToReg22/blob/main/read01.md почитать] по теме. | ||
Строка 51: | Строка 50: | ||
* [https://www.dropbox.com/sh/r5wdz4wurs4o0zq/AAAN_uSQInFNLopyUKyrfX6ha?dl=0 видеозапись] семинаров | * [https://www.dropbox.com/sh/r5wdz4wurs4o0zq/AAAN_uSQInFNLopyUKyrfX6ha?dl=0 видеозапись] семинаров | ||
* файл с данными [https://raw.githubusercontent.com/allatambov/IntroToReg22/main/canada.csv canada.csv], файл с кодом [https://www.dropbox.com/s/lakh34s75e2oczj/regression-practice02.R?dl=0 regression-practice02.R]. | * файл с данными [https://raw.githubusercontent.com/allatambov/IntroToReg22/main/canada.csv canada.csv], файл с кодом [https://www.dropbox.com/s/lakh34s75e2oczj/regression-practice02.R?dl=0 regression-practice02.R]. | ||
− | |||
Что [https://github.com/allatambov/IntroToReg22/blob/main/read02.md почитать] по теме. | Что [https://github.com/allatambov/IntroToReg22/blob/main/read02.md почитать] по теме. | ||
Строка 61: | Строка 59: | ||
'''Практикум 3.''' Анализ остатков модели. Качество линейной модели и ANOVA-таблица. | '''Практикум 3.''' Анализ остатков модели. Качество линейной модели и ANOVA-таблица. | ||
− | * семинарский [https://www.dropbox.com/s/r204jyfmwm4lgw2/problems01.pdf?dl=0 листок], [https://www.dropbox.com/s/6ltda08u3l2toaj/problems01-solutions.pdf?dl=0 решения], [https://www.dropbox.com/sh/tdh0dhr2b5qocta/AAB1wGE-rjV7q_yZV2wBx4H_a?dl=0 | + | * семинарский [https://www.dropbox.com/s/r204jyfmwm4lgw2/problems01.pdf?dl=0 листок], [https://www.dropbox.com/s/6ltda08u3l2toaj/problems01-solutions.pdf?dl=0 решения], [https://www.dropbox.com/sh/tdh0dhr2b5qocta/AAB1wGE-rjV7q_yZV2wBx4H_a?dl=0 видеозапись] семинаров |
* файл с данными [https://raw.githubusercontent.com/allatambov/IntroToReg22/main/life_expect.csv life_expect.csv], файл с кодом [https://www.dropbox.com/s/5k2fiezb1f5f6bj/regression-practice03.R?dl=0 regression-practice03.R], конспект [https://www.dropbox.com/s/y6shqm2hmp9mwiq/practice03.pdf?dl=0 practice03.pdf] | * файл с данными [https://raw.githubusercontent.com/allatambov/IntroToReg22/main/life_expect.csv life_expect.csv], файл с кодом [https://www.dropbox.com/s/5k2fiezb1f5f6bj/regression-practice03.R?dl=0 regression-practice03.R], конспект [https://www.dropbox.com/s/y6shqm2hmp9mwiq/practice03.pdf?dl=0 practice03.pdf] | ||
− | |||
Что [https://github.com/allatambov/IntroToReg22/blob/main/read03.md почитать] по теме | Что [https://github.com/allatambov/IntroToReg22/blob/main/read03.md почитать] по теме | ||
Строка 73: | Строка 70: | ||
'''Практикум 4. ''' Парная линейная модель с бинарным предиктором. Множественная регрессия. | '''Практикум 4. ''' Парная линейная модель с бинарным предиктором. Множественная регрессия. | ||
− | * [https://www.dropbox.com/sh/a3iv0lqa9azfno0/AAAc2iESo3-uxhjvKVDh5-Oia?dl=0 | + | * [https://www.dropbox.com/sh/a3iv0lqa9azfno0/AAAc2iESo3-uxhjvKVDh5-Oia?dl=0 видеозапись] семинаров |
* файл с данными [https://www.dropbox.com/s/dcj3rti1dfhtdns/canada.csv?dl=0 canada.csv], файл с кодом [https://www.dropbox.com/s/n7dp8yw5jgi8chh/regression-practice04.R?dl=0 regression-practice04.R] | * файл с данными [https://www.dropbox.com/s/dcj3rti1dfhtdns/canada.csv?dl=0 canada.csv], файл с кодом [https://www.dropbox.com/s/n7dp8yw5jgi8chh/regression-practice04.R?dl=0 regression-practice04.R] | ||
* [http://shiny.calpoly.sh/3d_regression/ визуализация] для множественной регрессии | * [http://shiny.calpoly.sh/3d_regression/ визуализация] для множественной регрессии | ||
Строка 83: | Строка 80: | ||
'''Практикум 5. '''Множественная регрессия на экспериментальных данных. Выявление гетероскедастичности. | '''Практикум 5. '''Множественная регрессия на экспериментальных данных. Выявление гетероскедастичности. | ||
− | * [https://www.dropbox.com/sh/slzecrha80g6h7w/AAB9t-dpbedcI5ZhRugZ1K0ra?dl=0 | + | * [https://www.dropbox.com/sh/slzecrha80g6h7w/AAB9t-dpbedcI5ZhRugZ1K0ra?dl=0 видеозапись] семинаров |
* файл с данными [https://www.dropbox.com/s/l5jmq9js6cl8djf/diet.csv?dl=0 diet.csv], файл с кодом [https://www.dropbox.com/s/kg94n9xst6k0qju/regression-practice05.R?dl=0 regression-practice05.R] | * файл с данными [https://www.dropbox.com/s/l5jmq9js6cl8djf/diet.csv?dl=0 diet.csv], файл с кодом [https://www.dropbox.com/s/kg94n9xst6k0qju/regression-practice05.R?dl=0 regression-practice05.R] | ||
Строка 92: | Строка 89: | ||
'''Лекция 6.''' Проверка условий Гаусса-Маркова для множественной регрессии. Проверка нормальности остатков модели. | '''Лекция 6.''' Проверка условий Гаусса-Маркова для множественной регрессии. Проверка нормальности остатков модели. | ||
− | + | '''Практикум 6. '''Проверка условий Гаусса-Маркова для множественной регрессии. | |
− | + | * [https://www.dropbox.com/sh/zk19xymwzjh38br/AAD45A-p_v9jXcqzd1E8u5qaa?dl=0 видеозапись] семинаров, не везде все записалось, рекомендую запись группы 214 | |
+ | * файл с данными [https://www.dropbox.com/s/ktzkqae6sprx92m/Salaries.csv?dl=0 Salaries.csv], файл с кодом [https://www.dropbox.com/s/dteqxaxzmrgwkzm/regression-practice06.R?dl=0 regression-practice06.R], конспект [https://github.com/allatambov/IntroToReg22/blob/main/practice06.pdf regression-practice06.pdf] (если не открывается – [https://www.dropbox.com/s/iprst99b0p5twt3/practice06.pdf?dl=0 здесь]). | ||
+ | |||
+ | Что [https://github.com/allatambov/IntroToReg22/blob/main/read06.md почитать] по теме | ||
+ | |||
+ | === Неделя 7. Difference-in-Differences === | ||
+ | |||
+ | * [https://www.dropbox.com/scl/fo/vfcd055emktxcv3ap9a9j/h?dl=0&rlkey=adv0uv3v5k7f1r16xbbfseii7 видеозапись] семинаров | ||
+ | * файл с данными [https://www.dropbox.com/s/xwinypgs4f5e1sq/draca_upd.csv?dl=0 draca_upd.csv], файл с кодом [https://www.dropbox.com/s/93m79jt8n5obzvq/regressions-practice07.R?dl=0 regression-practice07.R] | ||
− | + | Что [почитать] по теме | |
− | |||
=== Памятки по темам === | === Памятки по темам === | ||
− | * Парная линейная регрессия: основные понятия и формулы, условия Гаусса-Маркова, распределение оценок коэффициентов модели | + | * Парная линейная регрессия: основные понятия и формулы, условия Гаусса-Маркова, распределение оценок коэффициентов модели [https://www.dropbox.com/s/04ysfu1zvtnu4re/regressions.pdf?dl=0 PDF]. |
== Домашние задания == | == Домашние задания == |
Текущая версия на 01:21, 23 октября 2022
Дорогие студенты!
Это страница обязательного курса «Введение в регрессионный анализ», читаемого на программе «Политология» 2 курса бакалавриата в 1 модуле 2022-2023 учебного года.
Лекции читает: Макаров Алексей Алексеевич.
Семинары ведёт: Тамбовцева Алла Андреевна.
Гостевые лекторы: Стукал Денис Константинович, Сальникова Дарья Вячеславовна, Седашов Евгений Александрович.
Содержание
- 1 Правила игры
- 2 Программное обеспечение
- 3 Материалы занятий
- 3.1 Неделя 1. Введение в регрессионный анализ.
- 3.2 Неделя 2. Парная линейная регрессия. Условия Гаусса-Маркова.
- 3.3 Неделя 3. Оценка качества модели. Парная регрессия с бинарным предиктором.
- 3.4 Неделя 4. Парная регрессия с бинарным предиктором. Множественная регрессия.
- 3.5 Неделя 5. Гетероскедастичность и влиятельные наблюдения.
- 3.6 Неделя 6. Проверка условий Гаусса-Маркова для множественной регрессии.
- 3.7 Неделя 7. Difference-in-Differences
- 3.8 Памятки по темам
- 4 Домашние задания
Правила игры
- Формула оценки: Итог = 0.15 * ДЗ1 + 0.15 * ДЗ2 + 0.25 * ДЗ3 + 0.15 * Проверочная работа + 0.3 * Экзамен.
- Подробные пояснения по формам контроля можно посмотреть здесь.
- Домашние задания сдаются в электронном виде через запросы Dropbox.
- Домашнее задание можно сдать в течение суток после дедлайна с потерей 2 баллов от полученной оценки. Работы, сданные позже, не проверяются.
Программное обеспечение
Для работы на этом курсе необходимо установить (именно в таком порядке): R и RStudio. Если у вас уже установлена более ранняя версия R или RStudio, специально переустанавливать их не нужно, они подходят для работы в рамках курса. Ссылки для скачивания:
- R: для Windows, для Mac OS (файл R-4.2.1.pkg);
- RStudio: для разных систем.
При желании можно воспользоваться облачной версией RStudio Cloud.
Введение в R и RStudio:
- Интерфейс RStudio, работа с консолью, сохранение выборки в виде числового вектора и её описание (видео).
- Создание файла с кодом, загрузка данных из csv-файла, предварительное знакомство с данными (видео, CSV).
- Примеры построения графиков в R (видео).
Материалы занятий
Неделя 1. Введение в регрессионный анализ.
Лекция 1. Коэффициент корреляции Пирсона и парная линейная регрессия. Метод наименьших квадратов.
Практикум 1. Введение в работу с данными. Коэффициент корреляции Пирсона и парная линейная регрессия.
- файл с данными canada.csv, файл с кодом regression-practice01.R, конспект practice01.pdf
- список цветов в R, палитра цветов от Google.
Что почитать по теме.
Неделя 2. Парная линейная регрессия. Условия Гаусса-Маркова.
Лекция 2. Парная линейная регрессия. Условия Гаусса-Маркова. Распределение оценок коэффициентов модели.
Практикум 2. Парная линейная регрессия. Анализ остатков модели.
- видеозапись семинаров
- файл с данными canada.csv, файл с кодом regression-practice02.R.
Что почитать по теме.
Неделя 3. Оценка качества модели. Парная регрессия с бинарным предиктором.
Лекция 3. Качество модели: ANOVA-таблица и коэффициент детерминации. Парная регрессия с бинарным предиктором.
Практикум 3. Анализ остатков модели. Качество линейной модели и ANOVA-таблица.
- семинарский листок, решения, видеозапись семинаров
- файл с данными life_expect.csv, файл с кодом regression-practice03.R, конспект practice03.pdf
Что почитать по теме
Неделя 4. Парная регрессия с бинарным предиктором. Множественная регрессия.
Лекция 4. Парная регрессия с бинарным предиктором. Множественная регрессия.
Практикум 4. Парная линейная модель с бинарным предиктором. Множественная регрессия.
- видеозапись семинаров
- файл с данными canada.csv, файл с кодом regression-practice04.R
- визуализация для множественной регрессии
Неделя 5. Гетероскедастичность и влиятельные наблюдения.
Лекция 5. Гетероскедастичность и влиятельные наблюдения.
Практикум 5. Множественная регрессия на экспериментальных данных. Выявление гетероскедастичности.
- видеозапись семинаров
- файл с данными diet.csv, файл с кодом regression-practice05.R
Что почитать по теме
Неделя 6. Проверка условий Гаусса-Маркова для множественной регрессии.
Лекция 6. Проверка условий Гаусса-Маркова для множественной регрессии. Проверка нормальности остатков модели.
Практикум 6. Проверка условий Гаусса-Маркова для множественной регрессии.
- видеозапись семинаров, не везде все записалось, рекомендую запись группы 214
- файл с данными Salaries.csv, файл с кодом regression-practice06.R, конспект regression-practice06.pdf (если не открывается – здесь).
Что почитать по теме
Неделя 7. Difference-in-Differences
- видеозапись семинаров
- файл с данными draca_upd.csv, файл с кодом regression-practice07.R
Что [почитать] по теме
Памятки по темам
- Парная линейная регрессия: основные понятия и формулы, условия Гаусса-Маркова, распределение оценок коэффициентов модели PDF.
Домашние задания
Домашнее задание | Условия | Дедлайн | Куда сдавать |
---|---|---|---|
Домашнее задание 1 | варианты данные | 6 октября 23:59 | по группам: 211 212 213 214 |
Домашнее задание 2 | задание | 15 октября 23:59 | по группам: 211 212 213 214 |
Домашнее задание 3 | задание данные | 23 октября 23:59 или 26 октября 15:00 | по группам: 211 212 213 214 |