Введение в регрессионный анализ: различия между версиями

Материал из MathINFO
Перейти к навигации Перейти к поиску
Строка 38: Строка 38:
  
 
* файл с данными [https://raw.githubusercontent.com/allatambov/IntroToReg22/main/canada.csv canada.csv], файл с кодом [https://www.dropbox.com/s/ngwwhm0w54hpzau/regression-practice01.R?dl=0 regression-practice01.R], конспект [https://github.com/allatambov/IntroToReg22/blob/main/practice-01.pdf practice01.pdf]
 
* файл с данными [https://raw.githubusercontent.com/allatambov/IntroToReg22/main/canada.csv canada.csv], файл с кодом [https://www.dropbox.com/s/ngwwhm0w54hpzau/regression-practice01.R?dl=0 regression-practice01.R], конспект [https://github.com/allatambov/IntroToReg22/blob/main/practice-01.pdf practice01.pdf]
* все файлы в одной [https://www.dropbox.com/sh/f4fj8dv2xz2cqen/AAA2nGynupWHheArtWbi_5uTa?dl=0 папке] на Dropbox
+
* [http://www.stat.columbia.edu/~tzheng/files/Rcolor.pdf список] цветов в R, [https://g.co/kgs/XRJz41 палитра] цветов от Google.
* дополнительно: [http://www.stat.columbia.edu/~tzheng/files/Rcolor.pdf список] цветов в R, [https://g.co/kgs/XRJz41 палитра] цветов от Google.
 
  
 
Что [https://github.com/allatambov/IntroToReg22/blob/main/read01.md почитать] по теме.
 
Что [https://github.com/allatambov/IntroToReg22/blob/main/read01.md почитать] по теме.
Строка 51: Строка 50:
 
* [https://www.dropbox.com/sh/r5wdz4wurs4o0zq/AAAN_uSQInFNLopyUKyrfX6ha?dl=0 видеозапись] семинаров
 
* [https://www.dropbox.com/sh/r5wdz4wurs4o0zq/AAAN_uSQInFNLopyUKyrfX6ha?dl=0 видеозапись] семинаров
 
* файл с данными [https://raw.githubusercontent.com/allatambov/IntroToReg22/main/canada.csv canada.csv], файл с кодом [https://www.dropbox.com/s/lakh34s75e2oczj/regression-practice02.R?dl=0 regression-practice02.R].
 
* файл с данными [https://raw.githubusercontent.com/allatambov/IntroToReg22/main/canada.csv canada.csv], файл с кодом [https://www.dropbox.com/s/lakh34s75e2oczj/regression-practice02.R?dl=0 regression-practice02.R].
* все файлы в одной [https://www.dropbox.com/sh/ba5x273f7ge1iiw/AACyqt5h3Xlw3cF-SVBW3whaa?dl=0 папке] на Dropbox
 
  
 
Что [https://github.com/allatambov/IntroToReg22/blob/main/read02.md почитать] по теме.
 
Что [https://github.com/allatambov/IntroToReg22/blob/main/read02.md почитать] по теме.
Строка 61: Строка 59:
 
'''Практикум 3.''' Анализ остатков модели. Качество линейной модели и ANOVA-таблица.
 
'''Практикум 3.''' Анализ остатков модели. Качество линейной модели и ANOVA-таблица.
  
* семинарский [https://www.dropbox.com/s/r204jyfmwm4lgw2/problems01.pdf?dl=0 листок], [https://www.dropbox.com/s/6ltda08u3l2toaj/problems01-solutions.pdf?dl=0 решения], [https://www.dropbox.com/sh/tdh0dhr2b5qocta/AAB1wGE-rjV7q_yZV2wBx4H_a?dl=0 запись] семинаров
+
* семинарский [https://www.dropbox.com/s/r204jyfmwm4lgw2/problems01.pdf?dl=0 листок], [https://www.dropbox.com/s/6ltda08u3l2toaj/problems01-solutions.pdf?dl=0 решения], [https://www.dropbox.com/sh/tdh0dhr2b5qocta/AAB1wGE-rjV7q_yZV2wBx4H_a?dl=0 видеозапись] семинаров
 
* файл с данными [https://raw.githubusercontent.com/allatambov/IntroToReg22/main/life_expect.csv life_expect.csv], файл с кодом [https://www.dropbox.com/s/5k2fiezb1f5f6bj/regression-practice03.R?dl=0 regression-practice03.R], конспект [https://www.dropbox.com/s/y6shqm2hmp9mwiq/practice03.pdf?dl=0 practice03.pdf]
 
* файл с данными [https://raw.githubusercontent.com/allatambov/IntroToReg22/main/life_expect.csv life_expect.csv], файл с кодом [https://www.dropbox.com/s/5k2fiezb1f5f6bj/regression-practice03.R?dl=0 regression-practice03.R], конспект [https://www.dropbox.com/s/y6shqm2hmp9mwiq/practice03.pdf?dl=0 practice03.pdf]
* все файлы в одной [https://www.dropbox.com/sh/vijv4tdj16ofjsn/AAAOpoHyOA14qGDjjZHE0FW4a?dl=0 папке] на Dropbox
 
  
 
Что [https://github.com/allatambov/IntroToReg22/blob/main/read03.md почитать] по теме
 
Что [https://github.com/allatambov/IntroToReg22/blob/main/read03.md почитать] по теме
Строка 73: Строка 70:
 
'''Практикум 4. ''' Парная линейная модель с бинарным предиктором. Множественная регрессия.
 
'''Практикум 4. ''' Парная линейная модель с бинарным предиктором. Множественная регрессия.
  
* [https://www.dropbox.com/sh/a3iv0lqa9azfno0/AAAc2iESo3-uxhjvKVDh5-Oia?dl=0 запись] семинаров
+
* [https://www.dropbox.com/sh/a3iv0lqa9azfno0/AAAc2iESo3-uxhjvKVDh5-Oia?dl=0 видеозапись] семинаров
 
* файл с данными [https://www.dropbox.com/s/dcj3rti1dfhtdns/canada.csv?dl=0 canada.csv], файл с кодом [https://www.dropbox.com/s/n7dp8yw5jgi8chh/regression-practice04.R?dl=0 regression-practice04.R]
 
* файл с данными [https://www.dropbox.com/s/dcj3rti1dfhtdns/canada.csv?dl=0 canada.csv], файл с кодом [https://www.dropbox.com/s/n7dp8yw5jgi8chh/regression-practice04.R?dl=0 regression-practice04.R]
 
* [http://shiny.calpoly.sh/3d_regression/ визуализация] для множественной регрессии
 
* [http://shiny.calpoly.sh/3d_regression/ визуализация] для множественной регрессии
Строка 83: Строка 80:
 
'''Практикум 5. '''Множественная регрессия на экспериментальных данных. Выявление гетероскедастичности.
 
'''Практикум 5. '''Множественная регрессия на экспериментальных данных. Выявление гетероскедастичности.
  
* [https://www.dropbox.com/sh/slzecrha80g6h7w/AAB9t-dpbedcI5ZhRugZ1K0ra?dl=0 запись] семинаров
+
* [https://www.dropbox.com/sh/slzecrha80g6h7w/AAB9t-dpbedcI5ZhRugZ1K0ra?dl=0 видеозапись] семинаров
 
* файл с данными [https://www.dropbox.com/s/l5jmq9js6cl8djf/diet.csv?dl=0 diet.csv], файл с кодом [https://www.dropbox.com/s/kg94n9xst6k0qju/regression-practice05.R?dl=0 regression-practice05.R]
 
* файл с данными [https://www.dropbox.com/s/l5jmq9js6cl8djf/diet.csv?dl=0 diet.csv], файл с кодом [https://www.dropbox.com/s/kg94n9xst6k0qju/regression-practice05.R?dl=0 regression-practice05.R]
  
Строка 98: Строка 95:
  
 
Что [https://github.com/allatambov/IntroToReg22/blob/main/read06.md почитать] по теме
 
Что [https://github.com/allatambov/IntroToReg22/blob/main/read06.md почитать] по теме
 +
 +
=== Неделя 7. Difference-in-Differences ===
 +
 +
* [https://www.dropbox.com/scl/fo/vfcd055emktxcv3ap9a9j/h?dl=0&rlkey=adv0uv3v5k7f1r16xbbfseii7 видеозапись] семинаров
 +
* файл с данными [https://www.dropbox.com/s/xwinypgs4f5e1sq/draca_upd.csv?dl=0 draca_upd.csv], файл с кодом [https://www.dropbox.com/s/93m79jt8n5obzvq/regressions-practice07.R?dl=0 regression-practice07.R]
 +
 +
Что [почитать] по теме
  
 
=== Памятки по темам ===
 
=== Памятки по темам ===

Версия 01:46, 22 октября 2022

Дорогие студенты!

Это страница обязательного курса «Введение в регрессионный анализ», читаемого на программе «Политология» 2 курса бакалавриата в 1 модуле 2022-2023 учебного года.

Лекции читает: Макаров Алексей Алексеевич.
Семинары ведёт: Тамбовцева Алла Андреевна.
Гостевые лекторы: Стукал Денис Константинович, Сальникова Дарья Вячеславовна, Седашов Евгений Александрович.

Правила игры

  • Формула оценки: Итог = 0.15 * ДЗ1 + 0.15 * ДЗ2 + 0.25 * ДЗ3 + 0.15 * Проверочная работа + 0.3 * Экзамен.
  • Подробные пояснения по формам контроля можно посмотреть здесь.
  • Домашние задания сдаются в электронном виде через запросы Dropbox.
  • Домашнее задание можно сдать в течение суток после дедлайна с потерей 2 баллов от полученной оценки. Работы, сданные позже, не проверяются.

Программное обеспечение

Для работы на этом курсе необходимо установить (именно в таком порядке): R и RStudio. Если у вас уже установлена более ранняя версия R или RStudio, специально переустанавливать их не нужно, они подходят для работы в рамках курса. Ссылки для скачивания:

При желании можно воспользоваться облачной версией RStudio Cloud.

Введение в R и RStudio:

  • Интерфейс RStudio, работа с консолью, сохранение выборки в виде числового вектора и её описание (видео).
  • Создание файла с кодом, загрузка данных из csv-файла, предварительное знакомство с данными (видео, CSV).
  • Примеры построения графиков в R (видео).

Материалы занятий

Неделя 1. Введение в регрессионный анализ.

Лекция 1. Коэффициент корреляции Пирсона и парная линейная регрессия. Метод наименьших квадратов.

Практикум 1. Введение в работу с данными. Коэффициент корреляции Пирсона и парная линейная регрессия.

Что почитать по теме.

Неделя 2. Парная линейная регрессия. Условия Гаусса-Маркова.

Лекция 2. Парная линейная регрессия. Условия Гаусса-Маркова. Распределение оценок коэффициентов модели.

Практикум 2. Парная линейная регрессия. Анализ остатков модели.

Что почитать по теме.

Неделя 3. Оценка качества модели. Парная регрессия с бинарным предиктором.

Лекция 3. Качество модели: ANOVA-таблица и коэффициент детерминации. Парная регрессия с бинарным предиктором.

Практикум 3. Анализ остатков модели. Качество линейной модели и ANOVA-таблица.

Что почитать по теме

Неделя 4. Парная регрессия с бинарным предиктором. Множественная регрессия.

Лекция 4. Парная регрессия с бинарным предиктором. Множественная регрессия.

Практикум 4. Парная линейная модель с бинарным предиктором. Множественная регрессия.

Неделя 5. Гетероскедастичность и влиятельные наблюдения.

Лекция 5. Гетероскедастичность и влиятельные наблюдения.

Практикум 5. Множественная регрессия на экспериментальных данных. Выявление гетероскедастичности.

Что почитать по теме

Неделя 6. Проверка условий Гаусса-Маркова для множественной регрессии.

Лекция 6. Проверка условий Гаусса-Маркова для множественной регрессии. Проверка нормальности остатков модели.

Практикум 6. Проверка условий Гаусса-Маркова для множественной регрессии.

Что почитать по теме

Неделя 7. Difference-in-Differences

Что [почитать] по теме

Памятки по темам

  • Парная линейная регрессия: основные понятия и формулы, условия Гаусса-Маркова, распределение оценок коэффициентов модели PDF.

Домашние задания

Домашнее задание Условия Дедлайн Куда сдавать
Домашнее задание 1 варианты данные 6 октября 23:59 по группам: 211 212 213 214
Домашнее задание 2 задание 15 октября 23:59 по группам: 211 212 213 214
Домашнее задание 3 задание данные 23 октября 23:59 или 26 октября 15:00 по группам: 211 212 213 214