Введение в регрессионный анализ: различия между версиями
Строка 39: | Строка 39: | ||
'''Практикум 1.''' Введение в работу с данными. Коэффициент корреляции Пирсона и парная линейная регрессия. | '''Практикум 1.''' Введение в работу с данными. Коэффициент корреляции Пирсона и парная линейная регрессия. | ||
− | * файл с данными [https://raw.githubusercontent.com/allatambov/IntroToReg22/main/canada.csv canada.csv], файл с кодом [https:// | + | * файл с данными [https://raw.githubusercontent.com/allatambov/IntroToReg22/main/canada.csv canada.csv], файл с кодом [https://www.dropbox.com/s/ngwwhm0w54hpzau/regression-practice01.R?dl=0 regression-practice01.R], конспект [https://github.com/allatambov/IntroToReg22/blob/main/practice-01.pdf practice01.pdf] |
* все файлы в одной [https://www.dropbox.com/sh/f4fj8dv2xz2cqen/AAA2nGynupWHheArtWbi_5uTa?dl=0 папке] на Dropbox | * все файлы в одной [https://www.dropbox.com/sh/f4fj8dv2xz2cqen/AAA2nGynupWHheArtWbi_5uTa?dl=0 папке] на Dropbox | ||
Строка 53: | Строка 53: | ||
* семинарский [https://www.dropbox.com/s/r204jyfmwm4lgw2/problems01.pdf?dl=0 листок], [https://www.dropbox.com/sh/r5wdz4wurs4o0zq/AAAN_uSQInFNLopyUKyrfX6ha?dl=0 запись] семинаров | * семинарский [https://www.dropbox.com/s/r204jyfmwm4lgw2/problems01.pdf?dl=0 листок], [https://www.dropbox.com/sh/r5wdz4wurs4o0zq/AAAN_uSQInFNLopyUKyrfX6ha?dl=0 запись] семинаров | ||
− | * файл с данными [https://raw.githubusercontent.com/allatambov/IntroToReg22/main/canada.csv canada.csv], файл с кодом [https:// | + | * файл с данными [https://raw.githubusercontent.com/allatambov/IntroToReg22/main/canada.csv canada.csv], файл с кодом [https://www.dropbox.com/s/lakh34s75e2oczj/regression-practice02.R?dl=0 regression-practice02.R], конспект [practice02.pdf] |
* все файлы в одной [https://www.dropbox.com/sh/ba5x273f7ge1iiw/AACyqt5h3Xlw3cF-SVBW3whaa?dl=0 папке] на Dropbox | * все файлы в одной [https://www.dropbox.com/sh/ba5x273f7ge1iiw/AACyqt5h3Xlw3cF-SVBW3whaa?dl=0 папке] на Dropbox | ||
Строка 64: | Строка 64: | ||
'''Практикум 3.''' Анализ остатков модели. Качество линейной модели и ANOVA-таблица. Парная линейная модель с бинарным предиктором. | '''Практикум 3.''' Анализ остатков модели. Качество линейной модели и ANOVA-таблица. Парная линейная модель с бинарным предиктором. | ||
− | * | + | * семинарский [https://www.dropbox.com/s/r204jyfmwm4lgw2/problems01.pdf?dl=0 листок], [решения], [https://www.dropbox.com/sh/tdh0dhr2b5qocta/AAB1wGE-rjV7q_yZV2wBx4H_a?dl=0 запись] семинаров |
− | + | * файл с данными [https://raw.githubusercontent.com/allatambov/IntroToReg22/main/life_expect.csv life_expect.csv], файл с кодом [https://www.dropbox.com/s/5k2fiezb1f5f6bj/regression-practice03.R?dl=0 regression-practice03.R] | |
− | * все файлы в одной папке на Dropbox | + | * все файлы в одной [https://www.dropbox.com/sh/vijv4tdj16ofjsn/AAAOpoHyOA14qGDjjZHE0FW4a?dl=0 папке] на Dropbox |
=== Памятки по темам === | === Памятки по темам === |
Версия 02:24, 25 сентября 2022
Дорогие студенты!
Это страница обязательного курса «Введение в регрессионный анализ», читаемого на программе «Политология» 2 курса бакалавриата в 1 модуле 2022-2023 учебного года.
Лекции читает: Макаров Алексей Алексеевич.
Семинары ведёт: Тамбовцева Алла Андреевна.
Гостевые лекторы: Стукал Денис Константинович, Сальникова Дарья Вячеславовна, Седашов Евгений Александрович.
Содержание
Правила игры
- Формула оценки: Итог = 0.15 * ДЗ1 + 0.15 * ДЗ2 + 0.25 * ДЗ3 + 0.15 * Проверочная работа + 0.3 * Экзамен.
- Подробные пояснения по формам контроля можно посмотреть здесь.
- Домашние задания сдаются в электронном виде через запросы Dropbox.
- Домашнее задание можно сдать в течение суток после дедлайна с потерей 2 баллов от полученной оценки. Работы, сданные позже, не проверяются.
Программное обеспечение
Для работы на этом курсе необходимо установить (именно в таком порядке): R и RStudio. Если у вас уже установлена более ранняя версия R или RStudio, специально переустанавливать их не нужно, они подходят для работы в рамках курса. Ссылки для скачивания:
- R: для Windows, для Mac OS (файл R-4.2.1.pkg);
- RStudio: для разных систем.
При желании можно воспользоваться облачной версией RStudio Cloud.
Введение в R и RStudio:
- Интерфейс RStudio, работа с консолью, сохранение выборки в виде числового вектора и её описание (видео).
- Создание файла с кодом, загрузка данных из csv-файла, предварительное знакомство с данными (видео, CSV).
- Примеры построения графиков в R (видео).
Материалы занятий
Неделя 1. Введение в регрессионный анализ.
Лекция 1. Повторение основных понятий статистики. Коэффициент корреляции Пирсона и парная линейная регрессия. Метод наименьших квадратов.
- что почитать по теме
Практикум 1. Введение в работу с данными. Коэффициент корреляции Пирсона и парная линейная регрессия.
- файл с данными canada.csv, файл с кодом regression-practice01.R, конспект practice01.pdf
- все файлы в одной папке на Dropbox
Дополнительно: список цветов в R, палитра цветов от Google.
Неделя 2. Парная линейная регрессия. Условия Гаусса-Маркова.
Лекция 2. Парная линейная регрессия. Условия Гаусса-Маркова. Распределение оценок коэффициентов модели. Анализ остатков.
- что почитать по теме
Практикум 2. Парная линейная регрессия. Анализ остатков модели.
- семинарский листок, запись семинаров
- файл с данными canada.csv, файл с кодом regression-practice02.R, конспект [practice02.pdf]
- все файлы в одной папке на Dropbox
Неделя 3. Оценка качества модели. Парная регрессия с бинарным предиктором.
Лекция 3. Качество модели: ANOVA-таблица и коэффициент детерминации. Парная регрессия с бинарным предиктором.
- что почитать по теме
Практикум 3. Анализ остатков модели. Качество линейной модели и ANOVA-таблица. Парная линейная модель с бинарным предиктором.
- семинарский листок, [решения], запись семинаров
- файл с данными life_expect.csv, файл с кодом regression-practice03.R
- все файлы в одной папке на Dropbox
Памятки по темам
- Повторение. Введение в парную линейную регрессию (по мотивам лекции 1). PDF.
- Парная линейная регрессия: основные понятия и формулы, условия Гаусса-Маркова, распределение оценок коэффициентов модели, проверка гипотезы о значимости коэффициента регрессии (по мотивам лекции 2). PDF.
- ANOVA-таблица и коэффициент детерминации (по мотивам лекции 3). PDF.