Основы анализа данных в Python: различия между версиями

Материал из MathINFO
Перейти к навигации Перейти к поиску
Строка 78: Строка 78:
 
| [https://github.com/allatambov/PyDataAnalysis/blob/main/pydata-hw06.ipynb Домашнее задание 6] || [https://www.dropbox.com/s/qbpa93vu2ku09ww/pydata-hw06.ipynb?dl=0 ipynb] [https://www.dropbox.com/s/a1lvgaa2es3r27y/spanish_data.csv?dl=0 spanish_data.csv] || 23.10 15:00|| [https://www.dropbox.com/request/KaWGGdFtCkpjBSJ4yH5I ссылка]
 
| [https://github.com/allatambov/PyDataAnalysis/blob/main/pydata-hw06.ipynb Домашнее задание 6] || [https://www.dropbox.com/s/qbpa93vu2ku09ww/pydata-hw06.ipynb?dl=0 ipynb] [https://www.dropbox.com/s/a1lvgaa2es3r27y/spanish_data.csv?dl=0 spanish_data.csv] || 23.10 15:00|| [https://www.dropbox.com/request/KaWGGdFtCkpjBSJ4yH5I ссылка]
 
|}
 
|}
 +
 +
== Проект ==
 +
 +
* [https://www.dropbox.com/s/99sqz1rxov2moy2/pyproj.pdf?dl=0 Задание], два дедлайна на выбор студента: 23 октября 23:59 и 25 октября 23:59, при сдаче до первого дедлайна можно получить фидбек и оценку до экзамена.
 +
* Выполненное задание нужно загрузить на Dropbox по [https://www.dropbox.com/request/ZAlUBnkP06MACiSZUPTA ссылке].

Версия 22:28, 21 октября 2022

Дорогие студенты!

Это страница курса по выбору «Основы анализа данных в Python», читаемого на программе «Политология» 3 курса бакалавриата в 1 модуле 2022-2023 учебного года.

Лекции читает: Стукал Денис Константинович.
Семинары ведут: Тамбовцева Алла Андреевна, Беленков Вадим Евгеньевич (семинары 1-2).

Правила игры

  • Формула оценки: 0.25 * Экзамен + 0.08 * ДЗ1 + 0.08 * ДЗ2 + 0.08 * ДЗ3 + 0.08 * ДЗ4 + 0.08 * ДЗ5 + 0.1 * ДЗ6 + 0.25 * Проект.
  • Программа курса.
  • Домашние задания, начиная с третьей недели курса, сдаются через запросы Dropbox.

Материалы практических занятий

Недели 1-2. Предварительная обработка данных. Введение в анализ данных.

  • Файл wiki.csv, файл с описанием данных.
  • Доверительные интервалы, проверка гипотез, коэффициенты корреляции (читать, скачать).

Дополнительно:

Неделя 3. Визуализация данных с библиотекой matplotlib.

Дополнительно:

Неделя 4. Линейная регрессия с библиотекой statsmodels.

Неделя 5. Линейная регрессия с эффектами взаимодействия.

Дополнительно:

  • Гетероскедастичность и влиятельные наблюдения (TBA).

Неделя 6. Логистическая регрессия.

  • Данные для работы: можно скопировать ссылку или скачать файл HR.csv, данных.

Домашние задания

Домашние задания 1-2 сдавались через SmartLMS.

Домашнее задание Файлы Дедлайн Куда сдавать
Домашнее задание 2а ipynb responses_py.csv life_expect.csv 04.10 23:59 ссылка
Домашнее задание 3 ipynb canada.csv 07.10 23:59 ссылка
Домашнее задание 4 ipynb research.csv nyc_squirrels.csv 13.10 23:59 ссылка
Домашнее задание 5 ipynb research.csv 18.10 23:59 ссылка
Домашнее задание 6 ipynb spanish_data.csv 23.10 15:00 ссылка

Проект

  • Задание, два дедлайна на выбор студента: 23 октября 23:59 и 25 октября 23:59, при сдаче до первого дедлайна можно получить фидбек и оценку до экзамена.
  • Выполненное задание нужно загрузить на Dropbox по ссылке.