Основы анализа данных в Python
		
		
		
		
		
		
		Перейти к навигации
		Перейти к поиску
		
		
		
		
		
		
		
	
Дорогие студенты!
Это страница курса по выбору «Основы анализа данных в Python», читаемого на программе «Политология» 3 курса бакалавриата в 1 модуле 2022-2023 учебного года.
Лекции читает: Стукал Денис Константинович. 
Семинары ведут: Тамбовцева Алла Андреевна, Беленков Вадим Евгеньевич (семинары 1-2).
Правила игры
- Формула оценки: 0.25 * Экзамен + 0.08 * ДЗ1 + 0.08 * ДЗ2 + 0.08 * ДЗ3 + 0.08 * ДЗ4 + 0.08 * ДЗ5 + 0.1 * ДЗ6 + 0.25 * Проект.
 - Программа курса.
 - Домашние задания, начиная с третьей недели курса, сдаются через запросы Dropbox.
 
Материалы практических занятий
Недели 1-2. Предварительная обработка данных. Введение в анализ данных.
- Файл wiki.csv, файл с описанием данных.
 - Доверительные интервалы, проверка гипотез, коэффициенты корреляции (читать, скачать).
 
Дополнительно:
- NumPy arrays, Pandas Series, Pandas DataFrame (читать).
 - Работа с датафреймами pandas: часть 1 , часть 2, часть 3, файл с данными firtree.csv.
 - Официальная документация модуля stats из библиотеки scipy.
 
Неделя 3. Визуализация данных с библиотекой matplotlib.
Дополнительно:
- Визуализация данных с matplotlib: более продвинутые примеры (TBA).
 - Форматы цветов в matplotlib, палитра цветов от Google.
 - Типы маркеров и линий в matplotlib.
 - Официальная документация: hist(), plot(), scatter_matrix(), bar().
 
Неделя 4. Линейная регрессия с библиотекой statsmodels.
- Данные для работы: можно скопировать ссылку или скачать файл Salaries.csv, описание данных.
 - Парная и множественная линейная регрессия со statsmodels (читать, скачать).
 
Неделя 5. Линейная регрессия с эффектами взаимодействия.
- Данные для работы: можно скопировать ссылку или скачать файл Salaries.csv, описание данных.
 
Дополнительно:
- Гетероскедастичность и влиятельные наблюдения (TBA).
 
Неделя 6. Логистическая регрессия.
Домашние задания
Домашние задания 1-2 сдавались через SmartLMS.
| Домашнее задание | Файлы | Дедлайн | Куда сдавать | 
|---|---|---|---|
| Домашнее задание 2а | ipynb responses_py.csv life_expect.csv | 04.10 23:59 | ссылка | 
| Домашнее задание 3 | ipynb canada.csv | 07.10 23:59 | ссылка | 
| Домашнее задание 4 | ipynb research.csv nyc_squirrels.csv | 13.10 23:59 | ссылка | 
| Домашнее задание 5 | ipynb research.csv | 18.10 23:59 | ссылка | 
| Домашнее задание 6 | ipynb spanish_data.csv | 23.10 15:00 | ссылка |