Основы анализа данных в Python: различия между версиями
Перейти к навигации
Перейти к поиску
Строка 47: | Строка 47: | ||
| [https://nbviewer.org/github/allatambov/PyDataAnalysis/blob/main/pydata-hw02a.ipynb Домашнее задание 2а] || [https://www.dropbox.com/s/mcytt75gioo7noo/pydata-hw02a.ipynb?dl=0 ipynb] [https://www.dropbox.com/s/z65v6i5no2maupq/responses_py.csv?dl=0 responses_py.csv] [https://www.dropbox.com/s/ecv0285f11ao35g/life_expect.csv?dl=0 life_expect.csv] || 04.10 23:59 || [https://www.dropbox.com/request/Y7SXyIxj1ofuPo9QXtTg ссылка] | | [https://nbviewer.org/github/allatambov/PyDataAnalysis/blob/main/pydata-hw02a.ipynb Домашнее задание 2а] || [https://www.dropbox.com/s/mcytt75gioo7noo/pydata-hw02a.ipynb?dl=0 ipynb] [https://www.dropbox.com/s/z65v6i5no2maupq/responses_py.csv?dl=0 responses_py.csv] [https://www.dropbox.com/s/ecv0285f11ao35g/life_expect.csv?dl=0 life_expect.csv] || 04.10 23:59 || [https://www.dropbox.com/request/Y7SXyIxj1ofuPo9QXtTg ссылка] | ||
|- | |- | ||
− | | Домашнее задание 3 || [https://www.dropbox.com/s/1xqge3y53rgua2i/pydata-hw03.ipynb?dl=0 ipynb] [https://www.dropbox.com/s/ipuixw0554p1owe/canada.csv?dl=0 canada.csv] || 07.10 23:59 || [https://www.dropbox.com/request/aO7L3I3TEO7uMkvILnDo ссылка] | + | | [https://github.com/allatambov/PyDataAnalysis/blob/main/pydata-hw03.ipynb Домашнее задание 3] || [https://www.dropbox.com/s/1xqge3y53rgua2i/pydata-hw03.ipynb?dl=0 ipynb] [https://www.dropbox.com/s/ipuixw0554p1owe/canada.csv?dl=0 canada.csv] || 07.10 23:59 || [https://www.dropbox.com/request/aO7L3I3TEO7uMkvILnDo ссылка] |
|- | |- | ||
| Домашнее задание 4 || || || | | Домашнее задание 4 || || || |
Версия 16:08, 29 сентября 2022
Дорогие студенты!
Это страница курса по выбору «Основы анализа данных в Python», читаемого на программе «Политология» 3 курса бакалавриата в 1 модуле 2022-2023 учебного года.
Лекции читает: Стукал Денис Константинович.
Семинары ведут: Тамбовцева Алла Андреевна, Беленков Вадим Евгеньевич (семинары 1-2).
Содержание
Правила игры
- Формула оценки: 0.25 * Экзамен + 0.08 * ДЗ1 + 0.08 * ДЗ2 + 0.08 * ДЗ3 + 0.08 * ДЗ4 + 0.08 * ДЗ5 + 0.1 * ДЗ6 + 0.25 * Проект.
- Программа курса.
- Домашние задания, начиная с третьей недели курса, сдаются через запросы Dropbox.
Материалы практических занятий
Недели 1-2. Предварительная обработка данных. Введение в анализ данных.
- Файл wiki.csv, файл с описанием данных.
- Доверительные интервалы, проверка гипотез, коэффициенты корреляции (читать, скачать).
Дополнительно:
- NumPy arrays, Pandas Series, Pandas DataFrame (читать).
- Работа с датафреймами pandas: часть 1 , часть 2, часть 3, файл с данными firtree.csv.
- Официальная документация модуля stats из библиотеки scipy.
Неделя 3. Визуализация данных с библиотекой matplotlib.
Дополнительно:
- Визуализация данных с matplotlib: более продвинутые примеры (TBA).
- Форматы цветов в matplotlib, палитра цветов от Google.
- Типы маркеров и линий в matplotlib.
- Официальная документация: hist(), plot(), scatter_matrix(), bar().
Домашние задания
Домашние задания 1-2 сдавались через SmartLMS.
Домашнее задание | Файлы | Дедлайн | Куда сдавать |
---|---|---|---|
Домашнее задание 2а | ipynb responses_py.csv life_expect.csv | 04.10 23:59 | ссылка |
Домашнее задание 3 | ipynb canada.csv | 07.10 23:59 | ссылка |
Домашнее задание 4 | |||
Домашнее задание 5 | |||
Домашнее задание 6 |