Основы анализа данных в Python: различия между версиями
Перейти к навигации
Перейти к поиску
Строка 25: | Строка 25: | ||
* Официальная [https://docs.scipy.org/doc/scipy/reference/stats.html документация] модуля stats из библиотеки scipy. | * Официальная [https://docs.scipy.org/doc/scipy/reference/stats.html документация] модуля stats из библиотеки scipy. | ||
− | === Неделя 3. Визуализация данных с библиотекой matplotlib === | + | === Неделя 3. Визуализация данных с библиотекой matplotlib. === |
* Файл [https://www.dropbox.com/s/9imk6146ye0mxio/wiki.csv?dl=0 wiki.csv], [https://github.com/allatambov/PyDataAnalysis/blob/main/wiki_codebook.pdf файл] с описанием данных. | * Файл [https://www.dropbox.com/s/9imk6146ye0mxio/wiki.csv?dl=0 wiki.csv], [https://github.com/allatambov/PyDataAnalysis/blob/main/wiki_codebook.pdf файл] с описанием данных. | ||
Строка 32: | Строка 32: | ||
Дополнительно: | Дополнительно: | ||
+ | * Визуализация данных с matplotlib: более продвинутые примеры (TBA). | ||
* [https://matplotlib.org/stable/tutorials/colors/colors.html Форматы] цветов в matplotlib, [https://g.co/kgs/fms1DF палитра] цветов от Google. | * [https://matplotlib.org/stable/tutorials/colors/colors.html Форматы] цветов в matplotlib, [https://g.co/kgs/fms1DF палитра] цветов от Google. | ||
* Типы [https://matplotlib.org/stable/api/markers_api.html маркеров] и [https://matplotlib.org/stable/gallery/lines_bars_and_markers/linestyles.html линий] в matplotlib. | * Типы [https://matplotlib.org/stable/api/markers_api.html маркеров] и [https://matplotlib.org/stable/gallery/lines_bars_and_markers/linestyles.html линий] в matplotlib. | ||
+ | * Официальная документация: [https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.hist.html hist()], [https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.plot.html plot()], [https://pandas.pydata.org/docs/reference/api/pandas.plotting.scatter_matrix.html scatter_matrix()], [https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.bar.html bar()]. |
Версия 01:20, 29 сентября 2022
Дорогие студенты!
Это страница курса по выбору «Основы анализа данных в Python», читаемого на программе «Политология» 3 курса бакалавриата в 1 модуле 2022-2023 учебного года.
Лекции читает: Стукал Денис Константинович.
Семинары ведут: Тамбовцева Алла Андреевна, Беленков Вадим Евгеньевич (семинары 1-2).
Содержание
Правила игры
- Формула оценки: 0.25 * Экзамен + 0.08 * ДЗ1 + 0.08 * ДЗ2 + 0.08 * ДЗ3 + 0.08 * ДЗ4 + 0.08 * ДЗ5 + 0.1 * ДЗ6 + 0.25 * Проект.
- Программа курса.
- Домашние задания, начиная с третьей недели курса, сдаются через запросы Dropbox.
Материалы практических занятий
Недели 1-2. Предварительная обработка данных. Введение в анализ данных.
- Файл wiki.csv, файл с описанием данных.
- Доверительные интервалы, проверка гипотез, коэффициенты корреляции (читать, скачать).
Дополнительно:
- NumPy arrays, Pandas Series, Pandas DataFrame (читать).
- Работа с датафреймами pandas: часть 1 , часть 2, часть 3, файл с данными firtree.csv.
- Официальная документация модуля stats из библиотеки scipy.
Неделя 3. Визуализация данных с библиотекой matplotlib.
Дополнительно: