Основы анализа данных в Python: различия между версиями

Материал из MathINFO
Перейти к навигации Перейти к поиску
(Новая страница: «Дорогие студенты! Это страница курса по выбору '''«Основы анализа данных в Python»''', читаем...»)
 
Строка 14: Строка 14:
 
== Материалы практических занятий ==  
 
== Материалы практических занятий ==  
  
=== Недели 1-2. Предварительная обработка данных. Введение в анализ данных ===
+
=== Недели 1-2. Предварительная обработка данных. Введение в анализ данных. ===
  
 
* Файл [https://www.dropbox.com/s/9imk6146ye0mxio/wiki.csv?dl=0 wiki.csv], [https://github.com/allatambov/PyDataAnalysis/blob/main/wiki_codebook.pdf файл] с описанием данных.
 
* Файл [https://www.dropbox.com/s/9imk6146ye0mxio/wiki.csv?dl=0 wiki.csv], [https://github.com/allatambov/PyDataAnalysis/blob/main/wiki_codebook.pdf файл] с описанием данных.
Строка 23: Строка 23:
 
* NumPy arrays, Pandas Series, Pandas DataFrame ([https://nbviewer.jupyter.org/github/allatambov/allatambov.github.io/blob/master/icef/seminars/arrays-pandas.ipynb читать]).
 
* NumPy arrays, Pandas Series, Pandas DataFrame ([https://nbviewer.jupyter.org/github/allatambov/allatambov.github.io/blob/master/icef/seminars/arrays-pandas.ipynb читать]).
 
* Работа с датафреймами pandas: [https://nbviewer.jupyter.org/github/allatambov/allatambov.github.io/blob/master/icef/seminars/pandas-01.ipynb часть 1 ], [https://nbviewer.jupyter.org/github/allatambov/allatambov.github.io/blob/master/icef/seminars/pandas-02.ipynb часть 2], [https://nbviewer.jupyter.org/github/allatambov/allatambov.github.io/blob/master/icef/seminars/pandas-03.ipynb часть 3], файл с данными [https://allatambov.github.io/pydj/seminars/firtree.csv firtree.csv].
 
* Работа с датафреймами pandas: [https://nbviewer.jupyter.org/github/allatambov/allatambov.github.io/blob/master/icef/seminars/pandas-01.ipynb часть 1 ], [https://nbviewer.jupyter.org/github/allatambov/allatambov.github.io/blob/master/icef/seminars/pandas-02.ipynb часть 2], [https://nbviewer.jupyter.org/github/allatambov/allatambov.github.io/blob/master/icef/seminars/pandas-03.ipynb часть 3], файл с данными [https://allatambov.github.io/pydj/seminars/firtree.csv firtree.csv].
 +
* Официальная [https://docs.scipy.org/doc/scipy/reference/stats.html документация] модуля stats из библиотеки scipy.
  
 
=== Неделя 3. Визуализация данных с библиотекой matplotlib ===
 
=== Неделя 3. Визуализация данных с библиотекой matplotlib ===

Версия 01:04, 29 сентября 2022

Дорогие студенты!

Это страница курса по выбору «Основы анализа данных в Python», читаемого на программе «Политология» 3 курса бакалавриата в 1 модуле 2022-2023 учебного года.

Лекции читает: Стукал Денис Константинович.
Семинары ведут: Тамбовцева Алла Андреевна, Беленков Вадим Евгеньевич (семинары 1-2).

Правила игры

  • Формула оценки: 0.25 * Экзамен + 0.08 * ДЗ1 + 0.08 * ДЗ2 + 0.08 * ДЗ3 + 0.08 * ДЗ4 + 0.08 * ДЗ5 + 0.1 * ДЗ6 + 0.25 * Проект.
  • Программа курса.
  • Домашние задания, начиная с третьей недели курса, сдаются через запросы Dropbox.

Материалы практических занятий

Недели 1-2. Предварительная обработка данных. Введение в анализ данных.

  • Файл wiki.csv, файл с описанием данных.
  • Доверительные интервалы, проверка гипотез, коэффициенты корреляции (читать, скачать).

Дополнительно:

Неделя 3. Визуализация данных с библиотекой matplotlib

Дополнительно: