Основы анализа данных в Python: различия между версиями

Материал из MathINFO
Перейти к навигации Перейти к поиску
Строка 36: Строка 36:
 
* Типы [https://matplotlib.org/stable/api/markers_api.html маркеров] и [https://matplotlib.org/stable/gallery/lines_bars_and_markers/linestyles.html линий] в matplotlib.
 
* Типы [https://matplotlib.org/stable/api/markers_api.html маркеров] и [https://matplotlib.org/stable/gallery/lines_bars_and_markers/linestyles.html линий] в matplotlib.
 
* Официальная документация: [https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.hist.html hist()], [https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.plot.html plot()], [https://pandas.pydata.org/docs/reference/api/pandas.plotting.scatter_matrix.html scatter_matrix()], [https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.bar.html bar()].
 
* Официальная документация: [https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.hist.html hist()], [https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.plot.html plot()], [https://pandas.pydata.org/docs/reference/api/pandas.plotting.scatter_matrix.html scatter_matrix()], [https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.bar.html bar()].
 +
 +
=== Неделя 4. Линейная регрессия с библиотекой statsmodels.  ===
 +
 +
* Данные для работы: можно скопировать [https://vincentarelbundock.github.io/Rdatasets/csv/carData/Salaries.csv ссылку] или скачать файл [https://www.dropbox.com/s/nx7bi0mkopteqj3/Salaries.csv?dl=0 Salaries.csv], [https://vincentarelbundock.github.io/Rdatasets/doc/carData/Salaries.html описание] данных.
 +
* Парная и множественная линейная регрессия со statsmodels (читать, скачать).
  
 
== Домашние задания ==  
 
== Домашние задания ==  

Версия 11:27, 4 октября 2022

Дорогие студенты!

Это страница курса по выбору «Основы анализа данных в Python», читаемого на программе «Политология» 3 курса бакалавриата в 1 модуле 2022-2023 учебного года.

Лекции читает: Стукал Денис Константинович.
Семинары ведут: Тамбовцева Алла Андреевна, Беленков Вадим Евгеньевич (семинары 1-2).

Правила игры

  • Формула оценки: 0.25 * Экзамен + 0.08 * ДЗ1 + 0.08 * ДЗ2 + 0.08 * ДЗ3 + 0.08 * ДЗ4 + 0.08 * ДЗ5 + 0.1 * ДЗ6 + 0.25 * Проект.
  • Программа курса.
  • Домашние задания, начиная с третьей недели курса, сдаются через запросы Dropbox.

Материалы практических занятий

Недели 1-2. Предварительная обработка данных. Введение в анализ данных.

  • Файл wiki.csv, файл с описанием данных.
  • Доверительные интервалы, проверка гипотез, коэффициенты корреляции (читать, скачать).

Дополнительно:

Неделя 3. Визуализация данных с библиотекой matplotlib.

Дополнительно:

Неделя 4. Линейная регрессия с библиотекой statsmodels.

  • Данные для работы: можно скопировать ссылку или скачать файл Salaries.csv, описание данных.
  • Парная и множественная линейная регрессия со statsmodels (читать, скачать).

Домашние задания

Домашние задания 1-2 сдавались через SmartLMS.

Домашнее задание Файлы Дедлайн Куда сдавать
Домашнее задание 2а ipynb responses_py.csv life_expect.csv 04.10 23:59 ссылка
Домашнее задание 3 ipynb canada.csv 07.10 23:59 ссылка
Домашнее задание 4
Домашнее задание 5
Домашнее задание 6