Основы анализа данных в Python: различия между версиями

Материал из MathINFO
Перейти к навигации Перейти к поиску
Строка 34: Строка 34:
  
 
=== Неделя 1. Шкалы данных. Описание данных. ===
 
=== Неделя 1. Шкалы данных. Описание данных. ===
 
Очные занятия:
 
  
 
* Шкалы данных ([https://disk.yandex.ru/i/I3A_RUQdVoguvw слайды]).
 
* Шкалы данных ([https://disk.yandex.ru/i/I3A_RUQdVoguvw слайды]).
 
* Практикум 1. Массивы NumPy ([https://github.com/allatambov/PyDat24/blob/main/w01-practice.ipynb w01-practice.ipynb]), решения ([https://github.com/allatambov/PyDat24/blob/main/w01-practice-solutions.ipynb w01-practice-solutions.ipynb]).
 
* Практикум 1. Массивы NumPy ([https://github.com/allatambov/PyDat24/blob/main/w01-practice.ipynb w01-practice.ipynb]), решения ([https://github.com/allatambov/PyDat24/blob/main/w01-practice-solutions.ipynb w01-practice-solutions.ipynb]).
 
+
* Описательные статистики ([https://disk.yandex.ru/d/mKp2-jJXNKHdrw слайды], самостоятельное изучение).
Самостоятельная работа:
 
 
 
* Описательные статистики ([https://disk.yandex.ru/d/mKp2-jJXNKHdrw слайды]).
 
 
* Необязательное домашнее задание №1: [hw01.ipynb].
 
* Необязательное домашнее задание №1: [hw01.ipynb].
  
Строка 49: Строка 44:
 
* Разбор практикума по введению в Python ([https://github.com/allatambov/QuantDat24/blob/main/qd-practice01-solutions.ipynb qd-practice01-solutions.ipynb]).
 
* Разбор практикума по введению в Python ([https://github.com/allatambov/QuantDat24/blob/main/qd-practice01-solutions.ipynb qd-practice01-solutions.ipynb]).
 
* Последовательности: строки, списки, массивы Numpy ([https://github.com/allatambov/QuantDat24/blob/main/qd-02-lists-arrays.ipynb qd-02-lists-arrays.ipynb]).
 
* Последовательности: строки, списки, массивы Numpy ([https://github.com/allatambov/QuantDat24/blob/main/qd-02-lists-arrays.ipynb qd-02-lists-arrays.ipynb]).
 +
 +
== Learning outcomes ==
 +
 +
{| class="wikitable"
 +
|-
 +
! Неделя !! Теория !! Практика
 +
|-
 +
| № 1 || уметь определять шкалы данных; знать, что такое выборочная медиана и квартили, дисперсия и стандартное отклонение; знать особенности среднего и медианы и уметь делать предположения о наличии потенциально нехарактерных значений в выборке || уметь импортировать библиотеки, уметь создавать массивы Numpy на основе списков, уметь выполнять фильтрацию значений массивов, уметь считать объем, среднее и стандартное отклонение выборки, сохраненной в массив
 +
|-
 +
|}

Версия 18:32, 6 ноября 2024

Дорогие студенты!

Это страница курса «Основы анализа данных в Python», читаемого во 2 модуле 2024-2025 учебного года на ОП «Политология».

Преподаватель: Тамбовцева Алла Андреевна.

Правила игры

  • Программа курса, организационная презентация.
  • Формула оценки: 0.25 * Тесты + 0.25 * Практикум + 0.5 * Экзамен.
  • Цель курса – подготовка к независимому экзамену по анализу данных. Демоверсию экзамена и тренировочные варианты можно
    найти здесь в разделе Материалы для подготовкиАнализ данных. Базовый уровень (запись на курс в SmartLMS).
  • Курс включает темы, пройденные ранее в рамках обязательных курсов по ТВиМС и регрессионному анализу, поэтому теоретический материал
    изучается (=повторяется) самостоятельно по предложенным материалам и в рамках онлайн-курса «Сбор и анализ данных в Python».
  • Демоверсия НЭ (ML – темы, относящиеся к машинному обучению, ML* – темы, которые не были затронуты в предыдущих обязательных курсах).

Программное обеспечение

В рамках этого курса мы будем использовать язык Python и среду разработки Jupyter Notebook. Также есть возможность работать в аналоге Jupyter Notebook онлайн, используя ресурс Google Colab (для создания и редактирования файлов нужен аккаунт Gmail).

NB. На независимом экзамене не разрешается использовать облачные ресурсы, включая Google Colab.

Если у вас ничего не установлено или вы успели «удалить весь Python», перед занятиями необходимо установить дистрибутив Anaconda (скачать можно здесь, регистрацию можно пропустить), который включает в себя интерпретатор языка Python, библиотеки для обработки, анализа и визуализации данных, а также среду для работы Jupyter Notebook.

Материалы по работе в Jupyter Notebook и Google Colab:

Дополнительно для желающих:

Материалы курса

Неделя 1. Шкалы данных. Описание данных.

Дополнительно:

Learning outcomes

Неделя Теория Практика
№ 1 уметь определять шкалы данных; знать, что такое выборочная медиана и квартили, дисперсия и стандартное отклонение; знать особенности среднего и медианы и уметь делать предположения о наличии потенциально нехарактерных значений в выборке уметь импортировать библиотеки, уметь создавать массивы Numpy на основе списков, уметь выполнять фильтрацию значений массивов, уметь считать объем, среднее и стандартное отклонение выборки, сохраненной в массив