Основы работы с количественными данными: различия между версиями

Материал из MathINFO
Перейти к навигации Перейти к поиску
Строка 37: Строка 37:
 
== Материалы ==
 
== Материалы ==
  
=== Введение в работу с данными. Описание данных. ===
+
=== Занятие 1. Введение в работу с данными. Описание данных. ===
  
 
* Введение в выборочные обследования ([https://www.dropbox.com/scl/fi/dxn7hjzgwstiaygv6j8f8/01.pdf?rlkey=fimbm6wl4tbcurayd1w5rwieq&dl=0 слайды]). Шкалы данных ([https://www.dropbox.com/scl/fi/uabwzsfx9d3wqpty5zuis/02.pdf?rlkey=x2tvvsx8j7gw9kqdhgs033ri9&dl=0 слайды]).
 
* Введение в выборочные обследования ([https://www.dropbox.com/scl/fi/dxn7hjzgwstiaygv6j8f8/01.pdf?rlkey=fimbm6wl4tbcurayd1w5rwieq&dl=0 слайды]). Шкалы данных ([https://www.dropbox.com/scl/fi/uabwzsfx9d3wqpty5zuis/02.pdf?rlkey=x2tvvsx8j7gw9kqdhgs033ri9&dl=0 слайды]).
Строка 43: Строка 43:
 
* Практикум 1. Введение в работу с данными ([https://github.com/allatambov/QuantData23/blob/main/qd-practice01.ipynb читать], [https://www.dropbox.com/scl/fi/fy0t1iu4jho49fenlvvnv/qd-practice01.ipynb?rlkey=6nhf6ct07taxb7j1qb1rfrr1q&dl=0 ipynb]).
 
* Практикум 1. Введение в работу с данными ([https://github.com/allatambov/QuantData23/blob/main/qd-practice01.ipynb читать], [https://www.dropbox.com/scl/fi/fy0t1iu4jho49fenlvvnv/qd-practice01.ipynb?rlkey=6nhf6ct07taxb7j1qb1rfrr1q&dl=0 ipynb]).
  
=== Описание данных. Визуализация данных. ===
+
=== Занятие 2. Описание данных. Визуализация данных. ===
  
 
* Описание данных: часть 2 ([https://www.dropbox.com/scl/fi/t4c0j3hrrguq8cjh1scdv/03.pdf?rlkey=5g5egla5x0ki9o0jo6r4nu85p&dl=0 слайды]). Визуализация количественных данных ([https://www.dropbox.com/scl/fi/1d2cliqmjly22oq2o3xac/04.pdf?rlkey=c8ifdwf54q24czmzukxtmpubz&dl=0 слайды]).
 
* Описание данных: часть 2 ([https://www.dropbox.com/scl/fi/t4c0j3hrrguq8cjh1scdv/03.pdf?rlkey=5g5egla5x0ki9o0jo6r4nu85p&dl=0 слайды]). Визуализация количественных данных ([https://www.dropbox.com/scl/fi/1d2cliqmjly22oq2o3xac/04.pdf?rlkey=c8ifdwf54q24czmzukxtmpubz&dl=0 слайды]).
Строка 53: Строка 53:
 
* [https://matplotlib.org/stable/gallery/color/named_colors.html Цвета] в Python, [https://g.co/kgs/shDZVq палитра] цветов от Google.
 
* [https://matplotlib.org/stable/gallery/color/named_colors.html Цвета] в Python, [https://g.co/kgs/shDZVq палитра] цветов от Google.
  
=== Визуализация данных. Введение в выборочное оценивание. ===
+
=== Занятие 3. Визуализация данных. Введение в выборочное оценивание. ===
  
 
* Практикум 3. Группировка, агрегирование и визуализация с pandas ([https://github.com/allatambov/QuantData23/blob/main/qd-practice03-upd.ipynb читать], [https://www.dropbox.com/scl/fi/fm7qmkfbce40my8xkou0s/qd-practice03-upd.ipynb?rlkey=mwyilkp4qkn37tbc7eiqyg4lq&dl=0 ipynb], файл [https://www.dropbox.com/scl/fi/mmspb7uq40i71siht2l0q/CPI_FH.xlsx?rlkey=0i7lk3xr408srfkyz3inui6au&dl=0 CPI_FH.xlsx]).
 
* Практикум 3. Группировка, агрегирование и визуализация с pandas ([https://github.com/allatambov/QuantData23/blob/main/qd-practice03-upd.ipynb читать], [https://www.dropbox.com/scl/fi/fm7qmkfbce40my8xkou0s/qd-practice03-upd.ipynb?rlkey=mwyilkp4qkn37tbc7eiqyg4lq&dl=0 ipynb], файл [https://www.dropbox.com/scl/fi/mmspb7uq40i71siht2l0q/CPI_FH.xlsx?rlkey=0i7lk3xr408srfkyz3inui6au&dl=0 CPI_FH.xlsx]).
 
* Введение в выборочное оценивание ([https://www.dropbox.com/scl/fi/7uc2hrtxrhcyxznckph9v/05.pdf?rlkey=vll76xk11qjxmqn7rzeqt5oqa&dl=0 слайды]).
 
* Введение в выборочное оценивание ([https://www.dropbox.com/scl/fi/7uc2hrtxrhcyxznckph9v/05.pdf?rlkey=vll76xk11qjxmqn7rzeqt5oqa&dl=0 слайды]).
 +
 +
=== Занятие 4. Доверительные интервалы. ===
 +
 +
* Доверительные интервалы для доли и среднего (слайды, визуализация).
 +
* Практикум 4. Доверительные интервалы на примере массивов, описание и визуализация опросных данных.
 +
 +
=== Занятие 5. Проверка статистических гипотез ===
 +
 +
* Проверка статистических гипотез (слайды).
 +
* Практикум 5. Проверка гипотез о долях и средних.
  
 
== Домашние задания ==
 
== Домашние задания ==

Версия 22:53, 6 октября 2023

Дорогие студенты!

Это страница обязательного курса «Основы работы с количественными данными», читаемого на программе
«Коммуникации в государственных структурах и НКО» 1 курса магистратуры в 1 модуле 2023-2024 учебного года.

Занятия ведёт: Тамбовцева Алла Андреевна.

Правила игры

  • Формула оценки: Итог = 0.5 * Домашние задания + 0.2 * Самостоятельная работа + 0.3 * Экзамен.
  • Программа курса, организационная презентация.
  • Домашние задания, сданные позже дедлайна, оцениваются со штрафом:
    в пределах часа – 10% от оценки, суток – 30%, недели – 60%.

Программное обеспечение

На этом курсе для практической работы с данными мы используем язык Python и среду Jupyter Notebook (ее облачную версию Google Colab). Для создания и редактирования файлов в Google Colab ничего устанавливать не нужно, но нужно иметь аккаунт Google (Gmail).

Если вы хотите работать в Jupyter Notebook локально, на своем компьютере, а не в облачной среде, удобнее всего установить дистрибутив Anaconda (скачать можно здесь), который включает в себя интерпретатор языка Python, библиотеки для обработки, анализа и визуализации данных, а также саму среду Jupyter Notebook.

Работа в Google Colab:

  • Создание файлов и запуск кода в Google Colab: видео.
  • Загрузка и выгрузка файлов в Google Colab: видео.

Установка Anaconda и запуск Jupyter Notebook:

  • Для установки Anaconda нужно скачать установочный файл для своей системы отсюда, запустить его и следовать инструкциям.
  • Среду Jupyter Notebook можно запускать через приложение Anaconda Navigator (находим Anaconda Navigator в списке программ, запускаем, кликаем на кнопку Launch под Jupyter Notebook) и отдельно от него (см. инструкцию).

Подробнее про работу в Jupyter Notebook и Google Colab:

Для тех, кто не работал в Python и Jupyter: можно записаться на вышкинский онлайн-курс «Python как иностранный» (открыт для записи в SmartLMS). Для подготовки рабочего места рекомендуется ознакомиться со следующими материалами в теме 1: Видео. Подготовка рабочего места, инструкция по открытию файлов в Jupyter Notebook, Видео. Первая программа, Задачи для тренировки.

Материалы

Занятие 1. Введение в работу с данными. Описание данных.

  • Введение в выборочные обследования (слайды). Шкалы данных (слайды).
  • Описание данных: часть 1 (слайды).
  • Практикум 1. Введение в работу с данными (читать, ipynb).

Занятие 2. Описание данных. Визуализация данных.

  • Описание данных: часть 2 (слайды). Визуализация количественных данных (слайды).
  • Практикум 2. Описание и визуализация данных (читать, ipynb, файл flats.csv).

Дополнительно:

Занятие 3. Визуализация данных. Введение в выборочное оценивание.

  • Практикум 3. Группировка, агрегирование и визуализация с pandas (читать, ipynb, файл CPI_FH.xlsx).
  • Введение в выборочное оценивание (слайды).

Занятие 4. Доверительные интервалы.

  • Доверительные интервалы для доли и среднего (слайды, визуализация).
  • Практикум 4. Доверительные интервалы на примере массивов, описание и визуализация опросных данных.

Занятие 5. Проверка статистических гипотез

  • Проверка статистических гипотез (слайды).
  • Практикум 5. Проверка гипотез о долях и средних.

Домашние задания

Домашнее задание Файлы Дедлайн Куда сдавать
Домашнее задание 1 ipynb 24.09 23:59 ссылка
Домашнее задание 2 ipynb wgidataset.xlsx 05.10 23:59 ссылка
Домашнее задание 3
Домашнее задание 4
Домашнее задание 5