Основы работы с количественными данными: различия между версиями
Строка 45: | Строка 45: | ||
=== Описание данных. Визуализация данных. === | === Описание данных. Визуализация данных. === | ||
− | * Описание данных: часть 2 (слайды). Визуализация данных (слайды). | + | * Описание данных: часть 2 (слайды). Визуализация количественных данных (слайды). |
* Практикум 2. Описание и визуализация данных (читать, [https://www.dropbox.com/scl/fi/q2dc6yzg2isy7yqrtbyfd/qd-practice02.ipynb?rlkey=hpxfw4hwgy6wlnm52eyjmejdc&dl=0 ipynb], файл [https://www.dropbox.com/scl/fi/8qhjgfit3mucaxtx7ck4l/flats.csv?rlkey=vfym0gova9x16rket70t5wj7d&dl=0 flats.csv]). | * Практикум 2. Описание и визуализация данных (читать, [https://www.dropbox.com/scl/fi/q2dc6yzg2isy7yqrtbyfd/qd-practice02.ipynb?rlkey=hpxfw4hwgy6wlnm52eyjmejdc&dl=0 ipynb], файл [https://www.dropbox.com/scl/fi/8qhjgfit3mucaxtx7ck4l/flats.csv?rlkey=vfym0gova9x16rket70t5wj7d&dl=0 flats.csv]). | ||
+ | |||
+ | === Визуализация данных. Выборочные оценки и доверительные интервалы. === | ||
+ | |||
+ | * Визуализация качественных данных (слайды). | ||
+ | * Выборочные оценки и доверительные интервалы (слайды). | ||
+ | * Практикум 3. Группировка, агрегирование и визуализация с pandas (читать, [https://www.dropbox.com/scl/fi/n13vq2hzywsav9k10ltlk/qd-practice03.ipynb?rlkey=8tipb53h6g4wysv6kltvbob4d&dl=0 ipynb], файл [https://www.dropbox.com/scl/fi/mmspb7uq40i71siht2l0q/CPI_FH.xlsx?rlkey=0i7lk3xr408srfkyz3inui6au&dl=0 CPI_FH.xlsx]) | ||
== Домашние задания == | == Домашние задания == |
Версия 17:36, 21 сентября 2023
Дорогие студенты!
Это страница обязательного курса «Основы работы с количественными данными», читаемого на программе
«Коммуникации в государственных структурах и НКО» 1 курса магистратуры в 1 модуле 2023-2024 учебного года.
Занятия ведёт: Тамбовцева Алла Андреевна.
Содержание
Правила игры
- Формула оценки: Итог = 0.5 * Домашние задания + 0.2 * Самостоятельная работа + 0.3 * Экзамен.
- Программа курса, организационная презентация.
- Домашние задания, сданные позже дедлайна, оцениваются со штрафом:
в пределах часа – 10% от оценки, суток – 30%, недели – 60%.
Программное обеспечение
На этом курсе для практической работы с данными мы используем язык Python и среду Jupyter Notebook (ее облачную версию Google Colab). Для создания и редактирования файлов в Google Colab ничего устанавливать не нужно, но нужно иметь аккаунт Google (Gmail).
Если вы хотите работать в Jupyter Notebook локально, на своем компьютере, а не в облачной среде, удобнее всего установить дистрибутив Anaconda (скачать можно здесь), который включает в себя интерпретатор языка Python, библиотеки для обработки, анализа и визуализации данных, а также саму среду Jupyter Notebook.
Работа в Google Colab:
- Создание файлов и запуск кода в Google Colab: видео.
- Загрузка и выгрузка файлов в Google Colab: видео.
Установка Anaconda и запуск Jupyter Notebook:
- Для установки Anaconda нужно скачать установочный файл для своей системы отсюда, запустить его и следовать инструкциям.
- Среду Jupyter Notebook можно запускать через приложение Anaconda Navigator (находим Anaconda Navigator в списке программ, запускаем, кликаем на кнопку Launch под Jupyter Notebook) и отдельно от него (см. инструкцию).
Подробнее про работу в Jupyter Notebook и Google Colab:
- Работа в Jupyter Notebook (видео), работа в Google Colab (видео).
- Набор текста в Jupyter (видео, ipynb).
Для тех, кто не работал в Python и Jupyter: можно записаться на вышкинский онлайн-курс «Python как иностранный» (открыт для записи в SmartLMS). Для подготовки рабочего места рекомендуется ознакомиться со следующими материалами в теме 1: Видео. Подготовка рабочего места, инструкция по открытию файлов в Jupyter Notebook, Видео. Первая программа, Задачи для тренировки.
Материалы
Введение в работу с данными. Описание данных.
- Введение в выборочные обследования (слайды). Шкалы данных (слайды).
- Описание данных: часть 1 (слайды).
- Практикум 1. Введение в работу с данными (читать, ipynb).
Описание данных. Визуализация данных.
- Описание данных: часть 2 (слайды). Визуализация количественных данных (слайды).
- Практикум 2. Описание и визуализация данных (читать, ipynb, файл flats.csv).
Визуализация данных. Выборочные оценки и доверительные интервалы.
- Визуализация качественных данных (слайды).
- Выборочные оценки и доверительные интервалы (слайды).
- Практикум 3. Группировка, агрегирование и визуализация с pandas (читать, ipynb, файл CPI_FH.xlsx)
Домашние задания
Домашнее задание | Файлы | Дедлайн | Куда сдавать |
---|---|---|---|
Домашнее задание 1 | ipynb | 24.09 23:59 | ссылка |
Домашнее задание 2 | |||
Домашнее задание 3 | |||
Домашнее задание 4 | |||
Домашнее задание 5 |