Основы работы с количественными данными: различия между версиями
(не показано 11 промежуточных версий этого же участника) | |||
Строка 31: | Строка 31: | ||
Что почитать по теме: А.Макаров и др. «Задачник по математической статистике для студентов социально-гуманитарных и управленческих специальностей» (глава 2.3), M.Sternstein "AP Statistics" (topic 3), Шипунов и др. Наглядная статистика. Используем R! (главы 1-3). | Что почитать по теме: А.Макаров и др. «Задачник по математической статистике для студентов социально-гуманитарных и управленческих специальностей» (глава 2.3), M.Sternstein "AP Statistics" (topic 3), Шипунов и др. Наглядная статистика. Используем R! (главы 1-3). | ||
+ | |||
+ | === Неделя 3. Визуализация данных. Основные понятия теории вероятностей и статистики. === | ||
+ | |||
+ | * Визуализация данных: графики распределения качественных данных. | ||
+ | * Практикум 3: [https://docs.google.com/spreadsheets/d/1LyULbXCx3nY6FJQtJYqZ10tNMhdaJ7xQGIFAUTX5h0s/edit?usp=sharing таблица], [https://www.dropbox.com/s/3wj3ydx9lhytwe5/%D0%9F%D1%80%D0%B0%D0%BA%D1%82%D0%B8%D0%BA%D1%83%D0%BC%2003.pdf?dl=0 задание], [https://docs.google.com/spreadsheets/d/1ThaJ2AFCtBoAn7-QFE1CMycUd-H23jbAWyf3GhF-zG0/edit?usp=sharing решение]. | ||
+ | * Введение в теорию вероятностей: события и вероятности, случайные величины ([https://www.dropbox.com/s/1w0js4avcpryp5f/probability.pdf?dl=0 конспект]). | ||
+ | |||
+ | Что почитать по теме: А.Макаров. А.Пашкевич. «Задачник по теории вероятностей для студентов социально-гуманитарных и управленческих специальностей» (разделы 2-3, 6), Шипунов и др. Наглядная статистика. Используем R! (главы 1-3). | ||
+ | |||
+ | === Неделя 4. Введение в статистическое оценивание. Доверительные интервалы. === | ||
+ | |||
+ | * [https://www.dropbox.com/sh/06ppxe35skn074t/AABLPiV8irAONpXi1wVY1Pi2a?dl=0 Видеозапись] занятия. | ||
+ | * Ещё немного о случайных величинах: описание непрерывных случайных величин ([https://www.dropbox.com/s/jtj94o9olxc2spn/distributions.pdf?dl=0 конспект]). | ||
+ | * Введение в статистическое оценивание. Статистические законы. Доверительные интервалы ([https://www.dropbox.com/s/cw2ndrxwijxbq3k/06-%D0%A1%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%BE%D0%B5%20%D0%BE%D1%86%D0%B5%D0%BD%D0%B8%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5.pdf?dl=0 слайды]), [https://rpubs.com/AllaT/psycho-stat-laws симуляции] в R. | ||
+ | * [https://www.rotmistrov.com/intrvl Онлайн-калькулятор] для доверительных интервалов, [https://rpsychologist.com/d3/ci/ визуализация] доверительных интервалов. | ||
+ | |||
+ | Что почитать по теме: А.Макаров и др. «Задачник по математической статистике для студентов социально-гуманитарных и управленческих специальностей» (главы 3.3-3.4), Ч.Уилан «Голая статистика» (главы 8, 10), M.Sternstein "AP Statistics" (topics 12-13). | ||
== Домашние задания == | == Домашние задания == | ||
Строка 40: | Строка 57: | ||
| [https://www.dropbox.com/s/4k886jl2o6xr7r4/%D0%94%D0%97-01.pdf?dl=0 Домашнее задание 1] || 11.09 23:59 | | [https://www.dropbox.com/s/4k886jl2o6xr7r4/%D0%94%D0%97-01.pdf?dl=0 Домашнее задание 1] || 11.09 23:59 | ||
|- | |- | ||
− | | Домашнее задание 2 || | + | | [https://www.dropbox.com/s/ctjv1kpmde1m75x/%D0%94%D0%97-02.pdf?dl=0 Домашнее задание 2] || 22.09 23:59 |
|- | |- | ||
− | | Домашнее задание 3 || | + | | [https://www.dropbox.com/s/9ja9259mdl8r0s4/%D0%94%D0%97-03.pdf?dl=0 Домашнее задание 3] || 02.10.23:59 |
|- | |- | ||
| Домашнее задание 4 || | | Домашнее задание 4 || | ||
Строка 53: | Строка 70: | ||
== Дополнительные материалы == | == Дополнительные материалы == | ||
− | + | === Работа с данными в Python === | |
+ | |||
+ | Ниже приведены примеры работы с данными в облачной версии Jupyter Notebook – среде [https://colab.research.google.com/ Google Colab]. При желании можно установить дистрибутив [https://www.anaconda.com/products/individual Anaconda] и использовать Jupyter Notebook локально ([https://allatambov.github.io/icef/seminars/instruction-JN.pdf инструкция] по работе). | ||
+ | |||
+ | Блок 1 ([конспект], [ipynb] для скачивания): | ||
+ | |||
+ | # Введение в Google Colab, загрузка файла с данными, базовое описание данных ([https://www.dropbox.com/s/83ixm87dpfdm6r3/01-intro-data-load.mp4?dl=0 видео]). | ||
+ | # Группировка и агрегирование данных, применение собственных функций ([https://www.dropbox.com/s/9bjhjnexxgh45h2/02-data-group-agg.mov?dl=0 видео]). | ||
+ | # Выбор столбцов и фильтрация строк в таблице ([https://www.dropbox.com/s/qi0vwpz7y2ar69t/03-filtering.mov?dl=0 видео]). | ||
+ | |||
+ | Блок 2 ([конспект], [ipynb] для скачивания): | ||
+ | |||
+ | # Визуализация данных с помощью библиотеки ''seaborn'': часть 1 (видео). | ||
+ | # Визуализация данных с помощью библиотеки ''seaborn'': часть 2 (видео). |
Версия 18:16, 25 сентября 2022
Дорогие студенты!
Это страница обязательного курса «Основы работы с количественными данными», читаемого на программе «Коммуникации в государственных структурах и НКО» 1 курса магистратуры в 1 модуле 2022-2023 учебного года.
Семинары ведёт: Тамбовцева Алла Андреевна.
Содержание
Правила игры
- Формула оценки: Итог = 0.5 * Домашние задания + 0.2 * Самостоятельная работа + 0.3 * Экзамен.
- Программа курса, пояснения по формам контроля.
Программное обеспечение
В рамках практической части курса используются Google Sheets, для работы достаточно иметь аккаунт Gmail.
Материалы занятий
Неделя 1. Введение в анализ данных. Описание данных.
- Введение в анализ данных: шкалы данных, интегральные индексы (слайды).
- Описание данных: введение в выборочные обследования, описательные статистики (слайды).
- Практикум 1: задания, решения.
Что почитать по теме: Ч.Уилан «Голая статистика» (главы 1-3), А.Макаров и др. «Задачник по математической статистике для студентов социально-гуманитарных и управленческих специальностей» (главы 2.1-2.2), M.Sternstein "AP Statistics" (topic 2).
Неделя 2. Описание данных. Визуализация данных.
- Описание данных: меры изменчивости, данные в неколичественных шкалах (слайды).
- Визуализация данных: принципы визуализации, графики распределения количественных данных (слайды).
- Практикум 2: таблица, задание, решение.
Что почитать по теме: А.Макаров и др. «Задачник по математической статистике для студентов социально-гуманитарных и управленческих специальностей» (глава 2.3), M.Sternstein "AP Statistics" (topic 3), Шипунов и др. Наглядная статистика. Используем R! (главы 1-3).
Неделя 3. Визуализация данных. Основные понятия теории вероятностей и статистики.
- Визуализация данных: графики распределения качественных данных.
- Практикум 3: таблица, задание, решение.
- Введение в теорию вероятностей: события и вероятности, случайные величины (конспект).
Что почитать по теме: А.Макаров. А.Пашкевич. «Задачник по теории вероятностей для студентов социально-гуманитарных и управленческих специальностей» (разделы 2-3, 6), Шипунов и др. Наглядная статистика. Используем R! (главы 1-3).
Неделя 4. Введение в статистическое оценивание. Доверительные интервалы.
- Видеозапись занятия.
- Ещё немного о случайных величинах: описание непрерывных случайных величин (конспект).
- Введение в статистическое оценивание. Статистические законы. Доверительные интервалы (слайды), симуляции в R.
- Онлайн-калькулятор для доверительных интервалов, визуализация доверительных интервалов.
Что почитать по теме: А.Макаров и др. «Задачник по математической статистике для студентов социально-гуманитарных и управленческих специальностей» (главы 3.3-3.4), Ч.Уилан «Голая статистика» (главы 8, 10), M.Sternstein "AP Statistics" (topics 12-13).
Домашние задания
Домашнее задание | Дедлайн |
---|---|
Домашнее задание 1 | 11.09 23:59 |
Домашнее задание 2 | 22.09 23:59 |
Домашнее задание 3 | 02.10.23:59 |
Домашнее задание 4 | |
Домашнее задание 5 | |
Домашнее задание 6 |
Дополнительные материалы
Работа с данными в Python
Ниже приведены примеры работы с данными в облачной версии Jupyter Notebook – среде Google Colab. При желании можно установить дистрибутив Anaconda и использовать Jupyter Notebook локально (инструкция по работе).
Блок 1 ([конспект], [ipynb] для скачивания):
- Введение в Google Colab, загрузка файла с данными, базовое описание данных (видео).
- Группировка и агрегирование данных, применение собственных функций (видео).
- Выбор столбцов и фильтрация строк в таблице (видео).
Блок 2 ([конспект], [ipynb] для скачивания):
- Визуализация данных с помощью библиотеки seaborn: часть 1 (видео).
- Визуализация данных с помощью библиотеки seaborn: часть 2 (видео).