Основы работы с количественными данными: различия между версиями

Материал из MathINFO
Перейти к навигации Перейти к поиску
(не показано 26 промежуточных версий этого же участника)
Строка 8: Строка 8:
  
 
* Формула оценки: '''Итог = 0.5 * Домашние задания + 0.2 * Самостоятельная работа + 0.3 * Экзамен'''.
 
* Формула оценки: '''Итог = 0.5 * Домашние задания + 0.2 * Самостоятельная работа + 0.3 * Экзамен'''.
* Пояснения по формам контроля можно посмотреть [https://www.hse.ru/edu/courses/646477179 здесь].
+
* [https://www.hse.ru/edu/courses/646477179 Программа] курса, [https://www.dropbox.com/s/6zstzvlxwlmvuk0/00-%D0%9E%20%D0%BA%D1%83%D1%80%D1%81%D0%B5.pdf?dl=0 пояснения] по формам контроля.
  
 
== Программное обеспечение ==
 
== Программное обеспечение ==
  
В рамках практической части курса используются Google Spreadsheets, для работы достаточно иметь аккаунт Gmail.
+
В рамках практической части курса используются Google Sheets, для работы достаточно иметь аккаунт Gmail.
 +
 
 +
== Материалы занятий ==
 +
 
 +
=== Неделя 1. Введение в анализ данных. Описание данных. ===
 +
 
 +
* Введение в анализ данных: шкалы данных, интегральные индексы ([https://www.dropbox.com/s/6l7xmaq7qxl65ev/01-%D0%A8%D0%BA%D0%B0%D0%BB%D1%8B%20%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85.pdf?dl=0 слайды]).
 +
* Описание данных: введение в выборочные обследования, описательные статистики ([https://www.dropbox.com/s/9hfn89x8sqbaziq/02-%D0%9E%D0%BF%D0%B8%D1%81%D0%B0%D0%BD%D0%B8%D0%B5%20%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85.pdf?dl=0 слайды]).
 +
* Практикум 1: [https://www.dropbox.com/s/gt5p4g86sn26pdh/%D0%9F%D1%80%D0%B0%D0%BA%D1%82%D0%B8%D0%BA%D1%83%D0%BC%2001.pdf?dl=0 задания], [https://docs.google.com/spreadsheets/d/10ZoyIMsGR39Mk1P8EeJuvCIFLaXe3LW_FZdzNe4_peo/edit?usp=sharing решения].
 +
 
 +
Что почитать по теме: Ч.Уилан «Голая статистика» (главы 1-3), А.Макаров и др. «Задачник по математической статистике для студентов социально-гуманитарных и управленческих специальностей» (главы 2.1-2.2), M.Sternstein "AP Statistics" (topic 2).
 +
 
 +
=== Неделя 2. Описание данных. Визуализация данных. ===
 +
 
 +
* Описание данных: меры изменчивости, данные в неколичественных шкалах ([https://www.dropbox.com/s/wf8mlugxxiay1m5/03-%D0%9E%D0%BF%D0%B8%D1%81%D0%B0%D0%BD%D0%B8%D0%B5%20%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85%20%28%D0%BF%D1%80%D0%BE%D0%B4%D0%BE%D0%BB%D0%B6%D0%B5%D0%BD%D0%B8%D0%B5%29.pdf?dl=0 слайды]).
 +
* Визуализация данных: принципы визуализации, графики распределения количественных данных ([https://www.dropbox.com/s/6wlc8gs3dk0jkoy/04-%D0%92%D0%B8%D0%B7%D1%83%D0%B0%D0%BB%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F%20%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85.pdf?dl=0 слайды]).
 +
* Практикум 2: [https://docs.google.com/spreadsheets/d/1rUGA3BplYOZ84XjTQRCGxU5zHLu8piBFbMvi01MVfS0/edit?usp=sharing таблица], задание, [https://docs.google.com/spreadsheets/d/1xc8ILN8AmvFrdXXcT7w9hyUgt9gE_KdrPSeXF8vJQe8/edit?usp=sharing решение].
 +
 
 +
Что почитать по теме: А.Макаров и др. «Задачник по математической статистике для студентов социально-гуманитарных и управленческих специальностей» (глава 2.3), M.Sternstein "AP Statistics" (topic 3), Шипунов и др. Наглядная статистика. Используем R! (главы 1-3).
 +
 
 +
=== Неделя 3. Визуализация данных. Основные понятия теории вероятностей и статистики. ===
 +
 
 +
* Визуализация данных: графики распределения качественных данных.
 +
* Практикум 3: [https://docs.google.com/spreadsheets/d/1LyULbXCx3nY6FJQtJYqZ10tNMhdaJ7xQGIFAUTX5h0s/edit?usp=sharing таблица], [https://www.dropbox.com/s/3wj3ydx9lhytwe5/%D0%9F%D1%80%D0%B0%D0%BA%D1%82%D0%B8%D0%BA%D1%83%D0%BC%2003.pdf?dl=0 задание], [https://docs.google.com/spreadsheets/d/1ThaJ2AFCtBoAn7-QFE1CMycUd-H23jbAWyf3GhF-zG0/edit?usp=sharing решение].
 +
* Введение в теорию вероятностей: события и вероятности, случайные величины ([https://www.dropbox.com/s/1w0js4avcpryp5f/probability.pdf?dl=0 конспект]).
 +
 
 +
Что почитать по теме: А.Макаров. А.Пашкевич. «Задачник по теории вероятностей для студентов социально-гуманитарных и управленческих специальностей» (разделы 2-3, 6), Шипунов и др. Наглядная статистика. Используем R! (главы 1-3).
 +
 
 +
=== Неделя 4. Введение в статистическое оценивание. Доверительные интервалы. ===
 +
 
 +
* [https://www.dropbox.com/sh/06ppxe35skn074t/AABLPiV8irAONpXi1wVY1Pi2a?dl=0 Видеозапись] занятия.
 +
* Ещё немного о случайных величинах: описание непрерывных случайных величин ([https://www.dropbox.com/s/jtj94o9olxc2spn/distributions.pdf?dl=0 конспект]).
 +
* Введение в статистическое оценивание. Статистические законы. Доверительные интервалы ([https://www.dropbox.com/s/cw2ndrxwijxbq3k/06-%D0%A1%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%BE%D0%B5%20%D0%BE%D1%86%D0%B5%D0%BD%D0%B8%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5.pdf?dl=0 слайды]), [https://rpubs.com/AllaT/psycho-stat-laws симуляции] в R.
 +
* [https://www.rotmistrov.com/intrvl Онлайн-калькулятор] для доверительных интервалов, [https://rpsychologist.com/d3/ci/ визуализация] доверительных интервалов.
 +
 
 +
Что почитать по теме: А.Макаров и др. «Задачник по математической статистике для студентов социально-гуманитарных и управленческих специальностей» (главы 3.3-3.4), Ч.Уилан «Голая статистика» (главы 8, 10), M.Sternstein "AP Statistics" (topics 12-13).
 +
 
 +
== Домашние задания ==
 +
 
 +
{| class="wikitable"
 +
|-
 +
! Домашнее задание !! Дедлайн
 +
|-
 +
| [https://www.dropbox.com/s/4k886jl2o6xr7r4/%D0%94%D0%97-01.pdf?dl=0 Домашнее задание 1] || 11.09 23:59
 +
|-
 +
| [https://www.dropbox.com/s/ctjv1kpmde1m75x/%D0%94%D0%97-02.pdf?dl=0 Домашнее задание 2] || 22.09 23:59
 +
|-
 +
| [https://www.dropbox.com/s/9ja9259mdl8r0s4/%D0%94%D0%97-03.pdf?dl=0 Домашнее задание 3] || 02.10.23:59
 +
|-
 +
| Домашнее задание 4 ||
 +
|-
 +
| Домашнее задание 5 ||
 +
|-
 +
| Домашнее задание 6 ||
 +
|}
 +
 
 +
== Дополнительные материалы ==
 +
 
 +
=== Работа с данными в Python ===
 +
 
 +
Ниже приведены примеры работы с данными в облачной версии Jupyter Notebook – среде [https://colab.research.google.com/ Google Colab]. При желании можно установить дистрибутив [https://www.anaconda.com/products/individual Anaconda] и использовать Jupyter Notebook локально ([https://allatambov.github.io/icef/seminars/instruction-JN.pdf инструкция] по работе).
 +
 
 +
Блок 1 ([конспект], [ipynb] для скачивания):
 +
 
 +
# Введение в Google Colab, загрузка файла с данными, базовое описание данных ([https://www.dropbox.com/s/83ixm87dpfdm6r3/01-intro-data-load.mp4?dl=0 видео]).
 +
# Группировка и агрегирование данных, применение собственных функций ([https://www.dropbox.com/s/9bjhjnexxgh45h2/02-data-group-agg.mov?dl=0 видео]).
 +
# Выбор столбцов и фильтрация строк в таблице ([https://www.dropbox.com/s/qi0vwpz7y2ar69t/03-filtering.mov?dl=0 видео]).
 +
 
 +
Блок 2 ([конспект], [ipynb] для скачивания):
 +
 
 +
# Визуализация данных с помощью библиотеки ''seaborn'': часть 1 (видео).
 +
# Визуализация данных с помощью библиотеки ''seaborn'': часть 2 (видео).

Версия 18:16, 25 сентября 2022

Дорогие студенты!

Это страница обязательного курса «Основы работы с количественными данными», читаемого на программе «Коммуникации в государственных структурах и НКО» 1 курса магистратуры в 1 модуле 2022-2023 учебного года.

Семинары ведёт: Тамбовцева Алла Андреевна.

Правила игры

  • Формула оценки: Итог = 0.5 * Домашние задания + 0.2 * Самостоятельная работа + 0.3 * Экзамен.
  • Программа курса, пояснения по формам контроля.

Программное обеспечение

В рамках практической части курса используются Google Sheets, для работы достаточно иметь аккаунт Gmail.

Материалы занятий

Неделя 1. Введение в анализ данных. Описание данных.

  • Введение в анализ данных: шкалы данных, интегральные индексы (слайды).
  • Описание данных: введение в выборочные обследования, описательные статистики (слайды).
  • Практикум 1: задания, решения.

Что почитать по теме: Ч.Уилан «Голая статистика» (главы 1-3), А.Макаров и др. «Задачник по математической статистике для студентов социально-гуманитарных и управленческих специальностей» (главы 2.1-2.2), M.Sternstein "AP Statistics" (topic 2).

Неделя 2. Описание данных. Визуализация данных.

  • Описание данных: меры изменчивости, данные в неколичественных шкалах (слайды).
  • Визуализация данных: принципы визуализации, графики распределения количественных данных (слайды).
  • Практикум 2: таблица, задание, решение.

Что почитать по теме: А.Макаров и др. «Задачник по математической статистике для студентов социально-гуманитарных и управленческих специальностей» (глава 2.3), M.Sternstein "AP Statistics" (topic 3), Шипунов и др. Наглядная статистика. Используем R! (главы 1-3).

Неделя 3. Визуализация данных. Основные понятия теории вероятностей и статистики.

  • Визуализация данных: графики распределения качественных данных.
  • Практикум 3: таблица, задание, решение.
  • Введение в теорию вероятностей: события и вероятности, случайные величины (конспект).

Что почитать по теме: А.Макаров. А.Пашкевич. «Задачник по теории вероятностей для студентов социально-гуманитарных и управленческих специальностей» (разделы 2-3, 6), Шипунов и др. Наглядная статистика. Используем R! (главы 1-3).

Неделя 4. Введение в статистическое оценивание. Доверительные интервалы.

Что почитать по теме: А.Макаров и др. «Задачник по математической статистике для студентов социально-гуманитарных и управленческих специальностей» (главы 3.3-3.4), Ч.Уилан «Голая статистика» (главы 8, 10), M.Sternstein "AP Statistics" (topics 12-13).

Домашние задания

Домашнее задание Дедлайн
Домашнее задание 1 11.09 23:59
Домашнее задание 2 22.09 23:59
Домашнее задание 3 02.10.23:59
Домашнее задание 4
Домашнее задание 5
Домашнее задание 6

Дополнительные материалы

Работа с данными в Python

Ниже приведены примеры работы с данными в облачной версии Jupyter Notebook – среде Google Colab. При желании можно установить дистрибутив Anaconda и использовать Jupyter Notebook локально (инструкция по работе).

Блок 1 ([конспект], [ipynb] для скачивания):

  1. Введение в Google Colab, загрузка файла с данными, базовое описание данных (видео).
  2. Группировка и агрегирование данных, применение собственных функций (видео).
  3. Выбор столбцов и фильтрация строк в таблице (видео).

Блок 2 ([конспект], [ipynb] для скачивания):

  1. Визуализация данных с помощью библиотеки seaborn: часть 1 (видео).
  2. Визуализация данных с помощью библиотеки seaborn: часть 2 (видео).