Основы анализа данных в Python: различия между версиями

Материал из MathINFO
Перейти к навигации Перейти к поиску
Строка 11: Строка 11:
 
* Подробный [https://docs.google.com/spreadsheets/d/1JGD_daz2nHYDHWOyLiDY2nacD7LHn8LzLFvU1FRldlY/edit?usp=sharing план] курса, с примерными датами.
 
* Подробный [https://docs.google.com/spreadsheets/d/1JGD_daz2nHYDHWOyLiDY2nacD7LHn8LzLFvU1FRldlY/edit?usp=sharing план] курса, с примерными датами.
 
* Сопровождающий [https://edu.hse.ru/course/view.php?id=132492 онлайн-курс] «Сбор и анализ данных в Python».
 
* Сопровождающий [https://edu.hse.ru/course/view.php?id=132492 онлайн-курс] «Сбор и анализ данных в Python».
 +
 +
== Программное обеспечение ==
 +
 +
Перед занятиями необходимо установить дистрибутив '''Anaconda''' (скачать можно [https://www.anaconda.com/download здесь]), который включает в себя интерпретатор языка Python, библиотеки для обработки, анализа и визуализации данных, а также среду для работы '''Jupyter Notebook'''. Также есть возможность работать в Jupyter Notebook онлайн, используя ресурс [https://colab.research.google.com/ Google Colab] (для создания и редактирования файлов нужен аккаунт Gmail).
 +
 +
'''Установка Anaconda и запуск Jupyter Notebook:'''
 +
 +
* Для установки Anaconda нужно скачать установочный файл для своей системы [https://www.anaconda.com/download отсюда], запустить его и следовать инструкциям.
 +
* Среду Jupyter Notebook можно запускать через приложение Anaconda Navigator (находим ''Anaconda Navigator'' в списке программ, запускаем, кликаем на кнопку ''Launch'' под Jupyter Notebook) и отдельно от него (см. [https://www.dropbox.com/scl/fi/4095f565oudw2pq1hatrp/_-Jupyter.pdf?rlkey=6kucyfzj9uuy5ovrjnrkabt5z&dl=0 инструкцию]).
 +
* Работа в Jupyter Notebook ([https://www.dropbox.com/scl/fi/v3wdgps9wjvrtamo08y66/jupyter-interface.mov?rlkey=xwsut0nxs4hjmdsz8vnnqvxfz&dl=0 видео]), работа в Google Colab ([https://www.dropbox.com/scl/fi/znirgzjrnawtjgta5dvfb/colab-interface.mp4?rlkey=nqbloavs7p3p6swraejl9sskw&dl=0 видео]).
 +
* Набор текста в Jupyter ([https://www.dropbox.com/scl/fi/t62c0jxvqrfro1tbxg12t/text-markdown.mp4?rlkey=p0kjc3qeoh4bv6kk8jqhj9pfo&dl=0 видео], [https://www.dropbox.com/scl/fi/vdmpj2ws1axbs832r5cj3/00-intro.ipynb?rlkey=3d8zwm94xjbo8lew2ox8vonj6&dl=0 ipynb]).
 +
 +
Для тех, кто не работал в Python и Jupyter: можно записаться на вышкинский [https://edu.hse.ru/course/view.php?id=133389 онлайн-курс] «Python как иностранный» (открыт для записи в SmartLMS). Для подготовки рабочего места рекомендуется ознакомиться со следующими материалами в теме 1: ''Видео. Подготовка рабочего места'', ''инструкция по открытию файлов в Jupyter Notebook'', ''Видео. Первая программа'', ''Задачи для тренировки''.
  
 
== Материалы ==
 
== Материалы ==

Версия 20:52, 11 сентября 2023

Дорогие студенты!

Это страница обязательного курса «Основы анализа данных в Python», читаемого на программе «Политология» 3 курса бакалавриата в 1-2 модулях 2023-2024 учебного года.

Преподаватель: Тамбовцева Алла Андреевна.

Правила игры и план курса

  • Программа курса, организационная презентация.
  • Формула оценки: 0.21 * Тесты + 0.28 * Домашнее задание + 0.3 * Экзамен + 0.21 * Контрольная работа.
  • Подробный план курса, с примерными датами.
  • Сопровождающий онлайн-курс «Сбор и анализ данных в Python».

Программное обеспечение

Перед занятиями необходимо установить дистрибутив Anaconda (скачать можно здесь), который включает в себя интерпретатор языка Python, библиотеки для обработки, анализа и визуализации данных, а также среду для работы Jupyter Notebook. Также есть возможность работать в Jupyter Notebook онлайн, используя ресурс Google Colab (для создания и редактирования файлов нужен аккаунт Gmail).

Установка Anaconda и запуск Jupyter Notebook:

  • Для установки Anaconda нужно скачать установочный файл для своей системы отсюда, запустить его и следовать инструкциям.
  • Среду Jupyter Notebook можно запускать через приложение Anaconda Navigator (находим Anaconda Navigator в списке программ, запускаем, кликаем на кнопку Launch под Jupyter Notebook) и отдельно от него (см. инструкцию).
  • Работа в Jupyter Notebook (видео), работа в Google Colab (видео).
  • Набор текста в Jupyter (видео, ipynb).

Для тех, кто не работал в Python и Jupyter: можно записаться на вышкинский онлайн-курс «Python как иностранный» (открыт для записи в SmartLMS). Для подготовки рабочего места рекомендуется ознакомиться со следующими материалами в теме 1: Видео. Подготовка рабочего места, инструкция по открытию файлов в Jupyter Notebook, Видео. Первая программа, Задачи для тренировки.

Материалы

Введение в выборочные обследования

Генеральная совокупность и выборка. Репрезентативность выборки. Способы формирования выборок.
Нарушение свойства репрезентативности и виды смещений. Ошибка выборки (sampling error).

  • Лекция 1. Введение в выборочные обследования (слайды, ipynb с примерами, файл students.csv).
  • Практикум 1. Модуль random. Обработка данных с pandas (читать, ipynb).