Основы анализа данных в Python: различия между версиями
Строка 43: | Строка 43: | ||
* '''Лекция 2.''' Описательные статистики ([https://www.dropbox.com/scl/fi/uyt9t4f0jdzkhoz36zey5/02.pdf?rlkey=ef3lkwzxgnws9c81z3ijnw38u&dl=0 слайды]). | * '''Лекция 2.''' Описательные статистики ([https://www.dropbox.com/scl/fi/uyt9t4f0jdzkhoz36zey5/02.pdf?rlkey=ef3lkwzxgnws9c81z3ijnw38u&dl=0 слайды]). | ||
* '''Практикум 2.''' Описательные статистики, группировка и агрегирование в pandas ([https://www.dropbox.com/scl/fi/83djmecy10pigosn94wfi/practice02.ipynb?rlkey=6qvu2ii2ceqork081smjoatog&dl=0 ipynb], [https://www.dropbox.com/scl/fi/i0rq1eizktu3trl8x8ji8/c.xlsx?rlkey=8bsc7szb539enwz0hymn60lv5&dl=0 c.xlsx]). | * '''Практикум 2.''' Описательные статистики, группировка и агрегирование в pandas ([https://www.dropbox.com/scl/fi/83djmecy10pigosn94wfi/practice02.ipynb?rlkey=6qvu2ii2ceqork081smjoatog&dl=0 ipynb], [https://www.dropbox.com/scl/fi/i0rq1eizktu3trl8x8ji8/c.xlsx?rlkey=8bsc7szb539enwz0hymn60lv5&dl=0 c.xlsx]). | ||
+ | |||
+ | === Домашние задания === | ||
+ | |||
+ | {| class="wikitable" | ||
+ | |- | ||
+ | ! Домашнее задание !! Файлы !! Дедлайн !! Сдача | ||
+ | |- | ||
+ | | [https://github.com/allatambov/PyDat23/blob/main/pydat-hw01.ipynb Домашнее задание 1] || [https://www.dropbox.com/scl/fi/yt253ybsqfd0875jvbisz/pydat-hw01.ipynb?rlkey=gqzhitoslbd58z3nr618j0nl6&dl=0 ipynb] [https://www.dropbox.com/scl/fi/w6bxlmxih198gj93zdmbv/owls.csv?rlkey=05ocg5lj83q7q98xoe1emjktn&dl=0 owls.csv] || 08.10 23:59 || [https://www.dropbox.com/request/4anBYpUnm7WtaLF9FJ5Y ссылка] на Dropbox | ||
+ | |- | ||
+ | | Домашнее задание 2 || || || | ||
+ | |- | ||
+ | | Домашнее задание 3 || || || | ||
+ | |- | ||
+ | | Домашнее задание 4 || || || | ||
+ | |- | ||
+ | | Домашнее задание 5 || || || | ||
+ | |- | ||
+ | | Домашнее задание 6 || || || | ||
+ | |- | ||
+ | | Домашнее задание 7 || || || | ||
+ | |} |
Версия 03:20, 26 сентября 2023
Дорогие студенты!
Это страница обязательного курса «Основы анализа данных в Python», читаемого на программе «Политология» 3 курса бакалавриата в 1-2 модулях 2023-2024 учебного года.
Преподаватель: Тамбовцева Алла Андреевна.
Содержание
Правила игры и план курса
- Программа курса, организационная презентация.
- Формула оценки: 0.21 * Тесты + 0.28 * Домашнее задание + 0.3 * Экзамен + 0.21 * Контрольная работа.
- Подробный план курса, с примерными датами.
- Сопровождающий онлайн-курс «Сбор и анализ данных в Python».
Программное обеспечение
Перед занятиями необходимо установить дистрибутив Anaconda (скачать можно здесь), который включает в себя интерпретатор языка Python, библиотеки для обработки, анализа и визуализации данных, а также среду для работы Jupyter Notebook. Также есть возможность работать в Jupyter Notebook онлайн, используя ресурс Google Colab (для создания и редактирования файлов нужен аккаунт Gmail).
Установка Anaconda и запуск Jupyter Notebook:
- Для установки Anaconda нужно скачать установочный файл для своей системы отсюда, запустить его и следовать инструкциям.
- Среду Jupyter Notebook можно запускать через приложение Anaconda Navigator (находим Anaconda Navigator в списке программ, запускаем, кликаем на кнопку Launch под Jupyter Notebook) и отдельно от него (см. инструкцию).
- Работа в Jupyter Notebook (видео), работа в Google Colab (видео).
- Набор текста в Jupyter (видео, ipynb).
Для тех, кто не работал в Python и Jupyter: можно записаться на вышкинский онлайн-курс «Python как иностранный» (открыт для записи в SmartLMS). Для подготовки рабочего места рекомендуется ознакомиться со следующими материалами в теме 1: Видео. Подготовка рабочего места, инструкция по открытию файлов в Jupyter Notebook, Видео. Первая программа, Задачи для тренировки.
Материалы
Введение в выборочные обследования
Генеральная совокупность и выборка. Репрезентативность выборки. Способы формирования выборок.
Нарушение свойства репрезентативности и виды смещений. Ошибка выборки (sampling error).
- Лекция 1. Введение в выборочные обследования (слайды, ipynb с примерами, файл students.csv).
- Практикум 1. Модуль random. Обработка данных с pandas (ipynb, beasts.csv), решения (ipynb).
Дополнительно:
- Массивы NumPy и датафреймы Pandas (читать).
- Основные операции с датафреймами Pandas (читать, Salaries.csv)
Описание данных
- Лекция 2. Описательные статистики (слайды).
- Практикум 2. Описательные статистики, группировка и агрегирование в pandas (ipynb, c.xlsx).
Домашние задания
Домашнее задание | Файлы | Дедлайн | Сдача |
---|---|---|---|
Домашнее задание 1 | ipynb owls.csv | 08.10 23:59 | ссылка на Dropbox |
Домашнее задание 2 | |||
Домашнее задание 3 | |||
Домашнее задание 4 | |||
Домашнее задание 5 | |||
Домашнее задание 6 | |||
Домашнее задание 7 |