НИС Основы анализа данных в Python: различия между версиями
Строка 26: | Строка 26: | ||
=== Неделя 1. Группировка с pandas. Критерий согласия хи-квадрат === | === Неделя 1. Группировка с pandas. Критерий согласия хи-квадрат === | ||
− | * Группировка с pandas (ipynb), данные для работы ([https://disk.yandex.ru/d/e8d-0Kn6loPqTA happiness_b.csv]). | + | * Практикум 1. Группировка с pandas (ipynb), данные для работы ([https://disk.yandex.ru/d/e8d-0Kn6loPqTA happiness_b.csv]). |
* Тренировочный вариант НЭ ([https://disk.yandex.ru/d/d68hgQqd2WDG6A ссылка], доступен по паролю). | * Тренировочный вариант НЭ ([https://disk.yandex.ru/d/d68hgQqd2WDG6A ссылка], доступен по паролю). | ||
* Меры связи в качественной шкале: критерий хи-квадрат ([https://disk.yandex.ru/d/Minm4WBgnDAhqw слайды]). | * Меры связи в качественной шкале: критерий хи-квадрат ([https://disk.yandex.ru/d/Minm4WBgnDAhqw слайды]). | ||
+ | |||
+ | === Неделя 2. Качественные данные и критерий согласия хи-квадрат === | ||
+ | |||
+ | * Практикум 2. Критерий согласия хи-квадрат, обработка текстовых данных и дат ([https://disk.yandex.ru/d/OUu0-aoJQSo8-g ipynb]), данные ([https://disk.yandex.ru/d/HEe4DAAfkjWdiQ CSV-файлы]). | ||
+ | |||
+ | == К независимому экзамену == | ||
+ | |||
+ | ''Задания взяты из SmartLMS, материалы по ссылкам ниже доступны по паролю из рассылки (одинаковый у всех файлов).'' | ||
+ | |||
+ | Разбор демоверсии из SmartLMS: | ||
+ | |||
+ | * [https://disk.yandex.ru/i/Z3HZXnkIv25pQg Демоверсия] НЭ (ML – темы, относящиеся к машинному обучению, ML* – темы, которые не были затронуты в обязательных курсах). | ||
+ | * Разбор заданий по визуализации (№1-2 и №8-9): [https://disk.yandex.ru/d/TPkEOj6VA1Dh3w ссылка]. | ||
+ | * Разбор заданий по нормальному распределению и свойствам выборок (№4-5): [https://disk.yandex.ru/d/DXq4TAN7LFJzbA ссылка]. | ||
+ | * Разбор заданий по проверке гипотез (№10-11): [https://disk.yandex.ru/d/5X5S0XlLYM8M1A ссылка]. | ||
+ | |||
+ | Решения тренировочных заданий из SmartLMS: | ||
+ | |||
+ | * часть B (будет добавлено позже) | ||
+ | * часть C ([https://disk.yandex.ru/d/iSnsLe7DK_wnxg ссылка]) |
Версия 03:13, 24 января 2025
Дорогие студенты!
Это страница курса НИС «Основы анализа данных в Python», читаемого в 3 модуле 2024-2025 учебного года на ОП «Политология».
Этот курс является продолжением обязательного курса «Основы анализа данных в Python».
Преподаватель: Тамбовцева Алла Андреевна.
Содержание
Правила игры
- Программа курса, организационная презентация.
- Формула оценки: 0.15 * Тесты + 0.2 * Практикум + 0.2 * ДЗ + 0.45 * Экзамен.
- Цель курса – подготовка к независимому экзамену по анализу данных. Демоверсию экзамена и тренировочные варианты
можно найти здесь в разделе Материалы для подготовки – Анализ данных. Базовый уровень (запись на курс в SmartLMS).
Программное обеспечение
В рамках этого курса мы будем использовать язык Python и среду разработки Jupyter Notebook.
Также есть возможность работать в аналоге Jupyter Notebook онлайн, используя ресурс Google Colab
(для создания и редактирования файлов нужен аккаунт Gmail).
NB. На независимом экзамене не разрешается использовать облачные ресурсы, включая Google Colab.
Если у вас ничего не установлено или вы успели «удалить весь Python», перед занятиями необходимо
установить дистрибутив Anaconda (скачать можно здесь, регистрацию можно пропустить), который
включает в себя интерпретатор языка Python, библиотеки для обработки, анализа и визуализации
данных, а также среду для работы Jupyter Notebook. Материалы по работе в Jupyter Notebook и Colab:
- Запуск Jupyter без Anaconda Navigator (инструкция).
- Работа в Jupyter Notebook (видео), отличия Google Colab от Jupyter (видео).
Материалы курса
Неделя 1. Группировка с pandas. Критерий согласия хи-квадрат
- Практикум 1. Группировка с pandas (ipynb), данные для работы (happiness_b.csv).
- Тренировочный вариант НЭ (ссылка, доступен по паролю).
- Меры связи в качественной шкале: критерий хи-квадрат (слайды).
Неделя 2. Качественные данные и критерий согласия хи-квадрат
- Практикум 2. Критерий согласия хи-квадрат, обработка текстовых данных и дат (ipynb), данные (CSV-файлы).
К независимому экзамену
Задания взяты из SmartLMS, материалы по ссылкам ниже доступны по паролю из рассылки (одинаковый у всех файлов).
Разбор демоверсии из SmartLMS:
- Демоверсия НЭ (ML – темы, относящиеся к машинному обучению, ML* – темы, которые не были затронуты в обязательных курсах).
- Разбор заданий по визуализации (№1-2 и №8-9): ссылка.
- Разбор заданий по нормальному распределению и свойствам выборок (№4-5): ссылка.
- Разбор заданий по проверке гипотез (№10-11): ссылка.
Решения тренировочных заданий из SmartLMS:
- часть B (будет добавлено позже)
- часть C (ссылка)