Основы анализа данных в Python: различия между версиями
Строка 11: | Строка 11: | ||
* Цель курса – '''подготовка к независимому экзамену''' по анализу данных. Демоверсию экзамена и тренировочные варианты можно <br> найти [https://www.hse.ru/studyspravka/examsdataculture#internal здесь] в разделе ''Материалы для подготовки'' – ''Анализ данных. Базовый уровень'' (запись на курс в SmartLMS). | * Цель курса – '''подготовка к независимому экзамену''' по анализу данных. Демоверсию экзамена и тренировочные варианты можно <br> найти [https://www.hse.ru/studyspravka/examsdataculture#internal здесь] в разделе ''Материалы для подготовки'' – ''Анализ данных. Базовый уровень'' (запись на курс в SmartLMS). | ||
* Курс включает темы, пройденные ранее в рамках обязательных курсов по ТВиМС и регрессионному анализу, поэтому теоретический материал <br> изучается (=повторяется) самостоятельно по предложенным материалам и в рамках '''онлайн-курса''' [https://edu.hse.ru/course/view.php?id=132492 «Сбор и анализ данных в Python»]. | * Курс включает темы, пройденные ранее в рамках обязательных курсов по ТВиМС и регрессионному анализу, поэтому теоретический материал <br> изучается (=повторяется) самостоятельно по предложенным материалам и в рамках '''онлайн-курса''' [https://edu.hse.ru/course/view.php?id=132492 «Сбор и анализ данных в Python»]. | ||
+ | * [https://disk.yandex.ru/i/Z3HZXnkIv25pQg Демоверсия] НЭ (ML – темы, относящиеся к машинному обучению, ML* – темы, которые не были затронуты в предыдущих обязательных курсах). | ||
== Программное обеспечение == | == Программное обеспечение == |
Версия 23:54, 4 ноября 2024
Дорогие студенты!
Это страница курса «Основы анализа данных в Python», читаемого во 2 модуле 2024-2025 учебного года на ОП «Политология».
Преподаватель: Тамбовцева Алла Андреевна.
Содержание
Правила игры
- Программа курса, организационная презентация.
- Формула оценки: 0.25 * Тесты + 0.25 * Практикум + 0.5 * Экзамен.
- Цель курса – подготовка к независимому экзамену по анализу данных. Демоверсию экзамена и тренировочные варианты можно
найти здесь в разделе Материалы для подготовки – Анализ данных. Базовый уровень (запись на курс в SmartLMS). - Курс включает темы, пройденные ранее в рамках обязательных курсов по ТВиМС и регрессионному анализу, поэтому теоретический материал
изучается (=повторяется) самостоятельно по предложенным материалам и в рамках онлайн-курса «Сбор и анализ данных в Python». - Демоверсия НЭ (ML – темы, относящиеся к машинному обучению, ML* – темы, которые не были затронуты в предыдущих обязательных курсах).
Программное обеспечение
В рамках этого курса мы будем использовать язык Python и среду разработки Jupyter Notebook. Также есть возможность работать в аналоге Jupyter Notebook онлайн, используя ресурс Google Colab (для создания и редактирования файлов нужен аккаунт Gmail).
NB. На независимом экзамене не разрешается использовать облачные ресурсы, включая Google Colab.
Если у вас ничего не установлено или вы успели «удалить весь Python», перед занятиями необходимо установить дистрибутив Anaconda (скачать можно здесь, регистрацию можно пропустить), который включает в себя интерпретатор языка Python, библиотеки для обработки, анализа и визуализации данных, а также среду для работы Jupyter Notebook.
Материалы по работе в Jupyter Notebook и Google Colab:
- Запуск Jupyter без Anaconda Navigator (инструкция).
- Работа в Jupyter Notebook (видео), отличия Google Colab от Jupyter (видео).
Дополнительно для желающих:
- Набор текста в Jupyter Notebook (видео, ipynb), больше о Markdown.
- LaTeX: Overleaf, документация, материалы по LaTeX.
Материалы курса
Неделя 1. Шкалы данных. Описание данных.
- Шкалы данных. Описательные статистики.
- Практикум 1. Массивы NumPy (w01-practice.ipynb).