Введение в регрессионный анализ: интенсив по Python: различия между версиями
(не показаны 2 промежуточные версии этого же участника) | |||
Строка 46: | Строка 46: | ||
* Немного теории перед семинаром 2: о представлении чисел и более сложных условиях (ipynb) | * Немного теории перед семинаром 2: о представлении чисел и более сложных условиях (ipynb) | ||
* Семинар 2. Операции с массивами NumPy: часть 2 ([https://github.com/allatambov/PyReg25/blob/main/seminar02-arr02.ipynb ipynb]), решения ([https://github.com/allatambov/PyReg25/blob/main/seminar02-arr02-solved.ipynb ipynb]) | * Семинар 2. Операции с массивами NumPy: часть 2 ([https://github.com/allatambov/PyReg25/blob/main/seminar02-arr02.ipynb ipynb]), решения ([https://github.com/allatambov/PyReg25/blob/main/seminar02-arr02-solved.ipynb ipynb]) | ||
+ | * Задачи для тренировки по итогам недели 1 ([https://github.com/allatambov/PyReg25/blob/main/train01.ipynb ipynb]) | ||
=== Неделя 2. Описательные статистики. Датафреймы Pandas === | === Неделя 2. Описательные статистики. Датафреймы Pandas === | ||
* Лекция 2. Описательные статистики ([https://disk.yandex.ru/i/qeCxXYKEc-UuXQ слайды]). Датафреймы Pandas и описание данных ([https://github.com/allatambov/PyReg25/blob/main/lect02.ipynb код]). | * Лекция 2. Описательные статистики ([https://disk.yandex.ru/i/qeCxXYKEc-UuXQ слайды]). Датафреймы Pandas и описание данных ([https://github.com/allatambov/PyReg25/blob/main/lect02.ipynb код]). | ||
− | * Семинар 3. Операции с датафреймами Pandas: часть 1 | + | * Семинар 3. Операции с датафреймами Pandas: часть 1 ([https://github.com/allatambov/PyReg25/blob/main/seminar03-pd01.ipynb ipynb]). |
* Семинар 4. Операции с датафреймами Pandas: часть 2 | * Семинар 4. Операции с датафреймами Pandas: часть 2 | ||
+ | |||
+ | == Learning outcomes == | ||
+ | |||
+ | Что нужно знать/уметь: | ||
+ | |||
+ | '''Неделя 1:''' импортировать библиотеку numpy, создавать массивы numpy из чисел или текстовых значений; выполнять векторные операции (умножение/деление массива на число, сложение/вычитание/умножение/деление нескольких массивов и подобные преобразования), проверять условия и фильтровать элементы массивов. | ||
+ | |||
+ | Основные операторы, функции и методы недели 1: | ||
+ | |||
+ | * операторы >, <, >=, <=, ==, !=, & и |; | ||
+ | * функция array() и метод .astype() из numpy(); | ||
+ | * базовые функции sum() и len(). |
Текущая версия на 23:31, 11 сентября 2025
Дорогие студенты!
Это страница первой части обязательного курса «Введение в регрессионный анализ», читаемого на ОП «Политология» 2 курса бакалавриата в 1-2 модулях 2025-2026 учебного года. На этой странице будут публиковаться материалы по первой части курса (1-29 сентября), которая представляет собой интенсив по обработке данных в Python. Дальнейшие материалы будут доступны в SmartLMS и в рассылке на корпоративные почты.
Занятия в рамках интенсива по Python ведет Тамбовцева Алла Андреевна, далее лекции по курсу читает Стукал Денис Константинович, семинары ведет – Конча Валерия.
Ссылка на программу курса.
Содержание
Правила игры
Формула оценки: 0.1 * Контрольная работа 1 + 0.15 * Практикум 1 + 0.1 * Контрольная работа 2 + 0.15 * Практикум 2 + 0.3 * Проверочные работы + 0.2 * Экзамен.
- Контрольная работа 1: письменная работа, состоит из вопросов с выбором ответа или кратким ответом. Предполагает выбор верных или неверных утверждений о базовых конструкциях и структурах данных Python, запись результата, получаемого после запуска представленного фрагмента кода, указание ошибок в коде или выбор безошибочных вариантов решений предложенной задачи. Запускать код на компьютере и пользоваться материалами во время работы запрещено.
- Практикум 1: практическая работа по загрузке и обработке данных по итогам интенсива в Python.
- Контрольная работа 2: письменная работа, охватывает материал всего курса.
- Практикум 2: практическая работа по обработке и анализу данных ближе к концу курса.
- Проверочные работы: небольшие письменные работы на лекциях.
- Экзамен: письменная работа в конце курса, экзамен является блокирующим.
Контрольная работа 1 и Практикум 1 – работы по итогам интенсива по Python, ориентировочные даты работ: контрольная работа – лекция 23 сентября, практикум – предпоследний семинар в сентябре (26 сентября).
Программное обеспечение
Для работы на курсе необходимо установить дистрибутив Anaconda (скачать можно здесь, регистрацию можно пропустить), который включает в себя интерпретатор языка Python, библиотеки для обработки, анализа и визуализации данных, а также среду для работы Jupyter Notebook. Также есть возможность работать в аналоге Jupyter Notebook онлайн, используя ресурс Google Colab (для создания и редактирования файлов нужен аккаунт Gmail).
Для подготовки к работе необходимо ознакомиться с материалами онлайн-курса:
- Видео. Подготовка рабочего места, инструкция по открытию файлов в Jupyter Notebook.
- Видео. Первая программа.
А также с материалами по работе в Jupyter Notebook и Google Colab:
- Запуск Jupyter без Anaconda Navigator (инструкция).
- Работа в Jupyter Notebook (видео), отличия Google Colab от Jupyter (видео).
Дополнительно для желающих:
- Набор текста в Jupyter Notebook (видео, ipynb), больше о Markdown.
- LaTeX: Overleaf, документация, материалы по LaTeX.
Материалы
Неделя 1. Введение в Python. Массивы NumPy
- Лекция 1. Введение в Python: написание кода, переменные, списки и массивы (слайды, код)
- Семинар 1. Операции с массивами NumPy: часть 1 (ipynb), решения (ipynb)
- Немного теории перед семинаром 2: о представлении чисел и более сложных условиях (ipynb)
- Семинар 2. Операции с массивами NumPy: часть 2 (ipynb), решения (ipynb)
- Задачи для тренировки по итогам недели 1 (ipynb)
Неделя 2. Описательные статистики. Датафреймы Pandas
- Лекция 2. Описательные статистики (слайды). Датафреймы Pandas и описание данных (код).
- Семинар 3. Операции с датафреймами Pandas: часть 1 (ipynb).
- Семинар 4. Операции с датафреймами Pandas: часть 2
Learning outcomes
Что нужно знать/уметь:
Неделя 1: импортировать библиотеку numpy, создавать массивы numpy из чисел или текстовых значений; выполнять векторные операции (умножение/деление массива на число, сложение/вычитание/умножение/деление нескольких массивов и подобные преобразования), проверять условия и фильтровать элементы массивов.
Основные операторы, функции и методы недели 1:
- операторы >, <, >=, <=, ==, !=, & и |;
- функция array() и метод .astype() из numpy();
- базовые функции sum() и len().