Введение в регрессионный анализ: интенсив по Python: различия между версиями

Материал из MathINFO
Перейти к навигации Перейти к поиску
(Новая страница: «Дорогие студенты! Это страница '''первой части''' обязательного курса '''«Введение в регре...»)
 
 
(не показано 11 промежуточных версий этого же участника)
Строка 1: Строка 1:
 
Дорогие студенты!
 
Дорогие студенты!
  
Это страница '''первой части''' обязательного курса '''«Введение в регрессионный анализ»''', читаемого на ОП «Политология» 2 курса бакалавриата в 1-2 модулях 2025-2026 учебного года. На этой странице будут публиковаться материалы по первой части курса (1-30 сентября), которая представляет собой интенсив по обработке данных в Python. Дальнейшие материалы будут доступны в SmartLMS и в рассылке на корпоративные почты.
+
Это страница '''первой части''' обязательного курса '''«Введение в регрессионный анализ»''', читаемого на ОП «Политология» 2 курса бакалавриата в 1-2 модулях 2025-2026 учебного года. На этой странице будут публиковаться материалы по первой части курса (1-29 сентября), которая представляет собой интенсив по обработке данных в Python. Дальнейшие материалы будут доступны в SmartLMS и в рассылке на корпоративные почты.
  
 
Занятия в рамках интенсива по Python ведет Тамбовцева Алла Андреевна, далее лекции по курсу читает Стукал Денис Константинович, семинары ведет – Конча Валерия.
 
Занятия в рамках интенсива по Python ведет Тамбовцева Алла Андреевна, далее лекции по курсу читает Стукал Денис Константинович, семинары ведет – Конча Валерия.
Строка 17: Строка 17:
 
* '''Экзамен''': письменная работа в конце курса, экзамен является блокирующим.
 
* '''Экзамен''': письменная работа в конце курса, экзамен является блокирующим.
  
Контрольная работа 1 и Практикум 1 – работы по итогам интенсива по Python, ориентировочные даты работ: контрольная работа – лекция 23 сентября, практикум – предпоследний семинар в сентябре (по расписанию групп).
+
Контрольная работа 1 и Практикум 1 – работы по итогам интенсива по Python, ориентировочные даты работ: контрольная работа – лекция 23 сентября, практикум – предпоследний семинар в сентябре (26 сентября).
 +
 
 +
== Программное обеспечение ==
 +
 
 +
Для работы на курсе необходимо установить дистрибутив '''Anaconda''' (скачать можно [https://www.anaconda.com/download здесь], регистрацию можно пропустить), который включает в себя интерпретатор языка Python, библиотеки для обработки, анализа и визуализации данных, а также среду для работы '''Jupyter Notebook'''. Также есть возможность работать в аналоге Jupyter Notebook онлайн, используя [https://colab.research.google.com/ ресурс] '''Google Colab''' (для создания и редактирования файлов нужен аккаунт Gmail).
 +
 
 +
Для подготовки к работе необходимо ознакомиться с материалами [https://edu.hse.ru/course/view.php?id=133389 онлайн-курса]:
 +
 
 +
* [https://edu.hse.ru/mod/page/view.php?id=502433 Видео. Подготовка рабочего места], [https://edu.hse.ru/mod/page/view.php?id=502434 инструкция] по открытию файлов в Jupyter Notebook.
 +
* [https://edu.hse.ru/mod/page/view.php?id=502436 Видео. Первая программа].
 +
 
 +
А также с материалами по работе в Jupyter Notebook и Google Colab:
 +
 
 +
* Запуск Jupyter без Anaconda Navigator ([https://disk.yandex.ru/i/myq-uGHP4lcdSA инструкция]).
 +
* Работа в Jupyter Notebook ([https://disk.yandex.ru/i/2NYAqowJjmS2SA видео]), отличия Google Colab от Jupyter ([https://disk.yandex.ru/i/cGbacX28YtR08g видео]).
 +
 
 +
Дополнительно для желающих:
 +
 
 +
* Набор текста в Jupyter Notebook ([https://disk.yandex.ru/i/bNqLGRjrq_UEjg видео], [https://disk.yandex.ru/d/C1E7Axa0jr4nwQ ipynb]), [https://gist.github.com/Jekins/2bf2d0638163f1294637 больше] о Markdown.
 +
* LaTeX: [https://www.overleaf.com/ Overleaf], [https://www.overleaf.com/learn документация], [https://github.com/allatambov/Latex материалы] по LaTeX.
 +
 
 +
== Материалы ==
 +
 
 +
=== Неделя 1. Введение в Python. Массивы NumPy ===
 +
 
 +
* Лекция 1. Введение в Python: написание кода, переменные, списки и массивы ([https://disk.yandex.ru/d/7UP5GiKTlx5Ffw слайды], [https://github.com/allatambov/PyReg25/blob/main/lect01.ipynb код])
 +
* Семинар 1. Операции с массивами NumPy: часть 1 ([https://github.com/allatambov/PyReg25/blob/main/seminar01-arr01.ipynb ipynb]), решения ([https://github.com/allatambov/PyReg25/blob/main/seminar01-arr01-solved.ipynb ipynb])
 +
* Немного теории перед семинаром 2: о представлении чисел и более сложных условиях (ipynb)
 +
* Семинар 2. Операции с массивами NumPy: часть 2 ([https://github.com/allatambov/PyReg25/blob/main/seminar02-arr02.ipynb ipynb]), решения ([https://github.com/allatambov/PyReg25/blob/main/seminar02-arr02-solved.ipynb ipynb])
 +
 
 +
=== Неделя 2. Описательные статистики. Датафреймы Pandas ===
 +
 
 +
* Лекция 2. Описательные статистики ([https://disk.yandex.ru/i/qeCxXYKEc-UuXQ слайды]). Датафреймы Pandas и описание данных ([https://github.com/allatambov/PyReg25/blob/main/lect02.ipynb код]).
 +
* Семинар 3. Операции с датафреймами Pandas: часть 1
 +
* Семинар 4. Операции с датафреймами Pandas: часть 2

Текущая версия на 21:25, 9 сентября 2025

Дорогие студенты!

Это страница первой части обязательного курса «Введение в регрессионный анализ», читаемого на ОП «Политология» 2 курса бакалавриата в 1-2 модулях 2025-2026 учебного года. На этой странице будут публиковаться материалы по первой части курса (1-29 сентября), которая представляет собой интенсив по обработке данных в Python. Дальнейшие материалы будут доступны в SmartLMS и в рассылке на корпоративные почты.

Занятия в рамках интенсива по Python ведет Тамбовцева Алла Андреевна, далее лекции по курсу читает Стукал Денис Константинович, семинары ведет – Конча Валерия.

Ссылка на программу курса.

Правила игры

Формула оценки: 0.1 * Контрольная работа 1 + 0.15 * Практикум 1 + 0.1 * Контрольная работа 2 + 0.15 * Практикум 2 + 0.3 * Проверочные работы + 0.2 * Экзамен.

  • Контрольная работа 1: письменная работа, состоит из вопросов с выбором ответа или кратким ответом. Предполагает выбор верных или неверных утверждений о базовых конструкциях и структурах данных Python, запись результата, получаемого после запуска представленного фрагмента кода, указание ошибок в коде или выбор безошибочных вариантов решений предложенной задачи. Запускать код на компьютере и пользоваться материалами во время работы запрещено.
  • Практикум 1: практическая работа по загрузке и обработке данных по итогам интенсива в Python.
  • Контрольная работа 2: письменная работа, охватывает материал всего курса.
  • Практикум 2: практическая работа по обработке и анализу данных ближе к концу курса.
  • Проверочные работы: небольшие письменные работы на лекциях.
  • Экзамен: письменная работа в конце курса, экзамен является блокирующим.

Контрольная работа 1 и Практикум 1 – работы по итогам интенсива по Python, ориентировочные даты работ: контрольная работа – лекция 23 сентября, практикум – предпоследний семинар в сентябре (26 сентября).

Программное обеспечение

Для работы на курсе необходимо установить дистрибутив Anaconda (скачать можно здесь, регистрацию можно пропустить), который включает в себя интерпретатор языка Python, библиотеки для обработки, анализа и визуализации данных, а также среду для работы Jupyter Notebook. Также есть возможность работать в аналоге Jupyter Notebook онлайн, используя ресурс Google Colab (для создания и редактирования файлов нужен аккаунт Gmail).

Для подготовки к работе необходимо ознакомиться с материалами онлайн-курса:

А также с материалами по работе в Jupyter Notebook и Google Colab:

Дополнительно для желающих:

Материалы

Неделя 1. Введение в Python. Массивы NumPy

  • Лекция 1. Введение в Python: написание кода, переменные, списки и массивы (слайды, код)
  • Семинар 1. Операции с массивами NumPy: часть 1 (ipynb), решения (ipynb)
  • Немного теории перед семинаром 2: о представлении чисел и более сложных условиях (ipynb)
  • Семинар 2. Операции с массивами NumPy: часть 2 (ipynb), решения (ipynb)

Неделя 2. Описательные статистики. Датафреймы Pandas

  • Лекция 2. Описательные статистики (слайды). Датафреймы Pandas и описание данных (код).
  • Семинар 3. Операции с датафреймами Pandas: часть 1
  • Семинар 4. Операции с датафреймами Pandas: часть 2