Python для сбора и анализа данных: различия между версиями

Материал из MathINFO
Перейти к навигации Перейти к поиску
Строка 40: Строка 40:
 
* Проверка соответствия стандартам оформления кода: [http://pep8online.com/ PEP8 online check].
 
* Проверка соответствия стандартам оформления кода: [http://pep8online.com/ PEP8 online check].
  
=== Списки и цикл for. Условные конструкции и цикл while. (15 или 18 февраля) ===  
+
=== Списки и цикл for. Методы на строках. (15 или 18 февраля) ===  
  
 +
* Видеозапись занятий: [https://www.dropbox.com/sh/qdoeowc7uaok7ta/AAAMMy7x0KOMbjXtQTcZfk28a?dl=0 вторник], пятница.
 
* Списки и цикл for: введение ([https://allatambov.github.io/icef/seminars/lists-1-raw.ipynb файл]), методы на списках ([https://nbviewer.org/github/allatambov/allatambov.github.io/blob/master/icef/seminars/lists-2.ipynb смотреть], [https://allatambov.github.io/icef/seminars/lists-2.ipynb скачать]).
 
* Списки и цикл for: введение ([https://allatambov.github.io/icef/seminars/lists-1-raw.ipynb файл]), методы на списках ([https://nbviewer.org/github/allatambov/allatambov.github.io/blob/master/icef/seminars/lists-2.ipynb смотреть], [https://allatambov.github.io/icef/seminars/lists-2.ipynb скачать]).
 +
* Методы .split() и .join() (смотреть, скачать).
 +
* Практикум 2: списки, цикл for, методы на строках ([https://nbviewer.org/github/allatambov/allatambov.github.io/blob/master/icef/seminars/icef-seminar02.ipynb смотреть], [https://allatambov.github.io/icef/seminars/icef-seminar02.ipynb скачать]), решения задач (смотреть, скачать).
 +
 +
Дополнительно:
 +
 +
* Pythontutor: [https://pythontutor.ru/lessons/for_loop/ цикл for], [https://pythontutor.ru/lessons/lists/ списки], [https://pythontutor.ru/lessons/str/ строки].
 +
* Методы на строках: [https://www.w3schools.com/python/python_ref_string.asp обзор].
 +
 +
=== Генераторы списков. Условные конструкции и цикл while. (22 или 25 февраля) ===
 +
 
* Генераторы списков и enumerate() ([https://allatambov.github.io/icef/seminars/more-lists-raw.ipynb файл]).
 
* Генераторы списков и enumerate() ([https://allatambov.github.io/icef/seminars/more-lists-raw.ipynb файл]).
* Методы .split() и .join(), методы на строках ([https://www.w3schools.com/python/python_ref_string.asp обзор]).
+
* Проверка условий (смотреть, скачать). Условные конструкции и цикл while (смотреть, скачать).
* Практикум 2: ([https://nbviewer.org/github/allatambov/allatambov.github.io/blob/master/icef/seminars/icef-seminar02.ipynb смотреть], [https://allatambov.github.io/icef/seminars/icef-seminar02.ipynb скачать]), решения задач (смотреть, скачать).
+
* Практикум 3: условные конструкции и цикл while (смотреть, скачать), решения задач (смотреть, скачать).
 +
 
 +
=== Функции. Кортежи и словари. Работа с файлами JSON. (1 и 4 марта) ===
 +
 
 +
* Функции (смотреть, скачать). Lambda-функции (смотреть, скачать).  
 +
* Кортежи и словари (смотреть, скачать). Работа с JSON-файлами (смотреть, скачать).
 +
* Практикум 4: функции и lambda-функции (смотреть, скачать), решения задач (смотреть, скачать).
 +
* Практикум 5: словари и JSON-файлы (смотреть, скачать), решения задач (смотреть, скачать).
  
 
== Дополнительные материалы ==
 
== Дополнительные материалы ==

Версия 01:13, 16 февраля 2022

Это страница факультатива «Python для сбора и анализа данных», читаемого в МИЭФ в 2021/2022 учебном году.

Авторы курса: Щуров Илья Валерьевич, Тамбовцева Алла Андреевна.

Лекции и семинары ведет: Тамбовцева Алла Андреевна.

Правила игры

  • Формула оценки: 0.4 * ДЗ + 0.2 * Онлайн + 0.4 * Проект.
  • Сдача домашних заданий с опозданием допускается, но со штрафом: за задержку в пределах часа – 15% от полученной оценки, в пределах суток – 30%, в пределах двух дней – 50%.
  • Курс читается с использованием онлайн-курсов на платформе DataCamp. Бесплатный доступ к платформе студентам предоставляется.

Программное обеспечение

Перед занятиями необходимо установить дистрибутив Anaconda (скачать можно здесь), который включает в себя интерпретатор языка Python, библиотеки для обработки, анализа и визуализации данных, а также среду для работы Jupyter Notebook. Также есть возможность работать в Jupyter Notebook онлайн, используя ресурс Google Colab (для создания и редактирования файлов нужен аккаунт Gmail). Но в долгосрочной перспективе предпочтительнее установить Anaconda.

Материалы занятий

Презентация факультатива и знакомство с Jupyter Notebook (1 февраля)

Дополнительно:

Переменные и типы данных в Python. Ввод и вывод (8 или 11 февраля)

Дополнительно:

Списки и цикл for. Методы на строках. (15 или 18 февраля)

  • Видеозапись занятий: вторник, пятница.
  • Списки и цикл for: введение (файл), методы на списках (смотреть, скачать).
  • Методы .split() и .join() (смотреть, скачать).
  • Практикум 2: списки, цикл for, методы на строках (смотреть, скачать), решения задач (смотреть, скачать).

Дополнительно:

Генераторы списков. Условные конструкции и цикл while. (22 или 25 февраля)

  • Генераторы списков и enumerate() (файл).
  • Проверка условий (смотреть, скачать). Условные конструкции и цикл while (смотреть, скачать).
  • Практикум 3: условные конструкции и цикл while (смотреть, скачать), решения задач (смотреть, скачать).

Функции. Кортежи и словари. Работа с файлами JSON. (1 и 4 марта)

  • Функции (смотреть, скачать). Lambda-функции (смотреть, скачать).
  • Кортежи и словари (смотреть, скачать). Работа с JSON-файлами (смотреть, скачать).
  • Практикум 4: функции и lambda-функции (смотреть, скачать), решения задач (смотреть, скачать).
  • Практикум 5: словари и JSON-файлы (смотреть, скачать), решения задач (смотреть, скачать).

Дополнительные материалы

Библиотека SymPy для символьных вычислений

Введение в SymPy: часть 1 (sympy-1.ipynb). Введение в SymPy: часть 2 (sympy-2.ipynb). Задачи по SymPy (sympy-problems.ipynb). Официальная документация SymPy.

Работа с текстом в Python

Библиотека pymorphy2 (морфологический анализатор). Библиотека pymystem3 (предобработка текста). Тьюториал для построения облака слов (word cloud).

Статистика и анализ данных в Python

Материалы по статистическим тестам и линейным регрессиям в Python.

Домашние задания

  • Домашние задания типа online выполняются на платформе DataCamp.
  • Обычные домашние задания сдаются в системе python.math-hse.info. Познакомиться с системой можно на примере домашнего задания №0.
Домашнее задание Ссылка Дедлайн
Online 1 DataCamp: глава Python Lists 17.02 23:59
Домашнее задание 1