Python для сбора и анализа данных: различия между версиями
Строка 66: | Строка 66: | ||
=== Кортежи и словари. Работа с файлами. Формат JSON. (1 и 4 марта) === | === Кортежи и словари. Работа с файлами. Формат JSON. (1 и 4 марта) === | ||
− | * Видеозапись: [https://www.dropbox.com/sh/pz7f0srpd8656vc/AABP5jfaL8r1Ufyn25g2wRsKa?dl=0 вторник], [https://www.dropbox.com/sh/ljyseo4m27eeshs/AAC1JZc0JVQVEqr4kDW4las9a?dl=0 пятница]. Сырые ipynb-файлы с занятия: [вторник], [пятница]. | + | * Видеозапись: [https://www.dropbox.com/sh/pz7f0srpd8656vc/AABP5jfaL8r1Ufyn25g2wRsKa?dl=0 вторник], [https://www.dropbox.com/sh/ljyseo4m27eeshs/AAC1JZc0JVQVEqr4kDW4las9a?dl=0 пятница]. Сырые ipynb-файлы с занятия: [https://allatambov.github.io/icef/01-03.ipynb вторник], [https://allatambov.github.io/icef/04-03.ipynb пятница]. |
* Кортежи ([https://github.com/allatambov/allatambov.github.io/blob/master/icef/seminars/tuples.ipynb смотреть], [https://allatambov.github.io/icef/seminars/tuples.ipynb скачать]). Словари ([https://github.com/allatambov/allatambov.github.io/blob/master/icef/seminars/dicts.ipynb смотреть], [https://allatambov.github.io/icef/seminars/dicts.ipynb скачать]). Множества ([https://nbviewer.jupyter.org/github/PyBasics-19/py-basics-19/blob/master/lectures/sets.ipynb смотреть]). | * Кортежи ([https://github.com/allatambov/allatambov.github.io/blob/master/icef/seminars/tuples.ipynb смотреть], [https://allatambov.github.io/icef/seminars/tuples.ipynb скачать]). Словари ([https://github.com/allatambov/allatambov.github.io/blob/master/icef/seminars/dicts.ipynb смотреть], [https://allatambov.github.io/icef/seminars/dicts.ipynb скачать]). Множества ([https://nbviewer.jupyter.org/github/PyBasics-19/py-basics-19/blob/master/lectures/sets.ipynb смотреть]). | ||
* Работа с файлами и JSON-файлы ([https://nbviewer.org/github/allatambov/PyDat-0919/blob/master/lectures-seminars/5-files/os-json.ipynb смотреть]). Файл [https://www.dropbox.com/s/f6qqy2popixxj2g/data.json?dl=0 data.json]. | * Работа с файлами и JSON-файлы ([https://nbviewer.org/github/allatambov/PyDat-0919/blob/master/lectures-seminars/5-files/os-json.ipynb смотреть]). Файл [https://www.dropbox.com/s/f6qqy2popixxj2g/data.json?dl=0 data.json]. |
Версия 00:30, 8 марта 2022
Это страница факультатива «Python для сбора и анализа данных», читаемого в МИЭФ в 2021/2022 учебном году.
Авторы курса: Щуров Илья Валерьевич, Тамбовцева Алла Андреевна.
Лекции и семинары ведет: Тамбовцева Алла Андреевна.
Содержание
- 1 Правила игры
- 2 Программное обеспечение
- 3 Материалы занятий
- 3.1 Презентация факультатива и знакомство с Jupyter Notebook (1 февраля)
- 3.2 Переменные и типы данных в Python. Ввод и вывод (8 или 11 февраля)
- 3.3 Списки и цикл for. Методы на строках. (15 или 18 февраля)
- 3.4 Генераторы списков. Условные конструкции и цикл while. (22 или 25 февраля)
- 3.5 Кортежи и словари. Работа с файлами. Формат JSON. (1 и 4 марта)
- 4 Дополнительные материалы
- 5 Домашние задания
Правила игры
- Формула оценки: 0.4 * ДЗ + 0.2 * Онлайн + 0.4 * Проект.
- Сдача домашних заданий с опозданием допускается, но со штрафом: за задержку в пределах часа – 15% от полученной оценки, в пределах суток – 30%, в пределах двух дней – 50%.
- Курс читается с использованием онлайн-курсов на платформе DataCamp. Бесплатный доступ к платформе студентам предоставляется.
Программное обеспечение
Перед занятиями необходимо установить дистрибутив Anaconda (скачать можно здесь), который включает в себя интерпретатор языка Python, библиотеки для обработки, анализа и визуализации данных, а также среду для работы Jupyter Notebook. Также есть возможность работать в Jupyter Notebook онлайн, используя ресурс Google Colab (для создания и редактирования файлов нужен аккаунт Gmail). Но в долгосрочной перспективе предпочтительнее установить Anaconda.
Материалы занятий
Презентация факультатива и знакомство с Jupyter Notebook (1 февраля)
- Презентация факультатива: слайды, видеозапись.
- Знакомство со средой Jupyter Notebook. Инструкция по работе с Jupyter Notebook. Знакомство с Jupyter Notebook и Markdown (смотреть, скачать).
Дополнительно:
- Markdown и Jupyter: больше про Markdown, интерактивные виджеты в Jupyter.
- LaTeX: ShareLaTeX для желающих, документация на английском, материалы других курсов по LaTeX.
Переменные и типы данных в Python. Ввод и вывод (8 или 11 февраля)
- Видеозапись занятия: вторник, пятница. Just wait, планирую разбить каждое видео на 2 части – пара до перерыва и после.
- Вычисления и переменные в Python (смотреть, скачать). Типы переменных, ввод и вывод в Python (смотреть, скачать).
- Форматирование строк (смотреть, скачать).
- Интерактивные виджеты в Jupyter Notebook: документация ipywidgets.
- Практикум 1: (смотреть, скачать), решения задач (смотреть, скачать).
Дополнительно:
- Pythontutor: визуализатор кода, вычисления, ввод и вывод.
- Проверка соответствия стандартам оформления кода: PEP8 online check.
Списки и цикл for. Методы на строках. (15 или 18 февраля)
- Видеозапись занятий: вторник, пятница. Файл для занятия.
- Списки и цикл for: введение (смотреть, скачать), методы на списках (смотреть, скачать).
- Методы .split() и .join() (смотреть, скачать).
- Практикум 2: списки, цикл for, методы на строках (смотреть, скачать), решения задач (смотреть, скачать).
Дополнительно:
Генераторы списков. Условные конструкции и цикл while. (22 или 25 февраля)
- Видеозапись занятия: вторник, пятница.
- Генераторы списков и enumerate() (смотреть, скачать).
- Проверка условий (смотреть, скачать). Условные конструкции (смотреть, скачать). Цикл while (смотреть, скачать).
- Практикум 3: условные конструкции и цикл while (смотреть, скачать), решения задач (смотреть, скачать).
Дополнительно:
Кортежи и словари. Работа с файлами. Формат JSON. (1 и 4 марта)
- Видеозапись: вторник, пятница. Сырые ipynb-файлы с занятия: вторник, пятница.
- Кортежи (смотреть, скачать). Словари (смотреть, скачать). Множества (смотреть).
- Работа с файлами и JSON-файлы (смотреть). Файл data.json.
- Практикум 4: словари (смотреть, скачать), решения задач ([смотреть], [скачать]).
Дополнительные материалы
Библиотека SymPy для символьных вычислений
Введение в SymPy: часть 1 (sympy-1.ipynb), часть 2 (sympy-2.ipynb), задачи (sympy-problems.ipynb). Официальная документация SymPy.
Работа с текстом в Python
Библиотека pymorphy2 (морфологический анализатор). Библиотека pymystem3 (предобработка текста). Тьюториал для построения облака слов.
Статистика и анализ данных в Python
Материалы по статистическим тестам и линейным регрессиям в Python.
Домашние задания
- Домашние задания типа online выполняются на платформе DataCamp.
- Обычные домашние задания сдаются в системе python.math-hse.info. Познакомиться с системой можно на примере домашнего задания №0.
Домашнее задание | Ссылка | Дедлайн |
---|---|---|
Online 1 | DataCamp: глава Python Lists | 17.02 23:59 |
Домашнее задание 1 | MathInfo: задания hw01 | 02.03. 23:59 |
Online 2 | DataCamp: глава Writing your own functions | 17.03 23:59 |
Online 3 | DataCamp: глава Default arguments, variable-length arguments and scope | 17.03 23:59 |
Домашнее задание 2 | MathInfo: задания hw02 | 24.03 23:59 |