Python для сбора и анализа данных: различия между версиями

Материал из MathINFO
Перейти к навигации Перейти к поиску
Строка 37: Строка 37:
 
* Списки и цикл for: введение ([https://nbviewer.jupyter.org/github/allatambov/allatambov.github.io/blob/master/icef/seminars/lists-1.ipynb конспект], [https://allatambov.github.io/icef/seminars/lists-1.ipynb lists-1.ipynb]). Списки: методы на списках. ([https://github.com/allatambov/allatambov.github.io/blob/master/icef/seminars/lists-2.ipynb конспект], [https://allatambov.github.io/icef/seminars/lists-2.ipynb lists-2.ipynb]). Pythontutor: [https://pythontutor.ru/lessons/lists/ списки], [https://pythontutor.ru/lessons/for_loop/ цикл for].
 
* Списки и цикл for: введение ([https://nbviewer.jupyter.org/github/allatambov/allatambov.github.io/blob/master/icef/seminars/lists-1.ipynb конспект], [https://allatambov.github.io/icef/seminars/lists-1.ipynb lists-1.ipynb]). Списки: методы на списках. ([https://github.com/allatambov/allatambov.github.io/blob/master/icef/seminars/lists-2.ipynb конспект], [https://allatambov.github.io/icef/seminars/lists-2.ipynb lists-2.ipynb]). Pythontutor: [https://pythontutor.ru/lessons/lists/ списки], [https://pythontutor.ru/lessons/for_loop/ цикл for].
 
* Генераторы списков и enumerate() ([https://nbviewer.jupyter.org/github/allatambov/allatambov.github.io/blob/master/icef/seminars/more-lists.ipynb конспект], [https://allatambov.github.io/icef/seminars/more-lists.ipynb more-lists.ipynb]).
 
* Генераторы списков и enumerate() ([https://nbviewer.jupyter.org/github/allatambov/allatambov.github.io/blob/master/icef/seminars/more-lists.ipynb конспект], [https://allatambov.github.io/icef/seminars/more-lists.ipynb more-lists.ipynb]).
* Методы на строках ([https://www.w3schools.com/python/python_ref_string.asp ссылка]). Pythontutor: [https://pythontutor.ru/lessons/str/ строки]. Методы .split() и .join() (split-join.ipynb) – пока не разбирали.  
+
* Методы на строках ([https://www.w3schools.com/python/python_ref_string.asp ссылка]). Pythontutor: [https://pythontutor.ru/lessons/str/ строки]. Методы .split() и .join() ([https://nbviewer.jupyter.org/github/allatambov/allatambov.github.io/blob/master/icef/seminars/split-join.ipynb конспект], [https://allatambov.github.io/icef/seminars/split-join.ipynb split-join.ipynb]).  
 
* Семинар 2: списки и строки ([https://github.com/allatambov/allatambov.github.io/blob/master/icef/seminars/icef-seminar02.ipynb задания], [https://allatambov.github.io/icef/seminars/icef-seminar02.ipynb icef-seminar02.ipynb]), решения ([https://github.com/allatambov/allatambov.github.io/blob/master/icef/seminars/icef-seminar02-solutions.ipynb конспект], [https://allatambov.github.io/icef/seminars/icef-seminar02-solutions.ipynb icef-seminar02-solutions.ipynb]).
 
* Семинар 2: списки и строки ([https://github.com/allatambov/allatambov.github.io/blob/master/icef/seminars/icef-seminar02.ipynb задания], [https://allatambov.github.io/icef/seminars/icef-seminar02.ipynb icef-seminar02.ipynb]), решения ([https://github.com/allatambov/allatambov.github.io/blob/master/icef/seminars/icef-seminar02-solutions.ipynb конспект], [https://allatambov.github.io/icef/seminars/icef-seminar02-solutions.ipynb icef-seminar02-solutions.ipynb]).
  

Версия 22:56, 24 февраля 2021

Это страница факультатива «Python для сбора и анализа данных», читаемого в МИЭФ в 2020/2021 учебном году.

Лекции и семинары ведет: Тамбовцева Алла Андреевна

Правила игры

  • Формула оценки: 0.4 * ДЗ + 0.2 * Онлайн + 0.4 * Проект.
  • Сдача домашних заданий с опозданием допускается, но со штрафом: за задержку в пределах часа – 15% от полученной оценки, в пределах суток – 30%, в пределах двух дней – 50%.
  • Курс читается с использованием онлайн-курсов на платформе DataCamp. Бесплатный доступ к платформе студентам предоставляется.

Программное обеспечение

Перед занятиями необходимо установить дистрибутив Anaconda (скачать можно здесь), который включает в себя интерпретатор языка Python, библиотеки для обработки, анализа и визуализации данных, а также среду для работы Jupyter Notebook. Также есть возможность работать в Jupyter Notebook онлайн, используя ресурс Google Colab (для создания и редактирования файлов нужен аккаунт Gmail). Но в долгосрочной перспективе предпочтительнее установить Anaconda.

Материалы занятий

10 февраля Видеозапись

Тема 1. Введение в Python и Jupyter Notebook

Тема 2. Типы данных в Python. Ввод и вывод.

17 февраля Видеозапись

Тема 3. Списки и цикл for. Методы на строках.

24 февраля [Видеозапись]

Тема 4. Проверка условий и условные конструкции. Цикл while.

Тема 5*. Структуры данных в Python: кортежи, множества, словари.

Дополнительные материалы

Библиотека SymPy для символьных вычислений

Введение в SymPy: часть 1 (sympy-1.ipynb). Введение в SymPy: часть 2 (sympy-2.ipynb). Задачи по SymPy (sympy-problems.ipynb). Официальная документация SymPy.

Работа с текстом в Python

Библиотека pymorphy2 (морфологический анализатор). Библиотека pymystem3 (предобработка текста). Тьюториал для построения облака слов (word cloud).

Домашние задания и online

Домашнее задание Ссылка Дедлайн
Online 1 DataCamp: глава Python Lists 17 февраля 18:10
Online 2 DataCamp: глава Fundamental data types 24 февраля 18:10
Домашнее задание 1 задание, hw01.ipynb, сдавать на Dropbox 28 февраля 23:59
Online 3 DataCamp: глава Dictionaries - the root of Python 3 марта 18:10
Домашнее задание 2 [задание], [hw02.ipynb], сдавать на [Dropbox] 9 марта 23:59
Online 4 DataCamp: глава Default arguments, variable-length arguments and scope 10 марта 18:10