Python для сбора и анализа данных: различия между версиями

Материал из MathINFO
Перейти к навигации Перейти к поиску
(Новая страница: «Это страница факультатива '''«Python для сбора и анализа данных»''', читаемого в МИЭФ в '''2020/2021...»)
 
Строка 19: Строка 19:
 
'''Тема 1. Введение в Python и Jupyter Notebook'''
 
'''Тема 1. Введение в Python и Jupyter Notebook'''
  
* Инструкция по работе с Jupyter Notebook. Знакомство с Jupyter Notebook и Markdown (intro-jupyter.ipynb).
+
* [https://allatambov.github.io/icef/seminars/instruction-JN.pdf Инструкция] по работе с Jupyter Notebook. Знакомство с Jupyter Notebook и Markdown (intro-jupyter.ipynb).
 
* Вычисления и переменные в Python (intro-variables.ipynb).
 
* Вычисления и переменные в Python (intro-variables.ipynb).
* Pythontutor: визуализатор кода, вычисления.
+
* Pythontutor: [http://pythontutor.ru/visualizer/ визуализатор] кода, [https://pythontutor.ru/lessons/int_and_float/ вычисления].
* Markdown и Jupyter: больше про Markdown, интерактивные виджеты в Jupyter.
+
* Markdown и Jupyter: [https://www.ibm.com/support/knowledgecenter/SSQNUZ_current/com.ibm.icpdata.doc/dsx/markd-jupyter.html больше] про Markdown, интерактивные [https://ipywidgets.readthedocs.io/en/stable/examples/Widget%20Basics.html виджеты] в Jupyter.
* LaTeX: ShareLaTeX для желающих, документация на английском, материалы других курсов по LaTeX.
+
* LaTeX: [https://ru.sharelatex.com/ ShareLaTeX] для желающих, документация на английском, [https://github.com/allatambov/Latex материалы] других курсов по LaTeX.
  
 
'''Тема 2. Типы данных в Python. Ввод и вывод. Форматирование строк.'''
 
'''Тема 2. Типы данных в Python. Ввод и вывод. Форматирование строк.'''
  
* Типы переменных, ввод и вывод в Python (intro-types.ipynb). Форматирование строк (str-formatting.ipynb). Pythontutor: ввод и вывод.
+
* Типы переменных, ввод и вывод в Python (intro-types.ipynb). Форматирование строк (str-formatting.ipynb). Pythontutor: [https://pythontutor.ru/lessons/inout_and_arithmetic_operations/ ввод и вывод].
* Семинар 1: ввод-вывод и приведение типов (icef-seminar01.ipynb), решения (icef-seminar01-solutions.ipynb).
+
* Семинар 1: ввод-вывод и приведение типов ([https://nbviewer.jupyter.org/github/allatambov/allatambov.github.io/blob/master/icef/seminars/icef-seminar01.ipynb icef-seminar01.ipynb]), решения (icef-seminar01-solutions.ipynb).
  
 
<!-->
 
<!-->
Строка 43: Строка 43:
 
* Проверка условий (conditions.ipynb). Условные конструкции (if-else.ipynb). Цикл while (while.ipynb). Pythontutor: условия, цикл while.
 
* Проверка условий (conditions.ipynb). Условные конструкции (if-else.ipynb). Цикл while (while.ipynb). Pythontutor: условия, цикл while.
 
* Семинар 3: условные конструкции и цикл while (icef-seminar03.ipynb), решения (icef-seminar03-solution.ipynb).
 
* Семинар 3: условные конструкции и цикл while (icef-seminar03.ipynb), решения (icef-seminar03-solution.ipynb).
 +
<-->
 +
 +
==Дополнительные материалы==
 +
 +
'''Библиотека SymPy для символьных вычислений'''
 +
 +
Введение в SymPy: часть 1 ([https://nbviewer.jupyter.org/github/allatambov/py-icef/blob/master/add/sympy-1.ipynb sympy-1.ipynb]). Введение в SymPy: часть 2 ([https://nbviewer.jupyter.org/github/allatambov/py-icef/blob/master/add/sympy-2.ipynb sympy-2.ipynb]). Задачи по SymPy ([https://nbviewer.jupyter.org/github/allatambov/py-icef/blob/master/add/sympy-problems.ipynb sympy-problems.ipynb]). Официальная документация [https://www.sympy.org/en/index.html SymPy].
 +
 +
'''Работа с текстом в Python'''
 +
 +
Библиотека [https://pymorphy2.readthedocs.io/en/latest/ pymorphy2] (морфологический анализатор). Библиотека [https://github.com/nlpub/pymystem3 pymystem3] (предобработка текста). [https://www.datacamp.com/community/tutorials/wordcloud-python Тьюториал] для построения облака слов (word cloud).

Версия 18:01, 10 февраля 2021

Это страница факультатива «Python для сбора и анализа данных», читаемого в МИЭФ в 2020/2021 учебном году.

Лекции и семинары ведет: Тамбовцева Алла Андреевна

Правила игры

  • Формула оценки: 0.4 * ДЗ + 0.2 * Онлайн + 0.4 * Проект.
  • Сдача домашних заданий с опозданием допускается, но со штрафом: за задержку в пределах часа – 15% от полученной оценки, в пределах суток – 30%, в пределах двух дней – 50%.
  • Курс читается с использованием онлайн-курсов на платформе DataCamp. Бесплатный доступ к платформе студентам предоставляется.

Программное обеспечение

Перед занятиями необходимо установить дистрибутив Anaconda (скачать можно здесь), который включает в себя интерпретатор языка Python, библиотеки для обработки, анализа и визуализации данных, а также среду для работы Jupyter Notebook. Также есть возможность работать в Jupyter Notebook онлайн, используя ресурс Google Colab (для создания и редактирования файлов нужен аккаунт Gmail). Но в долгосрочной перспективе предпочтительнее установить Anaconda.

Материалы занятий

10 февраля [Видеозапись]

Тема 1. Введение в Python и Jupyter Notebook

Тема 2. Типы данных в Python. Ввод и вывод. Форматирование строк.

  • Типы переменных, ввод и вывод в Python (intro-types.ipynb). Форматирование строк (str-formatting.ipynb). Pythontutor: ввод и вывод.
  • Семинар 1: ввод-вывод и приведение типов (icef-seminar01.ipynb), решения (icef-seminar01-solutions.ipynb).


Дополнительные материалы

Библиотека SymPy для символьных вычислений

Введение в SymPy: часть 1 (sympy-1.ipynb). Введение в SymPy: часть 2 (sympy-2.ipynb). Задачи по SymPy (sympy-problems.ipynb). Официальная документация SymPy.

Работа с текстом в Python

Библиотека pymorphy2 (морфологический анализатор). Библиотека pymystem3 (предобработка текста). Тьюториал для построения облака слов (word cloud).