Python для сбора и анализа данных: различия между версиями

Материал из MathINFO
Перейти к навигации Перейти к поиску
Строка 55: Строка 55:
  
 
* [https://www.dropbox.com/scl/fo/oygbnqh4xboihlehvel9f/h?dl=0&rlkey=q7m7yck0ep8bi5a0v84uh7o5m Видеозапись] занятия, [https://www.dropbox.com/scl/fo/m385kro1mysmblp6texel/h?dl=0&rlkey=g6q9730tk85c4uexdrdp47ip3 сырые] ipynb-файлы с занятия.
 
* [https://www.dropbox.com/scl/fo/oygbnqh4xboihlehvel9f/h?dl=0&rlkey=q7m7yck0ep8bi5a0v84uh7o5m Видеозапись] занятия, [https://www.dropbox.com/scl/fo/m385kro1mysmblp6texel/h?dl=0&rlkey=g6q9730tk85c4uexdrdp47ip3 сырые] ipynb-файлы с занятия.
* Альтернативы циклу for (читать, ipynb). Кортежи и функция zip() ([https://github.com/allatambov/PyICEF-2023/blob/main/tuples-zip.ipynb читать], [ipynb]).
+
* Альтернативы циклу for (читать, ipynb). Кортежи и функция zip() ([https://github.com/allatambov/PyICEF-2023/blob/main/tuples-zip.ipynb читать], [https://www.dropbox.com/s/rjbxjwrnsraucec/tuples-zip.ipynb?dl=0 ipynb]).
 
* Методы на строках ([https://github.com/allatambov/PyICEF-2023/blob/main/str-methods.ipynb читать], [https://www.dropbox.com/s/cefimocpfa3d91y/str-methods.ipynb?dl=0 ipynb]). Чтение и запись txt-файлов ([https://github.com/allatambov/PyICEF-2023/blob/main/txt-work.ipynb читать], [https://www.dropbox.com/s/he1xhc1gtg5gaq4/txt-work.ipynb?dl=0 ipynb]), файл [https://www.dropbox.com/s/6m331ceu62sgtsn/intro.txt?dl=0 intro.txt].
 
* Методы на строках ([https://github.com/allatambov/PyICEF-2023/blob/main/str-methods.ipynb читать], [https://www.dropbox.com/s/cefimocpfa3d91y/str-methods.ipynb?dl=0 ipynb]). Чтение и запись txt-файлов ([https://github.com/allatambov/PyICEF-2023/blob/main/txt-work.ipynb читать], [https://www.dropbox.com/s/he1xhc1gtg5gaq4/txt-work.ipynb?dl=0 ipynb]), файл [https://www.dropbox.com/s/6m331ceu62sgtsn/intro.txt?dl=0 intro.txt].
 
* Практикум 3 ([https://github.com/allatambov/PyICEF-2023/blob/main/icef-problems03.ipynb читать], [https://www.dropbox.com/s/vsp4umzi1febvmu/icef-problems03.ipynb?dl=0 ipynb]), решения задач ([https://nbviewer.org/github/allatambov/PyICEF-2023/blob/main/icef-problems03-solutions.ipynb читать], [https://www.dropbox.com/s/g5yzc0ruvyhfs5i/icef-problems03-solutions.ipynb?dl=0 ipynb]).
 
* Практикум 3 ([https://github.com/allatambov/PyICEF-2023/blob/main/icef-problems03.ipynb читать], [https://www.dropbox.com/s/vsp4umzi1febvmu/icef-problems03.ipynb?dl=0 ipynb]), решения задач ([https://nbviewer.org/github/allatambov/PyICEF-2023/blob/main/icef-problems03-solutions.ipynb читать], [https://www.dropbox.com/s/g5yzc0ruvyhfs5i/icef-problems03-solutions.ipynb?dl=0 ipynb]).

Версия 02:56, 27 марта 2023

Это страница факультатива «Python для сбора и анализа данных», читаемого в МИЭФ в 2022/2023 учебном году.

Авторы курса: Щуров Илья Валерьевич, Тамбовцева Алла Андреевна.

Лекции и семинары ведет: Тамбовцева Алла Андреевна.

Правила игры

  • Формула оценки: 0.4 * ДЗ + 0.2 * Тест + 0.4 * Проект.
  • Сдача домашних заданий с опозданием допускается, но со штрафом: за задержку в пределах часа – 15% от полученной оценки, в пределах суток – 30%, в пределах двух дней – 50%.

Программное обеспечение

Перед занятиями необходимо установить дистрибутив Anaconda (скачать можно здесь), который включает в себя интерпретатор языка Python, библиотеки для обработки, анализа и визуализации данных, а также среду для работы Jupyter Notebook. Также есть возможность работать в Jupyter Notebook онлайн, используя ресурс Google Colab (для создания и редактирования файлов нужен аккаунт Gmail). Но в долгосрочной перспективе предпочтительнее установить Anaconda.

Материалы занятий

Занятие 00. Презентация факультатива и знакомство с Jupyter Notebook (1 февраля)

Дополнительно:

Занятие 01. Вычисления и переменные. Типы данных. Ввод и вывод. (14 и 16 февраля)

Дополнительно:

  • Вычисления с заданной точностью с модулем decimal, официальная документация decimal.
  • Вычисления с обыкновенными дробями с модулем fractions, официальная документация fractions.
  • Символьные вычисления с sympy: часть 1 (sympy-1.ipynb), часть 2 (sympy-2.ipynb), официальная документация sympy.
  • Стандарты оформления кода Python: PEP8, проверка соответствия кода стандартам: PEP8 online check.

Занятие 02. Списки и цикл for. Методы .split() и .join() (21 и 27 февраля)

Дополнительно:

Занятие 03. Методы на строках. Чтение и запись txt-файлов. (28 февраля и 2 марта)

Дополнительно:

  • Документация библиотеки pymorphy2 (морфологический анализатор).
  • Тьюториал по построению облака слов с библиотекой wordcloud.
  • Библиотека dostoevsky для анализа тональности текстов.

Занятие 04. Условные конструкции и цикл while. (7 и 9 марта)

Занятие 05. Множества и словари. Знакомство с API (14 и 16 марта)

Занятие 06. Функции. Массивы и датафреймы pandas (21 и 23 марта)

Домашние задания

Домашнее задание Дедлайн
Домашнее задание 1 27.02 23:59
Домашнее задание 2 09.03 23:59
Домашнее задание 3 16.03 23:59
Домашнее задание 4, pesem.txt 05.04 23:59
Домашнее задание 5
Домашнее задание 6
Домашнее задание 7
Домашнее задание 8