Наука о данных: различия между версиями

Материал из MathINFO
Перейти к навигации Перейти к поиску
Строка 88: Строка 88:
 
| [http://pandas.pydata.org/pandas-docs/stable/10min.html 10-минутное введение (обзор возможностей)], [http://pandas.pydata.org/pandas-docs/stable/tutorials.html#pandas-cookbook pandas-cookbook], [http://pandas.pydata.org/pandas-docs/stable/indexing.html индексация и выбор данных (подробно)]
 
| [http://pandas.pydata.org/pandas-docs/stable/10min.html 10-минутное введение (обзор возможностей)], [http://pandas.pydata.org/pandas-docs/stable/tutorials.html#pandas-cookbook pandas-cookbook], [http://pandas.pydata.org/pandas-docs/stable/indexing.html индексация и выбор данных (подробно)]
 
| [http://nbviewer.jupyter.org/url/python.math-hse.info/static/assignments_release/nes-datascience2020/ps06/ps06.ipynb ДЗ№6]
 
| [http://nbviewer.jupyter.org/url/python.math-hse.info/static/assignments_release/nes-datascience2020/ps06/ps06.ipynb ДЗ№6]
 +
|-
 +
| 28 февраля
 +
| Ещё о pandas (и немного о глобальном потеплении).
 +
| [http://nbviewer.math-hse.info/github/ischurov/pythonhse/blob/master/Lecture%2013.ipynb конспект], [https://nbviewer.jupyter.org/gist/f6d046a76e972320469e9dcb677cfdb0 сырой ноутбук с занятия]
 +
| Официальная документация pandas: [https://pandas.pydata.org/pandas-docs/stable/user_guide/advanced.html мультииндексы]
 +
|
 +
|rowspan=3| [http://nbviewer.jupyter.org/url/python.math-hse.info/static/assignments_release/nes-datascience2020/ps07/ps07.ipynb ДЗ№7]
 +
|-
 +
| 3 марта
 +
| Введение в веб-скреппинг, библиотека <code>BeautifulSoup</code> (<code>bs4</code>)
 +
| [http://nbviewer.math-hse.info/github/ischurov/pythonhse/blob/master/Lecture%208.ipynb конспект],  [https://nbviewer.jupyter.org/gist/ischurov/fce1f34ba0b189f9f7a0b8743900f161 сырой ноутбук с занятия]
 +
| [http://www.youtube.com/watch?v=3nPksaHTMGI видео]
 +
| Оригинальная документация (англ.): [http://docs.python-requests.org/en/latest/ requests] [http://www.crummy.com/software/BeautifulSoup/bs4/doc/ BeautifulSoup].
 +
|-
 +
| 6 марта
 +
| Больше веб-скреппинга
 +
| [https://nbviewer.jupyter.org/gist/ischurov/89f86ed01822ea9504ad234688218601 сырой ноутбук с занятия]
 +
|
 +
|
 
|}
 
|}
  

Версия 18:52, 9 марта 2020

  • Курс ведёт Илья Щуров.

Материалы

дата тема конспекты видео дополнительные материалы ДЗ
10 января Первое знакомство. Python как калькулятор конспект с комментариями, сырой ноутбук с занятия (без комментариев) видео PT вычисления, визуализатор Python ДЗ№1
14 января Списки конспект с комментариями (мы прошли до раздела «Присвоение и копирование списков», не включая его), split и join, сырой ноутбук с занятия видео PT списки
21 января Списки и цикл for конспект с комментариями (начиная с раздела « Присвоение и копирование списков»), enumerate, zip (часть про словари можно пропустить), сырой ноутбук с занятия. видео PT цикл for ДЗ№2
24 января Проверка условий. Цикл while. проверка условий, сырой ноутбук с занятия проверка условий PT: проверка условий, цикл while
28 января Функции. Словари функции, словари, сырой ноутбук с занятия функции, словари PT: функции, словари ДЗ№3
31 января Ещё о словарях. Множества. Списковые включения (и не только). Сортировка словари и списковые включения, множества, сортировка, сырой ноутбук с занятия словари, сортировка Sorting howto (англ.)
4 февраля Ещё о сортировке. kwargs. lambda-функции. Чтение файлов работа с файлами, сырой ноутбук с занятия файлы
7 февраля Запись файлов. Объектно-ориентированное программирование работа с файлами, сырой ноутбук с занятия файлы классы в Python (англ., официальная документация) ДЗ№4
11 февраля Наследование. Итераторы и генераторы сырой конспект классы в Python (англ., официальная документация), твиттер-тред про Python (начало как раз про итераторы)
14 февраля Библиотека numpy и немножко matplotlib конспект с комментариями про numpy, сырой ноутбук numpy numpy quickstart, pyplot tutorial, matplotlib gallery ДЗ№5
18 февраля Ещё о numpy и немножко pandas сырой ноутбук с занятия numpy broadcasting rules (англ.), pandas data structures (мы обсуждали pd.Series)
21 февраля Библиотека pandas pandas и датафреймы: конспект по базовым возможностям pandas, сырой ноутбук с занятия pandas 10-минутное введение (обзор возможностей), pandas-cookbook, индексация и выбор данных (подробно) ДЗ№6
28 февраля Ещё о pandas (и немного о глобальном потеплении). конспект, сырой ноутбук с занятия Официальная документация pandas: мультииндексы ДЗ№7
3 марта Введение в веб-скреппинг, библиотека BeautifulSoup (bs4) конспект, сырой ноутбук с занятия видео Оригинальная документация (англ.): requests BeautifulSoup.
6 марта Больше веб-скреппинга сырой ноутбук с занятия

Программное обеспечение

  • Anaconda — вам нужна версия с Python 3.7.
  • Чтобы открыть ipynb-файл в Jupyter Notebook, проще всего его загрузить в рабочий каталог с помощью функции upload самого Jupyter Notebook. Аналогично, чтобы вытащить файл из Jupyter Notebook, можно использовать функцию Download → ipynb.