Наука о данных: различия между версиями

Материал из MathINFO
Перейти к навигации Перейти к поиску
(не показано 14 промежуточных версий 2 участников)
Строка 107: Строка 107:
 
|  
 
|  
 
| [https://pandas.pydata.org/pandas-docs/stable/user_guide/dsintro.html pandas data structures]
 
| [https://pandas.pydata.org/pandas-docs/stable/user_guide/dsintro.html pandas data structures]
|  
+
| [http://nbviewer.jupyter.org/url/python.math-hse.info/static/assignments_release/nes-datascience2021/ps07/ps07.ipynb ДЗ№7]
 
|-
 
|-
 
| 14
 
| 14
Строка 119: Строка 119:
 
| 15
 
| 15
 
| 3 марта
 
| 3 марта
| Веб-скрэппинг
+
| Веб-скреппинг
 
| [http://nbviewer.math-hse.info/github/ischurov/pythonhse/blob/master/Lecture%208.ipynb Конспект], [https://gist.github.com/ischurov/1ffb0b98c9f1654aa7c3e0e437d886e6 ноутбук с занятия]
 
| [http://nbviewer.math-hse.info/github/ischurov/pythonhse/blob/master/Lecture%208.ipynb Конспект], [https://gist.github.com/ischurov/1ffb0b98c9f1654aa7c3e0e437d886e6 ноутбук с занятия]
 
| [https://youtu.be/z191CcHj76o видео]
 
| [https://youtu.be/z191CcHj76o видео]
 
| Оригинальная документация (англ.): [http://docs.python-requests.org/en/latest/ requests] [http://www.crummy.com/software/BeautifulSoup/bs4/doc/ BeautifulSoup].
 
| Оригинальная документация (англ.): [http://docs.python-requests.org/en/latest/ requests] [http://www.crummy.com/software/BeautifulSoup/bs4/doc/ BeautifulSoup].
|  
+
| [http://nbviewer.jupyter.org/url/python.math-hse.info/static/assignments_release/nes-datascience2021/ps08/ps08.ipynb ДЗ№8]
 
|-
 
|-
 
| 16
 
| 16
Строка 139: Строка 139:
 
| [https://youtu.be/pdHTKNwIVv8 видео]
 
| [https://youtu.be/pdHTKNwIVv8 видео]
 
| Документация по API MediaWiki (движка Википедии): [https://www.mediawiki.org/wiki/API:Main_page основная на английском], [https://www.mediawiki.org/wiki/API:Main_page/ru на русском], [https://en.wikipedia.org/w/api.php автогенерированная на английском], [https://ru.wikipedia.org/w/api.php на русском], [https://nominatim.org/release-docs/latest/api/Overview/ документация по nominatim] (геокодинг), [https://github.com/clearspending/clearspending-examples/wiki clearspending] (данные о госзакупках)
 
| Документация по API MediaWiki (движка Википедии): [https://www.mediawiki.org/wiki/API:Main_page основная на английском], [https://www.mediawiki.org/wiki/API:Main_page/ru на русском], [https://en.wikipedia.org/w/api.php автогенерированная на английском], [https://ru.wikipedia.org/w/api.php на русском], [https://nominatim.org/release-docs/latest/api/Overview/ документация по nominatim] (геокодинг), [https://github.com/clearspending/clearspending-examples/wiki clearspending] (данные о госзакупках)
 +
| [http://nbviewer.jupyter.org/url/python.math-hse.info/static/assignments_release/nes-datascience2021/ps09/ps09.ipynb ДЗ№9]
 +
|-
 +
| 18
 +
| 16 марта
 +
| Библиотеки визуализации данных: matplotlib, seaborn, plotly.
 +
| [https://gist.github.com/55942ee4ed7269c32b50af8eccfc8a06 ноутбук с занятия]
 +
| [https://youtu.be/PY5NQr_awU4 видео]
 +
| [https://plotly.com/python/ документация plotly], [https://seaborn.pydata.org seaborn].
 +
|
 +
|-
 +
| 19
 +
| 17 марта
 +
| Pycharm. Библиотека Streamlit
 +
| [https://github.com/ischurov/streamlit-demo-2021 демо—приложение]
 +
| [https://youtu.be/QGfdMW1RPv8 видео]
 +
| [https://pandas-datareader.readthedocs.io/en/latest/ pandas-datareader], [https://docs.streamlit.io streamlit]
 +
|
 +
|-
 +
| 20
 +
| 23 марта
 +
| Github. Размещение веб-приложений в облаке Heroku.
 
|  
 
|  
 +
| [https://youtu.be/t-mw_efIG5w видео]
 +
| [https://gilberttanner.com/blog/deploying-your-streamlit-dashboard-with-heroku tutorial], которому мы (студенты прошлого года и, вероятно, вы тоже) следовали.
 +
| [[/ДЗ№10]] Срок сдачи: 11 апреля, 23:00.
 +
|-
 +
| 21
 +
| 24 марта
 +
| Библиотека scrapy для продвинутого веб-скреппинга. Визуализация графов с помощью networkx и pyvis.
 +
| [https://gist.github.com/ischurov/e68761c1034fed90145a5e39ccd45ebb скрэппер], [https://gist.github.com/ischurov/83c5568ec850482efa8f68fe5f2688eb визуализатор графа]
 +
| [https://youtu.be/Lutkyjc7rWc видео]
 +
|
 +
|
 +
|-
 +
| 22
 +
| 7 марта
 +
| SQL
 +
| [https://gist.github.com/ischurov/a40be845fa91da6b0bb4a26209636180 ноутбук с занятия]
 +
| [https://youtu.be/RxYyQGWrDow видео]
 +
| [https://www.w3schools.com/sql/ SQL Tutorial] (W3Schools) — я в основном следовал этому тьюториалу, [https://blog.jooq.org/2016/03/17/10-easy-steps-to-a-complete-understanding-of-sql/ о логике SQL], [https://blog.jooq.org/2016/12/09/a-beginners-guide-to-the-true-order-of-sql-operations/ о порядке операций] подробно, [http://www.sqlitetutorial.net SQLite Tutorial]
 +
|
 +
|-
 +
| 23
 +
| 13 марта
 +
| SQL, часть 2
 +
| [https://gist.github.com/ischurov/ebe633748900375348b301eb976d08b8 ноутбук с занятия]
 +
| [https://youtu.be/HvEBOBgITL0 видео]
 +
|
 +
| [https://nbviewer.jupyter.org/url/python.math-hse.info/static/assignments_release/nes-datascience2021/ps11/ps11.ipynb ДЗ№11]
 
|-
 
|-
 +
| 24
 +
| 14 марта
 +
| SQLAlchemy. Регулярные выражения
 +
| [https://gist.github.com/ischurov/ad210f6f13a7b81168d2915d379c9c37 ноутбук с занятия]
 +
| [https://youtu.be/t4IBnI9viBs видео]
 +
| [https://habr.com/ru/post/349860/ подробный текст про регулярки], [http://regex101.com визуальный отладчик регулярных выражений]
 +
|
 
|}
 
|}
  

Версия 22:34, 18 апреля 2021

  • Совместный бакалавриат ВШЭ-РЭШ, 2-й год обучения.
  • Курс ведёт Илья Щуров.

Материалы

# дата тема конспекты видео дополнительные материалы ДЗ
1 12 января Первое знакомство. Python как калькулятор конспект с комментариями (2015), ноутбук с занятия (2021) видео (2015), видео (2021) PT вычисления, визуализатор Python ДЗ№1
2 13 января Списки конспект с комментариями (2015) (мы прошли до раздела «цикл for», не включая его), split и join, сырой ноутбук с занятия (2021) видео (2015), видео (2021) PT списки
3 19 января Цикл for, списковые включения (list comprehensions) enumerate, zip (часть про словари можно пропустить), списковые включения (list comprehensions), сырой ноутбук с занятия видео PT цикл for ДЗ№2
4 20 января Проверка условий. Цикл while. конспект, ноутбук с занятия видео PT: проверка условий, цикл while
5 26 января Функции конспект, ноутбук с занятия видео PT: функции ДЗ№3
6 27 января Словари. Сортировка словари, сортировка, ноутбук с занятия видео PT: словари, Sorting howto (англ.)
7 2 февраля Лямбда функции, множества, строки. Работа с файлами ноутбук с занятия, работа с файлами видео ДЗ№4
8 3 февраля Объектно-ориентированное программирование ноутбук с занятия видео Классы в python - документация на английском
9 9 февраля ООП, наследование ноутбук с занятия видео Классы в python - документация на английском, твиттер-тред про Python (начало как раз про итераторы)
10 10 февраля numpy и немножко matplotlib конспект с комментариями про numpy, ноутбук с занятия видео numpy quickstart, pyplot tutorial, matplotlib gallery ДЗ№5
11 16 февраля Еще немного про numpy и математика в питоне ноутбук с занятия видео numpy quickstart, pyplot tutorial, matplotlib gallery
12 17 февраля Трехмерные графики, pandas конспект по pandas, ноутбук с занятия видео numpy broadcasting rules (англ.), pandas data structures ДЗ№6
13 24 февраля Продвинутый пандас ноутбук с занятия pandas data structures ДЗ№7
14 2 марта Пандас и погода Конспект, ноутбук с занятия видео мультииндексы (англ.)
15 3 марта Веб-скреппинг Конспект, ноутбук с занятия видео Оригинальная документация (англ.): requests BeautifulSoup. ДЗ№8
16 9 марта Больше веб-скрэппинга, Selenium Конспект, ноутбук с занятия видео неофициальная документация по Python-Selenium (её проще читать, чем официальную).
17 10 марта REST API: XML & JSON Конспект про XML, конспект про JSON, ноутбук с занятия видео Документация по API MediaWiki (движка Википедии): основная на английском, на русском, автогенерированная на английском, на русском, документация по nominatim (геокодинг), clearspending (данные о госзакупках) ДЗ№9
18 16 марта Библиотеки визуализации данных: matplotlib, seaborn, plotly. ноутбук с занятия видео документация plotly, seaborn.
19 17 марта Pycharm. Библиотека Streamlit демо—приложение видео pandas-datareader, streamlit
20 23 марта Github. Размещение веб-приложений в облаке Heroku. видео tutorial, которому мы (студенты прошлого года и, вероятно, вы тоже) следовали. /ДЗ№10 Срок сдачи: 11 апреля, 23:00.
21 24 марта Библиотека scrapy для продвинутого веб-скреппинга. Визуализация графов с помощью networkx и pyvis. скрэппер, визуализатор графа видео
22 7 марта SQL ноутбук с занятия видео SQL Tutorial (W3Schools) — я в основном следовал этому тьюториалу, о логике SQL, о порядке операций подробно, SQLite Tutorial
23 13 марта SQL, часть 2 ноутбук с занятия видео ДЗ№11
24 14 марта SQLAlchemy. Регулярные выражения ноутбук с занятия видео подробный текст про регулярки, визуальный отладчик регулярных выражений

Дополнительные материалы

Программное обеспечение

Python

  • Anaconda.
  • Чтобы открыть ipynb-файл в Jupyter Notebook, проще всего его загрузить в рабочий каталог с помощью функции upload самого Jupyter Notebook. Аналогично, чтобы вытащить файл из Jupyter Notebook, можно использовать функцию Download → ipynb.