Наука о данных
Перейти к навигации
Перейти к поиску
- Совместный бакалавриат ВШЭ-РЭШ, 2-й год обучения.
- Курс ведёт Илья Щуров.
Содержание
Материалы
# | дата | тема | конспекты | видео | дополнительные материалы | ДЗ |
---|---|---|---|---|---|---|
1 | 12 января | Первое знакомство. Python как калькулятор | конспект с комментариями (2015), ноутбук с занятия (2021) | видео (2015), видео (2021) | PT вычисления, визуализатор Python | ДЗ№1 |
2 | 13 января | Списки | конспект с комментариями (2015) (мы прошли до раздела «цикл for», не включая его), split и join, сырой ноутбук с занятия (2021) | видео (2015), видео (2021) | PT списки | |
3 | 19 января | Цикл for , списковые включения (list comprehensions)
|
enumerate, zip (часть про словари можно пропустить), списковые включения (list comprehensions), сырой ноутбук с занятия | видео | PT цикл for | ДЗ№2 |
4 | 20 января | Проверка условий. Цикл while .
|
конспект, ноутбук с занятия | видео | PT: проверка условий, цикл while | |
5 | 26 января | Функции | конспект, ноутбук с занятия | видео | PT: функции | ДЗ№3 |
6 | 27 января | Словари. Сортировка | словари, сортировка, ноутбук с занятия | видео | PT: словари, Sorting howto (англ.) | |
7 | 2 февраля | Лямбда функции, множества, строки. Работа с файлами | ноутбук с занятия, работа с файлами | видео | ДЗ№4 | |
8 | 3 февраля | Объектно-ориентированное программирование | ноутбук с занятия | видео | Классы в python - документация на английском | |
9 | 9 февраля | ООП, наследование | ноутбук с занятия | видео | Классы в python - документация на английском, твиттер-тред про Python (начало как раз про итераторы) | |
10 | 10 февраля | numpy |
конспект с комментариями про numpy, ноутбук с занятия | видео | numpy quickstart, pyplot tutorial, matplotlib gallery | ДЗ№5 |
11 | 16 февраля | Еще немного про numpy и математика в питоне | ноутбук с занятия | видео | numpy quickstart, pyplot tutorial, matplotlib gallery | |
12 | 17 февраля | Трехмерные графики, pandas | конспект по pandas, ноутбук с занятия | видео | numpy broadcasting rules (англ.), pandas data structures | ДЗ№6 |
13 | 24 февраля | Продвинутый пандас | ноутбук с занятия | pandas data structures | ДЗ№7 | |
14 | 2 марта | Пандас и погода | Конспект, ноутбук с занятия | видео | мультииндексы (англ.) | |
15 | 3 марта | Веб-скреппинг | Конспект, ноутбук с занятия | видео | Оригинальная документация (англ.): requests BeautifulSoup. | ДЗ№8 |
16 | 9 марта | Больше веб-скрэппинга, Selenium | Конспект, ноутбук с занятия | видео | неофициальная документация по Python-Selenium (её проще читать, чем официальную). | |
17 | 10 марта | REST API: XML & JSON | Конспект про XML, конспект про JSON, ноутбук с занятия | видео | Документация по API MediaWiki (движка Википедии): основная на английском, на русском, автогенерированная на английском, на русском, документация по nominatim (геокодинг), clearspending (данные о госзакупках) | ДЗ№9 |
18 | 16 марта | Библиотеки визуализации данных: matplotlib, seaborn, plotly. | ноутбук с занятия | видео | документация plotly, seaborn. | |
19 | 17 марта | Pycharm. Библиотека Streamlit | демо—приложение | видео | pandas-datareader, streamlit | |
20 | 23 марта | Github. Размещение веб-приложений в облаке Heroku. | видео | tutorial, которому мы (студенты прошлого года и, вероятно, вы тоже) следовали. | /ДЗ№10 Срок сдачи: 11 апреля, 23:00. | |
21 | 24 марта | Библиотека scrapy для продвинутого веб-скреппинга. Визуализация графов с помощью networkx и pyvis. | скрэппер, визуализатор графа | видео | ||
22 | 7 апреля | SQL | ноутбук с занятия | видео | SQL Tutorial (W3Schools) — я в основном следовал этому тьюториалу, о логике SQL, о порядке операций подробно, SQLite Tutorial | |
23 | 13 апреля | SQL, часть 2 | ноутбук с занятия | видео | ДЗ№11 | |
24 | 14 апреля | SQLAlchemy. Регулярные выражения | ноутбук с занятия | видео | подробный текст про регулярки, визуальный отладчик регулярных выражений | |
25 | 20 апреля | Что такое машинное обучение | ноутбук с занятия | видео | ||
26 | 21 апреля | Электронные таблицы: продвинутое использование | видео | |||
27 | 27 апреля | Геоданные в Python: geopandas и его друзья | ноутбук с занятия | видео | ||
28 | 28 апреля | Геоданные в Python: продолжение (и немножко символьной математики) | ноутбук с занятия | видео | ДЗ№12 | |
29 | 11 мая | Современный R: экосистема tidyverse | ноутбук с занятия | видео | ||
30 | 12 мая | Командная строка и unix shell | ноутбук с занятия | видео | ||
31 | 18 мая | Язык Julia: введение | ноутбук с занятия | видео | ||
32 | 19 мая | Язык Julia: продолжение | ноутбук с занятия | видео |
Дополнительные материалы
- Видео консультации по R (2020-01-21)
Итоговый проект
- Правила выполнения — срок сдачи 12 июня, 23:00.
Программное обеспечение
Python
- Anaconda.
- Чтобы открыть ipynb-файл в Jupyter Notebook, проще всего его загрузить в рабочий каталог с помощью функции upload самого Jupyter Notebook. Аналогично, чтобы вытащить файл из Jupyter Notebook, можно использовать функцию Download → ipynb.