Наука о данных: различия между версиями
Перейти к навигации
Перейти к поиску
(не показано 9 промежуточных версий этого же участника) | |||
Строка 202: | Строка 202: | ||
| [https://gist.github.com/380d90a1fb37e5adf3baded61deea651 ноутбук с занятия] | | [https://gist.github.com/380d90a1fb37e5adf3baded61deea651 ноутбук с занятия] | ||
| [https://youtu.be/BHSvg7eBUJ8 видео] | | [https://youtu.be/BHSvg7eBUJ8 видео] | ||
+ | | | ||
| | | | ||
|- | |- | ||
Строка 209: | Строка 210: | ||
| | | | ||
| [https://youtu.be/y1agYkip1VE видео] | | [https://youtu.be/y1agYkip1VE видео] | ||
+ | | | ||
| | | | ||
|- | |- | ||
Строка 216: | Строка 218: | ||
| [https://gist.github.com/85cae6e7ab14b3753fb764a42f82f9e3 ноутбук с занятия] | | [https://gist.github.com/85cae6e7ab14b3753fb764a42f82f9e3 ноутбук с занятия] | ||
| [https://youtu.be/GBhvOxKB_xU видео] | | [https://youtu.be/GBhvOxKB_xU видео] | ||
+ | | | ||
| | | | ||
|- | |- | ||
Строка 224: | Строка 227: | ||
| [https://youtu.be/hd61tvkzx8E видео] | | [https://youtu.be/hd61tvkzx8E видео] | ||
| | | | ||
+ | | [http://nbviewer.jupyter.org/url/python.math-hse.info/static/assignments_release/nes-datascience2021/ps12/ps12.ipynb ДЗ№12] | ||
|- | |- | ||
| 29 | | 29 | ||
Строка 230: | Строка 234: | ||
| [https://rpubs.com/ilyaschurov/intro-to-tidyverse-2021 ноутбук с занятия] | | [https://rpubs.com/ilyaschurov/intro-to-tidyverse-2021 ноутбук с занятия] | ||
| [https://youtu.be/g9mx9LuXiGc видео] | | [https://youtu.be/g9mx9LuXiGc видео] | ||
+ | | | ||
| | | | ||
|- | |- | ||
Строка 235: | Строка 240: | ||
| 12 мая | | 12 мая | ||
| Командная строка и unix shell | | Командная строка и unix shell | ||
− | | | + | | [https://colab.research.google.com/drive/1oJdvDYHyXOI4zQonej9mMeTf-_b79_BH?usp=sharing ноутбук с занятия] |
| [https://youtu.be/aGKBi9w4F0A видео] | | [https://youtu.be/aGKBi9w4F0A видео] | ||
+ | | | ||
+ | | | ||
+ | |- | ||
+ | | 31 | ||
+ | | 18 мая | ||
+ | | Язык Julia: введение | ||
+ | | [https://gist.github.com/a1f77184963c582364247c3ad2791452 ноутбук с занятия] | ||
+ | | [https://youtu.be/YIf5csEDdEQ видео] | ||
+ | | | ||
+ | | | ||
+ | |- | ||
+ | | 32 | ||
+ | | 19 мая | ||
+ | | Язык Julia: продолжение | ||
+ | | [https://gist.github.com/d5d858a1759bf6c346e487384f426dee ноутбук с занятия] | ||
+ | | [https://youtu.be/_cSsGxrDrFc видео] | ||
+ | | | ||
| | | | ||
|} | |} | ||
Строка 242: | Строка 264: | ||
== Дополнительные материалы == | == Дополнительные материалы == | ||
* [https://youtu.be/67JVwpnYx-A Видео консультации по R] (2020-01-21) | * [https://youtu.be/67JVwpnYx-A Видео консультации по R] (2020-01-21) | ||
+ | |||
+ | == Итоговый проект == | ||
+ | * [[/Итоговые проекты|Правила выполнения]] — срок сдачи 12 июня, 23:00. | ||
== Программное обеспечение == | == Программное обеспечение == |
Версия 16:27, 8 июня 2021
- Совместный бакалавриат ВШЭ-РЭШ, 2-й год обучения.
- Курс ведёт Илья Щуров.
Содержание
Материалы
# | дата | тема | конспекты | видео | дополнительные материалы | ДЗ |
---|---|---|---|---|---|---|
1 | 12 января | Первое знакомство. Python как калькулятор | конспект с комментариями (2015), ноутбук с занятия (2021) | видео (2015), видео (2021) | PT вычисления, визуализатор Python | ДЗ№1 |
2 | 13 января | Списки | конспект с комментариями (2015) (мы прошли до раздела «цикл for», не включая его), split и join, сырой ноутбук с занятия (2021) | видео (2015), видео (2021) | PT списки | |
3 | 19 января | Цикл for , списковые включения (list comprehensions)
|
enumerate, zip (часть про словари можно пропустить), списковые включения (list comprehensions), сырой ноутбук с занятия | видео | PT цикл for | ДЗ№2 |
4 | 20 января | Проверка условий. Цикл while .
|
конспект, ноутбук с занятия | видео | PT: проверка условий, цикл while | |
5 | 26 января | Функции | конспект, ноутбук с занятия | видео | PT: функции | ДЗ№3 |
6 | 27 января | Словари. Сортировка | словари, сортировка, ноутбук с занятия | видео | PT: словари, Sorting howto (англ.) | |
7 | 2 февраля | Лямбда функции, множества, строки. Работа с файлами | ноутбук с занятия, работа с файлами | видео | ДЗ№4 | |
8 | 3 февраля | Объектно-ориентированное программирование | ноутбук с занятия | видео | Классы в python - документация на английском | |
9 | 9 февраля | ООП, наследование | ноутбук с занятия | видео | Классы в python - документация на английском, твиттер-тред про Python (начало как раз про итераторы) | |
10 | 10 февраля | numpy |
конспект с комментариями про numpy, ноутбук с занятия | видео | numpy quickstart, pyplot tutorial, matplotlib gallery | ДЗ№5 |
11 | 16 февраля | Еще немного про numpy и математика в питоне | ноутбук с занятия | видео | numpy quickstart, pyplot tutorial, matplotlib gallery | |
12 | 17 февраля | Трехмерные графики, pandas | конспект по pandas, ноутбук с занятия | видео | numpy broadcasting rules (англ.), pandas data structures | ДЗ№6 |
13 | 24 февраля | Продвинутый пандас | ноутбук с занятия | pandas data structures | ДЗ№7 | |
14 | 2 марта | Пандас и погода | Конспект, ноутбук с занятия | видео | мультииндексы (англ.) | |
15 | 3 марта | Веб-скреппинг | Конспект, ноутбук с занятия | видео | Оригинальная документация (англ.): requests BeautifulSoup. | ДЗ№8 |
16 | 9 марта | Больше веб-скрэппинга, Selenium | Конспект, ноутбук с занятия | видео | неофициальная документация по Python-Selenium (её проще читать, чем официальную). | |
17 | 10 марта | REST API: XML & JSON | Конспект про XML, конспект про JSON, ноутбук с занятия | видео | Документация по API MediaWiki (движка Википедии): основная на английском, на русском, автогенерированная на английском, на русском, документация по nominatim (геокодинг), clearspending (данные о госзакупках) | ДЗ№9 |
18 | 16 марта | Библиотеки визуализации данных: matplotlib, seaborn, plotly. | ноутбук с занятия | видео | документация plotly, seaborn. | |
19 | 17 марта | Pycharm. Библиотека Streamlit | демо—приложение | видео | pandas-datareader, streamlit | |
20 | 23 марта | Github. Размещение веб-приложений в облаке Heroku. | видео | tutorial, которому мы (студенты прошлого года и, вероятно, вы тоже) следовали. | /ДЗ№10 Срок сдачи: 11 апреля, 23:00. | |
21 | 24 марта | Библиотека scrapy для продвинутого веб-скреппинга. Визуализация графов с помощью networkx и pyvis. | скрэппер, визуализатор графа | видео | ||
22 | 7 апреля | SQL | ноутбук с занятия | видео | SQL Tutorial (W3Schools) — я в основном следовал этому тьюториалу, о логике SQL, о порядке операций подробно, SQLite Tutorial | |
23 | 13 апреля | SQL, часть 2 | ноутбук с занятия | видео | ДЗ№11 | |
24 | 14 апреля | SQLAlchemy. Регулярные выражения | ноутбук с занятия | видео | подробный текст про регулярки, визуальный отладчик регулярных выражений | |
25 | 20 апреля | Что такое машинное обучение | ноутбук с занятия | видео | ||
26 | 21 апреля | Электронные таблицы: продвинутое использование | видео | |||
27 | 27 апреля | Геоданные в Python: geopandas и его друзья | ноутбук с занятия | видео | ||
28 | 28 апреля | Геоданные в Python: продолжение (и немножко символьной математики) | ноутбук с занятия | видео | ДЗ№12 | |
29 | 11 мая | Современный R: экосистема tidyverse | ноутбук с занятия | видео | ||
30 | 12 мая | Командная строка и unix shell | ноутбук с занятия | видео | ||
31 | 18 мая | Язык Julia: введение | ноутбук с занятия | видео | ||
32 | 19 мая | Язык Julia: продолжение | ноутбук с занятия | видео |
Дополнительные материалы
- Видео консультации по R (2020-01-21)
Итоговый проект
- Правила выполнения — срок сдачи 12 июня, 23:00.
Программное обеспечение
Python
- Anaconda.
- Чтобы открыть ipynb-файл в Jupyter Notebook, проще всего его загрузить в рабочий каталог с помощью функции upload самого Jupyter Notebook. Аналогично, чтобы вытащить файл из Jupyter Notebook, можно использовать функцию Download → ipynb.