Наука о данных: различия между версиями

Материал из MathINFO
Перейти к навигации Перейти к поиску
(не показано 9 промежуточных версий этого же участника)
Строка 202: Строка 202:
 
| [https://gist.github.com/380d90a1fb37e5adf3baded61deea651 ноутбук с занятия]
 
| [https://gist.github.com/380d90a1fb37e5adf3baded61deea651 ноутбук с занятия]
 
| [https://youtu.be/BHSvg7eBUJ8 видео]
 
| [https://youtu.be/BHSvg7eBUJ8 видео]
 +
|
 
|
 
|
 
|-
 
|-
Строка 209: Строка 210:
 
|
 
|
 
| [https://youtu.be/y1agYkip1VE видео]
 
| [https://youtu.be/y1agYkip1VE видео]
 +
|
 
|
 
|
 
|-
 
|-
Строка 216: Строка 218:
 
| [https://gist.github.com/85cae6e7ab14b3753fb764a42f82f9e3 ноутбук с занятия]
 
| [https://gist.github.com/85cae6e7ab14b3753fb764a42f82f9e3 ноутбук с занятия]
 
| [https://youtu.be/GBhvOxKB_xU видео]
 
| [https://youtu.be/GBhvOxKB_xU видео]
 +
|
 
|
 
|
 
|-
 
|-
Строка 224: Строка 227:
 
| [https://youtu.be/hd61tvkzx8E видео]
 
| [https://youtu.be/hd61tvkzx8E видео]
 
|
 
|
 +
| [http://nbviewer.jupyter.org/url/python.math-hse.info/static/assignments_release/nes-datascience2021/ps12/ps12.ipynb ДЗ№12]
 
|-
 
|-
 
| 29
 
| 29
Строка 230: Строка 234:
 
| [https://rpubs.com/ilyaschurov/intro-to-tidyverse-2021 ноутбук с занятия]
 
| [https://rpubs.com/ilyaschurov/intro-to-tidyverse-2021 ноутбук с занятия]
 
| [https://youtu.be/g9mx9LuXiGc видео]
 
| [https://youtu.be/g9mx9LuXiGc видео]
 +
|
 
|
 
|
 
|-
 
|-
Строка 235: Строка 240:
 
| 12 мая
 
| 12 мая
 
| Командная строка и unix shell
 
| Командная строка и unix shell
|  
+
| [https://colab.research.google.com/drive/1oJdvDYHyXOI4zQonej9mMeTf-_b79_BH?usp=sharing ноутбук с занятия]
 
| [https://youtu.be/aGKBi9w4F0A видео]
 
| [https://youtu.be/aGKBi9w4F0A видео]
 +
|
 +
|
 +
|-
 +
| 31
 +
| 18 мая
 +
| Язык Julia: введение
 +
| [https://gist.github.com/a1f77184963c582364247c3ad2791452 ноутбук с занятия]
 +
| [https://youtu.be/YIf5csEDdEQ видео]
 +
|
 +
|
 +
|-
 +
| 32
 +
| 19 мая
 +
| Язык Julia: продолжение
 +
| [https://gist.github.com/d5d858a1759bf6c346e487384f426dee ноутбук с занятия]
 +
| [https://youtu.be/_cSsGxrDrFc видео]
 +
|
 
|
 
|
 
|}
 
|}
Строка 242: Строка 264:
 
== Дополнительные материалы ==
 
== Дополнительные материалы ==
 
* [https://youtu.be/67JVwpnYx-A Видео консультации по R] (2020-01-21)
 
* [https://youtu.be/67JVwpnYx-A Видео консультации по R] (2020-01-21)
 +
 +
== Итоговый проект ==
 +
* [[/Итоговые проекты|Правила выполнения]] — срок сдачи 12 июня, 23:00.
  
 
== Программное обеспечение ==  
 
== Программное обеспечение ==  

Версия 16:27, 8 июня 2021

  • Совместный бакалавриат ВШЭ-РЭШ, 2-й год обучения.
  • Курс ведёт Илья Щуров.

Материалы

# дата тема конспекты видео дополнительные материалы ДЗ
1 12 января Первое знакомство. Python как калькулятор конспект с комментариями (2015), ноутбук с занятия (2021) видео (2015), видео (2021) PT вычисления, визуализатор Python ДЗ№1
2 13 января Списки конспект с комментариями (2015) (мы прошли до раздела «цикл for», не включая его), split и join, сырой ноутбук с занятия (2021) видео (2015), видео (2021) PT списки
3 19 января Цикл for, списковые включения (list comprehensions) enumerate, zip (часть про словари можно пропустить), списковые включения (list comprehensions), сырой ноутбук с занятия видео PT цикл for ДЗ№2
4 20 января Проверка условий. Цикл while. конспект, ноутбук с занятия видео PT: проверка условий, цикл while
5 26 января Функции конспект, ноутбук с занятия видео PT: функции ДЗ№3
6 27 января Словари. Сортировка словари, сортировка, ноутбук с занятия видео PT: словари, Sorting howto (англ.)
7 2 февраля Лямбда функции, множества, строки. Работа с файлами ноутбук с занятия, работа с файлами видео ДЗ№4
8 3 февраля Объектно-ориентированное программирование ноутбук с занятия видео Классы в python - документация на английском
9 9 февраля ООП, наследование ноутбук с занятия видео Классы в python - документация на английском, твиттер-тред про Python (начало как раз про итераторы)
10 10 февраля numpy и немножко matplotlib конспект с комментариями про numpy, ноутбук с занятия видео numpy quickstart, pyplot tutorial, matplotlib gallery ДЗ№5
11 16 февраля Еще немного про numpy и математика в питоне ноутбук с занятия видео numpy quickstart, pyplot tutorial, matplotlib gallery
12 17 февраля Трехмерные графики, pandas конспект по pandas, ноутбук с занятия видео numpy broadcasting rules (англ.), pandas data structures ДЗ№6
13 24 февраля Продвинутый пандас ноутбук с занятия pandas data structures ДЗ№7
14 2 марта Пандас и погода Конспект, ноутбук с занятия видео мультииндексы (англ.)
15 3 марта Веб-скреппинг Конспект, ноутбук с занятия видео Оригинальная документация (англ.): requests BeautifulSoup. ДЗ№8
16 9 марта Больше веб-скрэппинга, Selenium Конспект, ноутбук с занятия видео неофициальная документация по Python-Selenium (её проще читать, чем официальную).
17 10 марта REST API: XML & JSON Конспект про XML, конспект про JSON, ноутбук с занятия видео Документация по API MediaWiki (движка Википедии): основная на английском, на русском, автогенерированная на английском, на русском, документация по nominatim (геокодинг), clearspending (данные о госзакупках) ДЗ№9
18 16 марта Библиотеки визуализации данных: matplotlib, seaborn, plotly. ноутбук с занятия видео документация plotly, seaborn.
19 17 марта Pycharm. Библиотека Streamlit демо—приложение видео pandas-datareader, streamlit
20 23 марта Github. Размещение веб-приложений в облаке Heroku. видео tutorial, которому мы (студенты прошлого года и, вероятно, вы тоже) следовали. /ДЗ№10 Срок сдачи: 11 апреля, 23:00.
21 24 марта Библиотека scrapy для продвинутого веб-скреппинга. Визуализация графов с помощью networkx и pyvis. скрэппер, визуализатор графа видео
22 7 апреля SQL ноутбук с занятия видео SQL Tutorial (W3Schools) — я в основном следовал этому тьюториалу, о логике SQL, о порядке операций подробно, SQLite Tutorial
23 13 апреля SQL, часть 2 ноутбук с занятия видео ДЗ№11
24 14 апреля SQLAlchemy. Регулярные выражения ноутбук с занятия видео подробный текст про регулярки, визуальный отладчик регулярных выражений
25 20 апреля Что такое машинное обучение ноутбук с занятия видео
26 21 апреля Электронные таблицы: продвинутое использование видео
27 27 апреля Геоданные в Python: geopandas и его друзья ноутбук с занятия видео
28 28 апреля Геоданные в Python: продолжение (и немножко символьной математики) ноутбук с занятия видео ДЗ№12
29 11 мая Современный R: экосистема tidyverse ноутбук с занятия видео
30 12 мая Командная строка и unix shell ноутбук с занятия видео
31 18 мая Язык Julia: введение ноутбук с занятия видео
32 19 мая Язык Julia: продолжение ноутбук с занятия видео

Дополнительные материалы

Итоговый проект

Программное обеспечение

Python

  • Anaconda.
  • Чтобы открыть ipynb-файл в Jupyter Notebook, проще всего его загрузить в рабочий каталог с помощью функции upload самого Jupyter Notebook. Аналогично, чтобы вытащить файл из Jupyter Notebook, можно использовать функцию Download → ipynb.