Web-scraping: сбор данных из баз данных и интернет-источников: различия между версиями
Строка 6: | Строка 6: | ||
* Формула оценки: '''0.6 × ДЗ + 0.4 × Экзамен'''. | * Формула оценки: '''0.6 × ДЗ + 0.4 × Экзамен'''. | ||
+ | * Домашние задания, сданные после срока, оцениваются с использованием понижающих коэффициентов: опоздание в пределах часа – штраф 10% от полученной оценки, в пределах суток – штраф 30%, в пределах недели – штраф 70%. Домашние задания, сданные через неделю после указанного срока и позже, не принимаются и не оцениваются. | ||
* [https://www.hse.ru/edu/courses/470884252 Программа] курса. | * [https://www.hse.ru/edu/courses/470884252 Программа] курса. | ||
+ | |||
+ | ==Среда для работы== | ||
+ | |||
+ | На данном курсе мы используем язык Python версии не ниже 3.5 и среду Jupyter Notebook. Скачать дистрибутив Anaconda, который установит интерпретатор Python, среду Jupyter Notebook и основные библиотеки для работы с данными, можно [https://www.anaconda.com/products/individual здесь]. Если вы никогда не работали в Jupyter Notebook, предлагаем посмотреть небольшое [https://www.dropbox.com/s/9zku0zb6ttq71f5/intro-jupyter.mp4?dl=0 видео] и почитать [https://allatambov.github.io/icef/seminars/instruction-JN.pdf инструкцию]. | ||
+ | |||
+ | Если вы имеете мало опыта работы с Python, рекомендуем обратиться к следующим курсам на DataCamp (бесплатный доступ предоставлен всем слушателям этого курса): [https://app.datacamp.com/learn/courses/intro-to-python-for-data-science Introduction to Python], [https://app.datacamp.com/learn/courses/python-data-science-toolbox-part-1 Python Data Science Toolbox (Part 1)] и [https://app.datacamp.com/learn/courses/python-data-science-toolbox-part-2 Python Data Science Toolbox (Part 2)]. | ||
==Материалы== | ==Материалы== | ||
Строка 35: | Строка 42: | ||
==Домашние задания== | ==Домашние задания== | ||
+ | |||
+ | {| class="wikitable" | ||
+ | |- | ||
+ | ! Задание !! Дедлайн !! Файл с заданием | ||
+ | |- | ||
+ | | Домашнее задание 1 || TBA || | ||
+ | |- | ||
+ | | Домашнее задание 2 || TBA || | ||
+ | |- | ||
+ | | Домашнее задание 3 || TBA || | ||
+ | |} |
Версия 03:32, 4 февраля 2022
Это страница обязательного курса «Web-scraping: сбор данных из баз данных и интернет-источников», читаемого на программе «Психология» 4 курса бакалавриата в 2021/2022 учебном году.
Преподаватель: Тамбовцева Алла Андреевна.
Содержание
Правила игры
- Формула оценки: 0.6 × ДЗ + 0.4 × Экзамен.
- Домашние задания, сданные после срока, оцениваются с использованием понижающих коэффициентов: опоздание в пределах часа – штраф 10% от полученной оценки, в пределах суток – штраф 30%, в пределах недели – штраф 70%. Домашние задания, сданные через неделю после указанного срока и позже, не принимаются и не оцениваются.
- Программа курса.
Среда для работы
На данном курсе мы используем язык Python версии не ниже 3.5 и среду Jupyter Notebook. Скачать дистрибутив Anaconda, который установит интерпретатор Python, среду Jupyter Notebook и основные библиотеки для работы с данными, можно здесь. Если вы никогда не работали в Jupyter Notebook, предлагаем посмотреть небольшое видео и почитать инструкцию.
Если вы имеете мало опыта работы с Python, рекомендуем обратиться к следующим курсам на DataCamp (бесплатный доступ предоставлен всем слушателям этого курса): Introduction to Python, Python Data Science Toolbox (Part 1) и Python Data Science Toolbox (Part 2).
Материалы
27 января. Введение в web-scraping. Язык HTML и его особенности.
- Видеозапись занятия.
- Язык HTML и его особенности: слайды, файл на codepen.
Дополнительно
3 февраля. Структуры данных в Python: списки, кортежи, словари.
- Видеозапись занятия.
- Работа со строками (читать, скачать).
- Необходимые для веб-скреппинга сведения об объектах и конструкциях в Python (читать, скачать).
- Семинар 1 (читать, скачать), решения семинара (читать, скачать).
Дополнительно
- Списки и цикл for (читать, скачать), методы на списках (читать, скачать).
- Условные конструкции (читать, скачать).
- Кортежи (читать, скачать), словари (читать, скачать).
- Pythontutor: уроки и задачи.
Домашние задания
Задание | Дедлайн | Файл с заданием |
---|---|---|
Домашнее задание 1 | TBA | |
Домашнее задание 2 | TBA | |
Домашнее задание 3 | TBA |