Web-scraping: сбор данных из баз данных и интернет-источников: различия между версиями

Материал из MathINFO
Перейти к навигации Перейти к поиску
Строка 9: Строка 9:
 
==Среда для работы==
 
==Среда для работы==
  
На данном курсе мы используем язык Python версии не ниже 3.5 и среду Jupyter Notebook. Скачать дистрибутив Anaconda, который установит интерпретатор Python, среду Jupyter Notebook и основные библиотеки для работы с данными, можно [https://www.anaconda.com/products/individual здесь]. Если вы никогда не работали в Jupyter Notebook, предлагаем посмотреть небольшое [https://www.dropbox.com/s/9zku0zb6ttq71f5/intro-jupyter.mp4?dl=0 видео] и почитать [https://allatambov.github.io/icef/seminars/instruction-JN.pdf инструкцию]. В течение первой половины курса вместо Jupyter Notebook можно использовать онлайн-среду [https://colab.research.google.com/ Google Colab], она бесплатна, но для работы нужен аккаунт Gmail.
+
Перед занятиями необходимо установить дистрибутив '''Anaconda''' (скачать можно [https://www.anaconda.com/download здесь]), который включает в себя интерпретатор языка Python, библиотеки для обработки, анализа и визуализации данных, а также среду для работы '''Jupyter Notebook'''. Также есть возможность работать в Jupyter Notebook онлайн, используя ресурс [https://colab.research.google.com/ Google Colab] (для создания и редактирования файлов нужен аккаунт Gmail).
 +
 
 +
Подробности по установке и работе – см. ниже в неделе 0.
  
 
==Материалы курса==
 
==Материалы курса==

Версия 09:35, 19 января 2024

Это страница практикума «Web-scraping: сбор данных из баз данных и интернет-источников», читаемого на программе «Психология» в 2023/2024 учебном году.

Практические занятия ведёт: Тамбовцева Алла Андреевна.

Правила игры

https://www.dropbox.com/scl/fi/gz5pz9dkp9jgshgk779hd/Web-scraping_.pdf?rlkey=suf1hr0ez8lwd56libxj8jenr&dl=0

Среда для работы

Перед занятиями необходимо установить дистрибутив Anaconda (скачать можно здесь), который включает в себя интерпретатор языка Python, библиотеки для обработки, анализа и визуализации данных, а также среду для работы Jupyter Notebook. Также есть возможность работать в Jupyter Notebook онлайн, используя ресурс Google Colab (для создания и редактирования файлов нужен аккаунт Gmail).

Подробности по установке и работе – см. ниже в неделе 0.

Материалы курса

Неделя 0. Подготовка к работе. Напоминания про Python и Jupyter Notebook

Для подготовки к работе на курсе можно ознакомиться со следующими материалами онлайн-курса:

А также с материалами по работе в Jupyter Notebook и Google Colab:

Дополнительно:

Неделя 1. Язык HTML и его особенности. Знакомство с BeautifulSoup

Дополнительно