Программирование для всех (основы работы с Python): различия между версиями

Материал из MathINFO
Перейти к навигации Перейти к поиску
 
(не показано 8 промежуточных версий этого же участника)
Строка 66: Строка 66:
 
* Словари и методы на словарях ([https://nbviewer.org/github/allatambov/allatambov.github.io/blob/master/PyProgPerm/lectures/dicts.ipynb читать], [https://www.dropbox.com/s/n8etvouova0be13/dicts.ipynb?dl=0 скачать]).
 
* Словари и методы на словарях ([https://nbviewer.org/github/allatambov/allatambov.github.io/blob/master/PyProgPerm/lectures/dicts.ipynb читать], [https://www.dropbox.com/s/n8etvouova0be13/dicts.ipynb?dl=0 скачать]).
 
* Словари и формат JSON ([https://github.com/allatambov/allatambov.github.io/blob/master/PyProgPerm/lectures/files-json.ipynb читать], [https://www.dropbox.com/s/r2p0jb46kuxoo24/files-json.ipynb?dl=0 скачать]), файл [https://www.dropbox.com/s/lb48mcy3nldo5kp/data-6114-2018-12-10.json?dl=0 data-6114-2018-12-10.json].
 
* Словари и формат JSON ([https://github.com/allatambov/allatambov.github.io/blob/master/PyProgPerm/lectures/files-json.ipynb читать], [https://www.dropbox.com/s/r2p0jb46kuxoo24/files-json.ipynb?dl=0 скачать]), файл [https://www.dropbox.com/s/lb48mcy3nldo5kp/data-6114-2018-12-10.json?dl=0 data-6114-2018-12-10.json].
* Практикум 4: задания ([https://nbviewer.org/github/allatambov/PyMs2022/blob/main/problems04.ipynb читать], [https://www.dropbox.com/s/r3goyzkdpf688pw/problems04.ipynb?dl=0 скачать]), решения (читать, скачать).
+
* Практикум 4: задания ([https://github.com/allatambov/PyMs2022/blob/main/problems04.ipynb читать], [https://www.dropbox.com/s/r3goyzkdpf688pw/problems04.ipynb?dl=0 скачать]), решения ([https://github.com/allatambov/PyMs2022/blob/main/problems04-solutions.ipynb читать], [https://www.dropbox.com/s/o5z676xtlp280cm/problems04-solutions.ipynb?dl=0 скачать]).
 
* [https://allatambov.github.io/pypolit/vk-auth.pdf Инструкция] по получению доступа к API ВКонтакте.
 
* [https://allatambov.github.io/pypolit/vk-auth.pdf Инструкция] по получению доступа к API ВКонтакте.
  
Строка 78: Строка 78:
 
* Знакомство с датафреймами pandas ([https://nbviewer.org/github/allatambov/PyMs2022/blob/main/pandas-upd.ipynb читать], [https://www.dropbox.com/s/fjk17gg86ylytj9/pandas-upd.ipynb?dl=0 скачать]), файл [https://www.dropbox.com/s/3m3tbgzrk8ipspu/Salaries.csv?dl=0 Salaries.csv], загрузить данные можно также по [https://vincentarelbundock.github.io/Rdatasets/csv/carData/Salaries.csv ссылке].
 
* Знакомство с датафреймами pandas ([https://nbviewer.org/github/allatambov/PyMs2022/blob/main/pandas-upd.ipynb читать], [https://www.dropbox.com/s/fjk17gg86ylytj9/pandas-upd.ipynb?dl=0 скачать]), файл [https://www.dropbox.com/s/3m3tbgzrk8ipspu/Salaries.csv?dl=0 Salaries.csv], загрузить данные можно также по [https://vincentarelbundock.github.io/Rdatasets/csv/carData/Salaries.csv ссылке].
 
* [https://allatambov.github.io/pypolit/vk-auth.pdf Инструкция] по получению доступа к API ВКонтакте, [https://dev.vk.com/api/getting-started документация] API ВКонтакте.
 
* [https://allatambov.github.io/pypolit/vk-auth.pdf Инструкция] по получению доступа к API ВКонтакте, [https://dev.vk.com/api/getting-started документация] API ВКонтакте.
* Практикум 5 по API ВКонтакте: [https://www.dropbox.com/s/8ik4e9z3be1y3k6/problems05-vk.ipynb?dl=0 задания], решения, видео-разбор.
+
* Практикум 5 по API: задания ([https://github.com/allatambov/PyMs2022/blob/main/problems05-vk.ipynb читать], [https://www.dropbox.com/s/8ik4e9z3be1y3k6/problems05-vk.ipynb?dl=0 скачать]), решения ([https://github.com/allatambov/PyMs2022/blob/main/practice-vk-sol.ipynb читать], [https://www.dropbox.com/s/065f1lpno1k85hc/practice-vk-sol.ipynb?dl=0 скачать]), видео-разбор.
  
 
Дополнительно:
 
Дополнительно:
  
 +
* Массивы Numpy, последовательности pandas Series и датафреймы pandas ([https://nbviewer.org/github/allatambov/allatambov.github.io/blob/master/icef/seminars/arrays-pandas.ipynb конспект]).
 
* [http://math-info.hse.ru/s22/c Материалы] курса «Основы анализа данных в Python».
 
* [http://math-info.hse.ru/s22/c Материалы] курса «Основы анализа данных в Python».
 
* [http://math-info.hse.ru/s21/j Материалы] курса И.В.Щурова «Наука о данных».
 
* [http://math-info.hse.ru/s21/j Материалы] курса И.В.Щурова «Наука о данных».
 +
 +
=== Неделя 6. Парсинг HTML с BeautifulSoup (17.10) ===
 +
 +
* [https://www.dropbox.com/sh/1n2egk2wgrg8n8m/AADNumQpCZmXI_QHHI1Jw7o5a?dl=0 Видеозапись] занятия, сырой [https://www.dropbox.com/s/cwsx6pn6zqys81c/get-news.ipynb?dl=0 ipynb] с занятия.
 +
* HTML как язык разметки ([https://www.dropbox.com/s/igzv6fb0l5fd5dz/Intro_HTML.pdf?dl=0 слайды]).
 +
* Парсинг HTML с BeautifulSoup ([https://github.com/allatambov/PyMs2022/blob/main/webscrape-bs.ipynb читать], [https://www.dropbox.com/s/kmelcegvgflj2bo/webscrape-bs.ipynb?dl=0 скачать]).
 +
 +
Дополнительно:
 +
 +
* [https://www.crummy.com/software/BeautifulSoup/bs4/doc/ Документация] BeautifulSoup.
 +
* Что дальше: работа с текстами и облака слов ([https://allatambov.github.io/web-scrape/work-with-texts.ipynb читать]), облака слов с [https://www.datacamp.com/community/tutorials/wordcloud-python wordcloud], [https://raw.githubusercontent.com/stopwords-iso/stopwords-ru/master/stopwords-ru.txt список] стоп-слов для русского языка.
  
 
== Домашние задания ==
 
== Домашние задания ==
Строка 103: Строка 115:
 
| Домашнее задание 4 || 17.10 23:59 || [https://nbviewer.org/url/python.math-hse.info/static/assignments_release/pyall2022/pyall-hw04/pyall-hw04.ipynb ссылка]
 
| Домашнее задание 4 || 17.10 23:59 || [https://nbviewer.org/url/python.math-hse.info/static/assignments_release/pyall2022/pyall-hw04/pyall-hw04.ipynb ссылка]
 
|-
 
|-
| Домашнее задание 5 || ||  
+
| [https://github.com/allatambov/PyMs2022/blob/main/pyall-hw05.ipynb Домашнее задание 5] || 24.10 23:59 || [https://www.dropbox.com/s/lp91afwhgt61e4l/pyall-hw05.ipynb?dl=0 ipynb], сдавать [https://www.dropbox.com/request/SjApy84xQ79RmYd0Y5vL сюда]
 
|}
 
|}

Текущая версия на 01:51, 18 октября 2022

Дорогие студенты!

Это страница курса по выбору «Программирование для всех (основы работы с Python)», читаемого на программе «Прикладная политология» 1 курса магистратуры в 1 модуле 2022-2023 учебного года.

Семинары ведёт: Тамбовцева Алла Андреевна.

Правила игры

  • Формула оценки: Итог = 0.4 * Домашние задания + 0.2 * Тест + 0.4 * Экзамен.
  • План курса по неделям и пояснения по формам контроля можно посмотреть здесь.

Программное обеспечение

Перед занятиями необходимо установить дистрибутив Anaconda (скачать можно здесь), который включает в себя интерпретатор языка Python, библиотеки для обработки, анализа и визуализации данных, а также среду для работы Jupyter Notebook.

Также есть возможность работать в Jupyter Notebook онлайн, используя ресурс Google Colab (для создания и редактирования файлов нужен аккаунт Gmail). Но в долгосрочной перспективе предпочтительнее установить Anaconda.

Материалы занятий

Неделя 1. Введение в Python (12.09)

Дополнительно:

Неделя 2. Списки и массивы в Python (19.09)

Дополнительно:

Неделя 3. Условные конструкции, циклы, функции (26.09)

Дополнительно:

Неделя 4. Словари, файлы JSON, введение в API (03.10)

Дополнительно:

Неделя 5. Датафреймы pandas, работа с API ВКонтакте (10.10)

Дополнительно:

  • Массивы Numpy, последовательности pandas Series и датафреймы pandas (конспект).
  • Материалы курса «Основы анализа данных в Python».
  • Материалы курса И.В.Щурова «Наука о данных».

Неделя 6. Парсинг HTML с BeautifulSoup (17.10)

Дополнительно:

Домашние задания

Сдаются через систему с автоматическими тестами. Для сдачи задания необходимо зарегистрироваться в системе, зайти в нее, скачать ipynb-файл, вписать в него решения, сохранить изменения и загрузить обновленный файл в систему.

Важно! Если скачать файл со страницы курса по ссылке ниже или создать новый файл и просто скопировать в него условия и решения, система не сможет за каждый пройденный тест засчитать баллы, нужен особый формат ячеек, который используется в ipynb-файле с домашним заданием в системе (да, внешне ячейки такого формата не отличаются от обычных).

Домашнее задание Дедлайн Условия
Домашнее задание 1 20.09 23:59 ссылка
Домашнее задание 2 29.09 23:59 ссылка
Домашнее задание 3 06.10 23:59 ссылка
Домашнее задание 4 17.10 23:59 ссылка
Домашнее задание 5 24.10 23:59 ipynb, сдавать сюда