Основы программирования в R: различия между версиями
Строка 84: | Строка 84: | ||
'''Тема 9. Парсинг HTML-файлов.''' | '''Тема 9. Парсинг HTML-файлов.''' | ||
− | * Код с занятия (парсинг Nplus1): [https://gist.github.com/allatambov/267fb7a50b039656ba0ab5af7c329318 ссылка] | + | * Код с занятия (парсинг Nplus1): [https://gist.github.com/allatambov/267fb7a50b039656ba0ab5af7c329318 ссылка], [https://www.dropbox.com/sh/xt7tw1otrx51xly/AADqFkqVpMFVn1a0YCeZ3yADa?dl=0 видеозапись]. |
* [https://www.w3schools.com/xml/xpath_intro.asp Тьюториал] по XPATH | * [https://www.w3schools.com/xml/xpath_intro.asp Тьюториал] по XPATH | ||
Версия 22:00, 14 июня 2021
Это страница курса по выбору «Основы программирования в R», читаемого на программе «Политология» 3 курса бакалавриата в 2020/2021 учебном году.
Лекции и семинары ведет: Тамбовцева Алла Андреевна
Содержание
Правила игры
- Программа курса.
- Формула оценки: 0.12 × Аудиторная работа + 0.24 × ДЗ + 0.24 × Проект + 0.4 × Экзамен.
- Домашние задания сдаются через Dropbox.
- При сдаче домашнего задания позже указанного срока предусмотрены штрафы: 10% от оценки за опоздание в пределах часа, 20% – в пределах суток, 50% – в пределах недели.
R и RStudio
Для работы на этом курсе необходимо установить (именно в таком порядке): R и RStudio.
Ссылки для скачивания:
- R: для Windows, для Mac OS (файл R-4.0.3.pkg);
- RStudio: для разных систем.
Мы будем использовать новую версию R 4.0.3, но если у вас уже установлена более ранняя версия, специально переустанавливать R необязательно. Мы будем учитывать разницы в версиях на занятиях. Внимание: после установки новой версии R поверх старой, установленные ранее библиотеки слетят, и их придётся ставить заново.
Материалы занятий
Учебник А.Б.Шипунов и др. Наглядная статистика. Используем R!
Тема 1. Введение в R и RMarkdown. Ввод и вывод.
- Инструкция по работе с RStudio (файл). Язык разметки Markdown в RStudio (конспект).
- R как калькулятор, переменные и типы переменных в R (конспект, R, Rmd). Видеозапись занятия.
- Ввод и вывод (конспект, R, Rmd). Видеозапись занятия.
- Официальный RMarkdown Cheatsheet. Глава 2 из Наглядная статистика. Используем R!
Тема 2. Векторы. Матрицы и списки.
- Векторы: часть 1 (конспект, R Rmd). Векторы: часть 2 (конспект, R Rmd). Видеозапись занятия.
- Матрицы (конспект, код Rmd). Видеозапись занятия + практикум 1.
- Списки (конспект, R, Rmd). Видеозапись + практикум 2.
- Глава 3 из Наглядная статистика. Используем R!. Linear algebra and matrices in R.
Тема 3. Функции. Условные конструкции. Циклы.
- Функции (конспект, Rmd, R).
- Условные конструкции и циклы (конспект, Rmd, R). Видеозапись (функции и конструкции).
- Приложения В3-В8 из Наглядная статистика. Используем R!
Тема 4. Загрузка данных в R и их описание.
- Файлы для работы: firtree.csv, test1.xls, test2.csv.
- Загрузка данных и их описание (конспект, Rmd). Практикум 3 видеозапись 1 и 2. Видеозапись занятия.
- Основы работы с датафреймами (конспект, Rmd, R). Видеозапись занятия + практикум 4.
Тема 5. Введение в веб-приложения Shiny.
- Введение в Shiny (конспект). Файл с гистограммой (app.R).
- Документация Shiny, галерея Shiny.
Тема 6. Визуализация данных. Разведывательный анализ данных.
- Файлы для работы firtree.csv, CPDS.csv.
- Визуализация и разведывательный анализ данных: часть 1 (конспект, Rmd, R). Видеозапись занятия 1 и 2.
- Визуализация и разведывательный анализ данных: часть 2 (конспект, Rmd, R). Видеозапись занятия.
- Главы 4-6 из Наглядная статистика. Используем R!.
- Диаграммы рассеивания (тьюториал), Exploratory Data Analysis with R (книга).
Тема 7. Обработка данных с tidyverse. Регулярные выражения.
- Файлы для работы: Characters.csv, food_coded.csv.
- Работа с данными с tidyverse: регулярные выражения (конспект). Видеозапись занятия (16 марта).
- Работа с данными с tidyverse: часть 1 (конспект).
- Работа с данными с tidyverse: часть 2 (конспект). Видеозапись занятия (6 апреля).
- Выгрузка описательных статистик с помощью stargazer (конспект).
- Библиотеки dplyr, tidyr, stringr.
Тема 8. Визуализация данных c ggplot2.
- Файлы для работы: wgi-new.csv, summer.csv, winter.csv
- Визуализация данными с ggplot2: часть 1 (конспект). Видеозапись (13 апреля).
- Визуализация данными с ggplot2: часть 2 (конспект). Видеозапись (20 апреля).
- Принципы визуализации: ссылка.
- Выбор типа визуализации и описание графиков от Tableau.
- Тест, какой ты график.
Тема 9. Парсинг HTML-файлов.
- Код с занятия (парсинг Nplus1): ссылка, видеозапись.
- Тьюториал по XPATH
Практикумы
- Практикум 1. Ввод и вывод, векторы (задания, Rmd, решения).
- Практикум 2. Матрицы и списки (задания, Rmd, решения).
- Практикум 3. Функции, условные конструкции и цикл for (задания, Rmd, решения).
- Практикум 4. Семинар по теме: датафреймы и виджеты Shiny (задания), файл Chile.csv, template1.R, решения.
- Практикум 5. Семинар по теме: введение в tidyverse и регулярные выражения (задания, решения).
- Практикум 6. Создание дэшборда Shiny с графиками ggplot2 (видеозапись, код, summer.csv, winter.csv.
- Практикум 7. Интерактивные графики с plotly. Видеозапись, код.
Домашние задания
Домашнее задание | Файлы | Дедлайн | Куда сдавать |
---|---|---|---|
Домашнее задание 1 | задание | 01.02 23:59 | Dropbox |
Домашнее задание 2 | задание Rmd | 06.02 23:59 | Dropbox |
Домашнее задание 3 | задание Rmd | 24.02 23:59 | Dropbox |
Домашнее задание 4 | задание Rmd wgi_fh.csv | 21.03 23:59 | Dropbox |
Домашнее задание 5 | задание | 19.05 23:59 | Dropbox |
Проект
Описание проекта
Проект выполняется индивидуально. Файл с описанием проекта.
Сдача проекта
Проект (Rmd-файл, html-файл, pdf-файл с описанием, csv-файл с данными, вспомогательные файлы при наличии) необходимо загрузить на Dropbox в виде zip-архива до 13 июня 23:59 по ссылке.
Данные для проекта
Для проекта можно взять любые данные (кроме тех файлов, с которыми мы работали на занятиях).