Основы программирования в R: различия между версиями

Материал из MathINFO
Перейти к навигации Перейти к поиску
(Новая страница: «'''Дорогие студенты!''' На этой странице будут появляться различные материалы и объявлен...»)
 
 
Строка 1: Строка 1:
'''Дорогие студенты!'''  
+
'''Дорогие студенты!'''
  
На этой странице будут появляться различные материалы и объявления, связанные с курсом '''«Основы программирования в R»''', читаемого для студентов 3-го курса факультета социальных наук, '''ОП «Политология»''', в весеннем семестре 2018/2019 учебного года.  
+
На этой странице будут появляться различные материалы и объявления, связанные с курсом '''«Основы программирования в R»''', читаемого для студентов 3-го курса факультета социальных наук, '''ОП «Политология»''', в весеннем семестре 2018/2019 учебного года.
  
 
Лекции и семинары ведёт: Тамбовцева Алла Андреевна
 
Лекции и семинары ведёт: Тамбовцева Алла Андреевна
 +
 +
==Правила игры==
 +
Программа курса: [https://www.hse.ru/data/2018/08/28/1150082633/program-2026121964-hYcLPWZ2Bq.pdf ссылка]
 +
 +
Организационная презентация: [http://math-info.hse.ru/f/2018-19/rprog3/R3_organizational-2.pdf ссылка]
 +
 +
==R и RStudio==
 +
На занятиях мы будем работать в среде RStudio, которая является графической оболочкой для языка R с удобным интерфейсом. Чтобы программное обеспечение установилось правильно, сначала нужно установить R, а затем RStudio.
 +
 +
Скачать установочный файл '''R''' можно на официальном [https://www.r-project.org сайте] R-project, в [https://cran.r-project.org/mirrors.html разделе] CRAN Mirrors, выбрав любую страну, а затем нужную операционную систему. Для Windows следует выбрать base, а затем кликнуть Download R 3.5.1 for Windows. Для Mac OS X следует выбрать файл R-3.5.1.pkg.
 +
 +
Скачать установочный файл '''RStudio''' можно на [https://www.rstudio.com сайте] проекта, перейдя в раздел загрузок в меню Products - RStudio - Download. Нам нужна версия RStudio Desktop (Open Source License), которая скачивается бесплатно.
 +
 +
С краткой инструкцией по работе в RStudio можно ознакомиться по [https://github.com/allatambov/R-programming-3/blob/master/Instruction-rstudio.pdf ссылке].
 +
 +
==Материалы==
 +
{| class="wikitable"
 +
! Дата
 +
! Тема
 +
! Лекция и семинар
 +
! Дополнительно
 +
 +
|-
 +
| 18.01
 +
| Введение в R и Rmarkdown
 +
| [http://rpubs.com/AllaT/rprog-intro-rmd r-markdown] [http://rpubs.com/AllaT/rprog-rbase r-basics] [http://rpubs.com/AllaT/rprog-rvectors r-vectors]
 +
| [https://www.rstudio.com/wp-content/uploads/2015/02/rmarkdown-cheatsheet.pdf rmarkdown-cheatsheet]<br>
 +
|-
 +
| 25.01
 +
| Векторы, матрицы, списки
 +
| [http://rpubs.com/AllaT/rprog-more-vectors more-vectors] [http://rpubs.com/AllaT/rprog-matlists matrices-lists]<br>[http://rpubs.com/AllaT/rprog-sem1 sem1] [http://rpubs.com/AllaT/rprog-sem1-solutions sem1-solutions] <br><br>
 +
| [https://github.com/allatambov/R-programming-3/blob/master/seminars/sem3-01-12/how-not-get-bored.md how-not-to-get-bored-1]<br>
 +
|-
 +
| 01.02
 +
| Загрузка файлов в R<br>Основы работы с таблицами<br><br>
 +
| [https://www.dropbox.com/s/8xc2zfb70aauc3t/data-l3.zip?dl=0 files] [http://math-info.hse.ru/f/2018-19/comm-math/marketing.csv marketing.csv]<br>[http://rpubs.com/AllaT/rprog-dataframes r-tables] <br><br>
 +
| [https://github.com/allatambov/RprogData/blob/master/datasets-links.md free-datasets]<br>[http://rpubs.com/AllaT/hownot2 how-not-to-get-bored-2]<br><br>
 +
|-
 +
| 08.02
 +
| Работа с датафреймами средствами dplyr<br>
 +
| [http://rpubs.com/AllaT/rprog-dplyr-intro r-dplyr] [http://math-info.hse.ru/f/2017-18/ps-ms/Chile.csv Chile.csv]<br>[http://rpubs.com/AllaT/rprog-sem2 sem2] [http://rpubs.com/AllaT/rprog-sem2-solutions sem2-solutions]<br><br>
 +
| [https://dplyr.tidyverse.org/articles/dplyr.html#single-table-verbs more] on dplyr<br>[https://rpubs.com/williamsurles/293454 merging] with dplyr<br><br>
 +
|-
 +
| 15.02
 +
| Работа с датафреймами средствами dplyr<br>
 +
| [http://rpubs.com/AllaT/rprog-dplyr-2 dplyr-cont] [http://math-info.hse.ru/f/2017-18/ps-ms/Chile.csv Chile.csv]<br>[http://rpubs.com/AllaT/rprog-sem3-upd sem3] [http://rpubs.com/AllaT/rprog-sem3-solutions sem3-solutions] [http://math-info.hse.ru/f/2018-19/pep/hw/CPDS.csv CPDS.csv]<br><br>
 +
| [https://cran.r-project.org/web/packages/dplyr/dplyr.pdf документация] по dplyr [https://cran.r-project.org/web/packages/dplyr/vignettes/dplyr.html тьюториал] по dplyr<br>[https://www.r-exercises.com/2017/10/08/dplyr-non-standard-evaluation-exercises/ r-exercises]<br><br>
 +
|-
 +
| 01.03
 +
| Описательные статистики в R<br>
 +
| [http://rpubs.com/AllaT/rprog-descriptives descriptives-1] [https://raw.githubusercontent.com/vincentarelbundock/Rdatasets/master/csv/lme4/cake.csv cakes.csv]<br>[http://rpubs.com/AllaT/rprog-descriptives2 descriptives-2] <br><br>
 +
| [https://www.princeton.edu/~otorres/NiceOutputR.pdf stargazer for non-LaTeX users]<br>
 +
|-
 +
| 15.03
 +
| Разведывательный анализ R: часть 1<br>
 +
| [http://rpubs.com/AllaT/rprog-explore-1 explore-1] [https://raw.githubusercontent.com/allatambov/R-programming-3/master/lectures/lect7-12-01/47130-8314.csv elections.csv]<br>
 +
| [https://rstudio.cloud/ RCloud]<br>[https://cran.r-project.org/doc/contrib/Shipunov-rbook.pdf Используем R!]<br><br>
 +
|-
 +
| 05.04
 +
| Разведывательный анализ R: часть 2<br>
 +
| [http://rpubs.com/AllaT/rprog-explore-2 explore-2] [http://math-info.hse.ru/f/2018-19/pep/hw/CPDS.csv CPDS.csv]<br>
 +
| [http://guessthecorrelation.com/ GuessCorrelation Game] [https://ru.wikipedia.org/wiki/%D0%A8%D0%BA%D0%B0%D0%BB%D0%B0 шкалы]<br>[http://extremepresentation.typepad.com/files/choosing-a-good-chart-09.pdf типы графиков]<br><br>
 +
|-
 +
| 19.04
 +
| Визуализация с ggplot2<br>Линейная регрессия <br><br>
 +
| [http://rpubs.com/AllaT/rprog-ggplot2 ggplot2] [https://raw.githubusercontent.com/allatambov/R-programming-3/master/lectures/lect9-02-02/wgi_fh_new.csv wgi.csv]<br>[http://rpubs.com/AllaT/rprog-sem4 sem4] [http://rpubs.com/AllaT/rprog-sem4-sol sem4-solutions] [https://raw.githubusercontent.com/allatambov/R-programming-3/master/seminars/sem8-09-02/demography.csv demography.csv]<br><br>
 +
| [https://www.gapminder.org/tools/#$state$time$value=2018;;&chart-type=bubbles интерактив] [https://www.tableau.com/sites/default/files/media/which_chart_v6_final_0.pdf ещё] про типы графиков<br>[https://cran.r-project.org/web/packages/jtools/vignettes/summ.html jtools для регрессий]<br><br>
 +
|-
 +
| 26.04
 +
| Продолжение ggplot2<br>Формат дата-время<br><br>
 +
| [http://rpubs.com/AllaT/rprog-sem5 sem5] [http://rpubs.com/AllaT/rprog-sem5-sol sem5-solutions]<br>[http://rpubs.com/AllaT/rprog-date-time date-time]<br><br>
 +
| [https://www.sisense.com/blog/quiz-chart/ quiz] [http://rpubs.com/AllaT/visuals не надо так] [https://www.datanovia.com/en/blog/how-to-change-ggplot-facet-labels/ ggplot-facets]<br>[https://www.statmethods.net/input/dates.html date-time]<br><br>
 +
|-
 +
| 17.05
 +
| Условия, циклы, функции<br>
 +
| [http://rpubs.com/AllaT/lecture8_control conditions] [http://rpubs.com/AllaT/lecture9_functions loops-functions]<br>[http://rpubs.com/AllaT/rprog-sem6 sem6] [http://rpubs.com/AllaT/rprog-sem6-sol sem6-solutions]<br><br>
 +
| <br>
 +
|-
 +
| 24.05
 +
| Функции. Парсинг html-страниц<br>
 +
| [http://rpubs.com/AllaT/rprog-rvest1 rvest-1] [http://math-info.hse.ru/f/2018-19/rprog3/html-parse-1.R R code]<br>
 +
| [rvest documentantion]<br>
 +
|-
 +
| 31.05
 +
| Парсинг html-страниц<br>
 +
| [http://math-info.hse.ru/f/2018-19/rprog3/31-05.R R-code]<br>
 +
| [http://www.endmemo.com/program/R/gsub.php regular expressions & gsub]<br>
 +
|}
 +
* Исходные Rmd-файлы на Github: [https://github.com/allatambov/rprog-2019 ссылка]
 +
 +
* Лекции в формате pdf: [http://math-info.hse.ru/f/2018-19/rprog3/pdf ссылка]
 +
 +
==Домашние задания==
 +
* Домашнее задание 1: [http://math-info.hse.ru/f/2018-19/rprog3/HW1.pdf ссылка], дедлайн 28 января 23:59
 +
 +
* Домашнее задание 2: [http://math-info.hse.ru/f/2018-19/rprog3/HW2.pdf ссылка], дедлайн 04 февраля 23:59
 +
 +
* Домашнее задание 3: [http://math-info.hse.ru/f/2018-19/rprog3/HW3.pdf ссылка], дедлайн 16 февраля 23:59
 +
 +
* Домашнее задание 4: [http://math-info.hse.ru/f/2018-19/rprog3/HW4.pdf ссылка], дедлайн 12 апреля, 23:59
 +
 +
* Домашнее задание 5: [http://math-info.hse.ru/f/2018-19/rprog3/HW5.pdf ссылка], дедлайн 7 июня, 23:59, [https://raw.githubusercontent.com/allatambov/rprog-2019/master/hw5-template.Rmd шаблон] для заполнения
 +
 +
* Домашнее задание 6: [http://math-info.hse.ru/f/2018-19/rprog3/HW6.pdf ссылка], дедлайн 15 июня 23:59
 +
 +
==Проект==
 +
* Подробное [http://math-info.hse.ru/f/2018-19/rprog3/project.pdf описание] задания и дедлайны
 +
 +
* [https://github.com/allatambov/R-programming-3/blob/master/project/example.md Пример] формата проекта (набросок, не образец выполнения!)
 +
 +
* Полезные материалы: [https://github.com/allatambov/R-programming-4/blob/master/project/interpretation.md статистические гипотезы], [http://rpubs.com/AllaT/stat-tests статистические тесты], [http://rpubs.com/AllaT/stargazer-rmd stargazer в Rmarkdown]
 +
 +
==Экзамен==
 +
* задания: [http://rpubs.com/AllaT/r3-exam ссылка]
 +
 +
* файл для работы: [https://raw.githubusercontent.com/allatambov/R-programming-3/master/exam-aux-stages/TED.csv TED.csv]
 +
 +
* файл .R с решениями загружать [https://www.dropbox.com/request/cJvUk6doKiJbCMxlWAsk сюда]

Текущая версия на 03:56, 7 февраля 2020

Дорогие студенты!

На этой странице будут появляться различные материалы и объявления, связанные с курсом «Основы программирования в R», читаемого для студентов 3-го курса факультета социальных наук, ОП «Политология», в весеннем семестре 2018/2019 учебного года.

Лекции и семинары ведёт: Тамбовцева Алла Андреевна

Правила игры

Программа курса: ссылка

Организационная презентация: ссылка

R и RStudio

На занятиях мы будем работать в среде RStudio, которая является графической оболочкой для языка R с удобным интерфейсом. Чтобы программное обеспечение установилось правильно, сначала нужно установить R, а затем RStudio.

Скачать установочный файл R можно на официальном сайте R-project, в разделе CRAN Mirrors, выбрав любую страну, а затем нужную операционную систему. Для Windows следует выбрать base, а затем кликнуть Download R 3.5.1 for Windows. Для Mac OS X следует выбрать файл R-3.5.1.pkg.

Скачать установочный файл RStudio можно на сайте проекта, перейдя в раздел загрузок в меню Products - RStudio - Download. Нам нужна версия RStudio Desktop (Open Source License), которая скачивается бесплатно.

С краткой инструкцией по работе в RStudio можно ознакомиться по ссылке.

Материалы

Дата Тема Лекция и семинар Дополнительно
18.01 Введение в R и Rmarkdown r-markdown r-basics r-vectors rmarkdown-cheatsheet
25.01 Векторы, матрицы, списки more-vectors matrices-lists
sem1 sem1-solutions

how-not-to-get-bored-1
01.02 Загрузка файлов в R
Основы работы с таблицами

files marketing.csv
r-tables

free-datasets
how-not-to-get-bored-2

08.02 Работа с датафреймами средствами dplyr
r-dplyr Chile.csv
sem2 sem2-solutions

more on dplyr
merging with dplyr

15.02 Работа с датафреймами средствами dplyr
dplyr-cont Chile.csv
sem3 sem3-solutions CPDS.csv

документация по dplyr тьюториал по dplyr
r-exercises

01.03 Описательные статистики в R
descriptives-1 cakes.csv
descriptives-2

stargazer for non-LaTeX users
15.03 Разведывательный анализ R: часть 1
explore-1 elections.csv
RCloud
Используем R!

05.04 Разведывательный анализ R: часть 2
explore-2 CPDS.csv
GuessCorrelation Game шкалы
типы графиков

19.04 Визуализация с ggplot2
Линейная регрессия

ggplot2 wgi.csv
sem4 sem4-solutions demography.csv

интерактив ещё про типы графиков
jtools для регрессий

26.04 Продолжение ggplot2
Формат дата-время

sem5 sem5-solutions
date-time

quiz не надо так ggplot-facets
date-time

17.05 Условия, циклы, функции
conditions loops-functions
sem6 sem6-solutions


24.05 Функции. Парсинг html-страниц
rvest-1 R code
[rvest documentantion]
31.05 Парсинг html-страниц
R-code
regular expressions & gsub

Домашние задания

  • Домашнее задание 1: ссылка, дедлайн 28 января 23:59
  • Домашнее задание 2: ссылка, дедлайн 04 февраля 23:59
  • Домашнее задание 3: ссылка, дедлайн 16 февраля 23:59
  • Домашнее задание 4: ссылка, дедлайн 12 апреля, 23:59
  • Домашнее задание 5: ссылка, дедлайн 7 июня, 23:59, шаблон для заполнения
  • Домашнее задание 6: ссылка, дедлайн 15 июня 23:59

Проект

  • Пример формата проекта (набросок, не образец выполнения!)

Экзамен

  • файл для работы: TED.csv
  • файл .R с решениями загружать сюда