Программирование для анализа данных — различия между версиями

Материалы по математике, 2018-19 учебный год
Перейти к: навигация, поиск
(Материалы по курсу)
 
(не показано 59 промежуточных версий этого же участника)
Строка 24: Строка 24:
  
 
Конспекты лекций представлены в виде html-страниц, опубликованных на RPubs. Чтобы скачать все материалы по курсу (файлы с исходным кодом, таблицы с данными), можно перейти в [https://github.com/allatambov/RprogData репозиторий] курса на Github, нажать зеленую кнопку ''Clone or Download'', выбрать ''Download ZIP'', скачать архив и распаковать. Никакой регистрации на Github для этого не требуется.
 
Конспекты лекций представлены в виде html-страниц, опубликованных на RPubs. Чтобы скачать все материалы по курсу (файлы с исходным кодом, таблицы с данными), можно перейти в [https://github.com/allatambov/RprogData репозиторий] курса на Github, нажать зеленую кнопку ''Clone or Download'', выбрать ''Download ZIP'', скачать архив и распаковать. Никакой регистрации на Github для этого не требуется.
 +
{| class="wikitable"
 +
|-
 +
! дата
 +
! тема
 +
! лекция
 +
! семинар
 +
! дополнительно
 +
|-
 +
| 05.09 || R и RStudio. Переменные. || [http://rpubs.com/AllaT/rdata-markdown rdata-markdown]
 +
|| [http://rpubs.com/AllaT/rdata-intro rdata-intro]
 +
|| [https://www.rstudio.com/wp-content/uploads/2015/02/rmarkdown-cheatsheet.pdf RMarkdown] [https://github.com/sandino/Markdown-Cheatsheet Markdown (русск)]
 +
|-
 +
|12.09 || Векторы в  R. || [http://rpubs.com/AllaT/rdata-vectors rdata-vectors]  ||
 +
[http://rpubs.com/AllaT/rdat-sem1 sem1] [https://github.com/allatambov/RprogData/blob/master/seminars/12-09/sem-1-solutions.Rmd sem1-solutions]
 +
|| [https://rpubs.com/AllaT/lecture2_multidim Matrices & Lists]
 +
|-
 +
|20.09 || Загрузка файлов. Таблицы в R. || [http://rpubs.com/AllaT/rdata-datasets rdata-dataframes] [https://www.dropbox.com/s/8xc2zfb70aauc3t/data-l3.zip?dl=0 files]||
 +
[http://rpubs.com/AllaT/rdata-sem2 sem2]
 +
|[https://github.com/allatambov/RprogData/blob/master/datasets-links.md free-datasets]
 +
|-
 +
|26.09 || Таблицы в R. || [http://rpubs.com/AllaT/rdata-wtables rdata-wtables] [http://math-info.hse.ru/f/2018-19/comm-math/marketing.csv data] || sem2-solutions ||
 +
|-
 +
|02.10 || Работа с таблицами средствами dplyr. || [http://math-info.hse.ru/f/2018-19/comm-math/rcode-dplyr.R rcode] [http://rpubs.com/AllaT/rdata-dplyr rdata-dplyr]|| [https://github.com/allatambov/R-programming-3/tree/master/seminars/sem4-08-12 sem3] [https://raw.githubusercontent.com/allatambov/R-programming-3/master/seminars/sem4-08-12/moscow-buildings.csv data] [https://github.com/allatambov/RprogData/blob/master/seminars/02-10/sem3-solutions.Rmd sem3-solutions]|| [https://dplyr.tidyverse.org/ Документация] по dplyr.
 +
|-
 +
|03.10 || Библиотека dplyr: продолжение. || - || [http://rpubs.com/AllaT/rdata-sem4 sem4] [http://math-info.hse.ru/f/2018-19/comm-math/Titanic.csv data] [http://rpubs.com/AllaT/rdata-sem4-solutions sem-4-solutions]||
 +
|-
 +
|10.10 || Описание данных. Разведывательный анализ данных. || [http://rpubs.com/AllaT/lecture5_descriptives rdata-desc] [http://rpubs.com/AllaT/rdata-explore1 rdata-explore-1] [http://rpubs.com/AllaT/rdata-explore2 rdata-explore-2] [http://math-info.hse.ru/f/2018-19/comm-math/descriptives.R desc-rcode] [http://math-info.hse.ru/f/2018-19/comm-math/exploratory-1.R explore-1] [http://math-info.hse.ru/f/2018-19/comm-math/exploratory-2.R explore-2] [https://datahub.io/core/s-and-p-500-companies-financials data]|| - || [http://rpubs.com/AllaT/lecture7_explore more-explore] [http://rpubs.com/AllaT/visuals Визуализация: не надо так]
 +
|-
 +
|17.10 || Визуализация данных средствами ggplot2. Проверка гипотез.|| [http://rpubs.com/AllaT/lecture10_ggplot2 rdata-ggplot2] [http://math-info.hse.ru/f/2018-19/comm-math/17-10.R ggplot-rcode]|| [http://rpubs.com/AllaT/rdata-sem6 sem-6] [http://rpubs.com/AllaT/rdata-sem6-solutions sem6-solutions]|| [https://github.com/allatambov/R-programming-3/blob/master/lectures/lect9-02-02/links.md helpful-links] [http://rpubs.com/AllaT/rmaps maps] [https://github.com/Sobach/R.rus.map.zoom maps2] [http://r-statistics.co/Top50-Ggplot2-Visualizations-MasterList-R-Code.html ggplot2-adv] [https://github.com/allatambov/R-programming-3/blob/master/seminars/sem8-09-02/seminar8_solution.Rmd ggplot-practice]
 +
|-
 +
|20.10 || Управляющие конструкции. Функции.|| [http://math-info.hse.ru/f/2018-19/comm-math/rdata-conds.R conds-rcode] [http://math-info.hse.ru/f/2018-19/comm-math/rdata-func.R funs-rcode]|| [https://github.com/allatambov/R-programming-3/tree/master/seminars/sem11-02-03 sem-7]||
 +
|}
 +
 +
=== Домашние задания ===
 +
 +
{| class="wikitable"
 +
|-
 +
! Название !! Дедлайн !! Задание
 +
|-
 +
| Домашнее задание 1 || 12.09 23:59 || [http://rpubs.com/AllaT/rdata-hw1-1 hw1-1] [http://rpubs.com/AllaT/rdata-hw1-2 hw1-2]
 +
|-
 +
| Домашнее задание 2 || 23.09 23:59 || [http://rpubs.com/AllaT/rdata-hw2 hw2]
 +
|-
 +
| Домашнее задание 3 || 03.10 23:59 || [http://rpubs.com/AllaT/rdata-hw3 hw3]
 +
|}
 +
 +
'''Проект'''
 +
 +
''Дедлайн:'' 19 октября 20:00
 +
 +
[http://math-info.hse.ru/f/2018-19/comm-math/project-task.pdf Текст] задания
 +
 +
[https://github.com/allatambov/R-programming-3/blob/master/project/example.md Пример] выполнения (шаблон, без готового кода и графиков)
 +
 +
[https://github.com/allatambov/R-programming-3/blob/master/project/interpretation.md Интерпретация статистических результатов]
 +
 +
[https://github.com/allatambov/R-programming-3/blob/master/project/statistical_tests.Rmd Статистические критерии]
 +
 +
[https://github.com/allatambov/R-programming-3/blob/master/project/stargazer-rmd.Rmd Выгрузка] красивых таблиц через stargazer

Текущая версия на 13:35, 20 октября 2018

Дорогие студенты!

На этой странице будут появляться материалы по курсу «Программирование для анализа данных», читаемого в 2018/2019 учебном году на образовательной программе «Коммуникации, основанные на данных» (магистратура, 1 курс).

Преподаватель: Алла Тамбовцева

Программа курса: ссылка.

Программное обеспечение: R и RStudio

R и RStudio

На занятиях мы будем работать в среде RStudio, которая является оболочкой для языка R с удобным интерфейсом. Чтобы программное обеспечение установилось правильно, сначала нужно установить R, а затем RStudio.

Скачать установочный файл R можно на официальном сайте R-project, в разделе CRAN Mirrors, выбрав любую страну, а затем нужную операционную систему.

Для Windows следует выбрать base, а затем кликнуть Download R 3.5.1 for Windows. Для Mac OS X следует выбрать файл R-3.5.1.pkg.

Скачать установочный файл RStudio можно на сайте проекта, перейдя в раздел загрузок в меню Products - RStudio - Download. Нам нужна версия RStudio Desktop (Open Source License), которая скачивается бесплатно.

С краткой инструкцией по работе в RStudio можно ознакомиться по ссылке.

Материалы по курсу

Конспекты лекций представлены в виде html-страниц, опубликованных на RPubs. Чтобы скачать все материалы по курсу (файлы с исходным кодом, таблицы с данными), можно перейти в репозиторий курса на Github, нажать зеленую кнопку Clone or Download, выбрать Download ZIP, скачать архив и распаковать. Никакой регистрации на Github для этого не требуется.

дата тема лекция семинар дополнительно
05.09 R и RStudio. Переменные. rdata-markdown rdata-intro RMarkdown Markdown (русск)
12.09 Векторы в  R. rdata-vectors

sem1 sem1-solutions

Matrices & Lists
20.09 Загрузка файлов. Таблицы в R. rdata-dataframes files

sem2

free-datasets
26.09 Таблицы в R. rdata-wtables data sem2-solutions
02.10 Работа с таблицами средствами dplyr. rcode rdata-dplyr sem3 data sem3-solutions Документация по dplyr.
03.10 Библиотека dplyr: продолжение. - sem4 data sem-4-solutions
10.10 Описание данных. Разведывательный анализ данных. rdata-desc rdata-explore-1 rdata-explore-2 desc-rcode explore-1 explore-2 data - more-explore Визуализация: не надо так
17.10 Визуализация данных средствами ggplot2. Проверка гипотез. rdata-ggplot2 ggplot-rcode sem-6 sem6-solutions helpful-links maps maps2 ggplot2-adv ggplot-practice
20.10 Управляющие конструкции. Функции. conds-rcode funs-rcode sem-7

Домашние задания

Название Дедлайн Задание
Домашнее задание 1 12.09 23:59 hw1-1 hw1-2
Домашнее задание 2 23.09 23:59 hw2
Домашнее задание 3 03.10 23:59 hw3

Проект

Дедлайн: 19 октября 20:00

Текст задания

Пример выполнения (шаблон, без готового кода и графиков)

Интерпретация статистических результатов

Статистические критерии

Выгрузка красивых таблиц через stargazer