Разница между страницами «Linguistic Data: Quantitative Analysis and Visualisation: computational linguistics» и «Наука о данных»

Материал из MathINFO
(Различия между страницами)
Перейти к навигации Перейти к поиску
 
 
Строка 1: Строка 1:
* Instructors: Ilya Schurov and Olga Lyashevskaya
+
* Курс ведёт Илья Щуров.
  
== Materials ==
+
== Материалы ==
{| class="wikitable"
+
{|class='wikitable'
 
|-
 
|-
! Data !! Topics !! Links
+
! дата !! тема !! конспекты !! видео !! дополнительные материалы !! ДЗ
 
|-
 
|-
| Jan 18 || Introduction. Quantitative linguistic research and data types. R basics || [https://docs.google.com/presentation/d/1VUIUa3Db5n4dsD_HeA3e-mz55zK8uPrko3yu207pKUk/edit?usp=sharing Intro Slides] [https://github.com/LingData2019/LingData/tree/master/seminars/2019-01-12 Lab 01: intro to R]
+
| 10 января
 +
| Первое знакомство. Python как калькулятор
 +
| [https://nbviewer.jupyter.org/github/ischurov/pythonhse/blob/master/Lecture%201.ipynb конспект с комментариями], [https://gist.github.com/ischurov/2740543f1a6d6afd8ab02ced90789ecf сырой ноутбук с занятия] (без комментариев)
 +
| [https://www.youtube.com/watch?v=5Y5tKPKhurA видео]
 +
| {{PT}} [http://pythontutor.ru/lessons/int_and_float/ вычисления], [http://pythontutor.com визуализатор Python]
 +
|rowspan=2| [http://nbviewer.jupyter.org/url/python.math-hse.info/static/assignments_release/nes-datascience2020/ps01/ps01.ipynb ДЗ№1]
 
|-
 
|-
| Jan 25 || ||  
+
| 14 января
 +
| Списки
 +
| [https://nbviewer.jupyter.org/github/ischurov/pythonhse/blob/master/Lecture%202.ipynb конспект с комментариями] (мы прошли до раздела «Присвоение и копирование списков», не включая его), [https://nbviewer.jupyter.org/github/ischurov/pythonhse/blob/master/Lecture%203.ipynb#Ввод-вывод-списков split и join], [https://gist.github.com/65ca76fd47c32f4f2520060149a97574 сырой ноутбук с занятия]
 +
| [https://www.youtube.com/watch?v=kBu3g-ITjY4 видео]
 +
| {{PT}} [http://pythontutor.ru/lessons/lists/ списки]
 +
|-
 +
| 21 января
 +
| Списки и цикл <code>for</code>
 +
| [https://nbviewer.jupyter.org/github/ischurov/pythonhse/blob/master/Lecture%202.ipynb конспект с комментариями] (начиная с раздела « Присвоение и копирование списков»), [https://nbviewer.jupyter.org/github/ischurov/pythonhse/blob/master/Lecture%203.ipynb#Нумерация-элементов-списка enumerate], [https://nbviewer.jupyter.org/github/ischurov/pythonhse/blob/master/Lecture%205.ipynb#Создание-словарей-и-функция-zip() zip] (часть про словари можно пропустить), [https://gist.github.com/9cbca8b16c7744dcd94113a52676f260 сырой ноутбук с занятия].
 +
| [https://youtu.be/kBu3g-ITjY4?t=2301 видео]
 +
| {{PT}} [http://pythontutor.ru/lessons/for_loop/ цикл for]
 +
| [https://nbviewer.jupyter.org/url/python.math-hse.info/static/assignments_release/nes-datascience2020/ps02/ps02.ipynb ДЗ№2]
 
|}
 
|}
  
 
+
== Программное обеспечение ==  
== Software ==
+
* [https://www.anaconda.com/distribution/ Anaconda] — вам нужна версия с Python 3.7.
During this course we will use R as a programming language and RStudio as a GUI.
+
* Чтобы открыть ipynb-файл в Jupyter Notebook, проще всего его загрузить в рабочий каталог с помощью функции ''upload'' самого Jupyter Notebook. Аналогично, чтобы вытащить файл из Jupyter Notebook, можно использовать функцию ''Download → ipynb''.
 
 
How to install R and RStudio?
 
 
 
1. Download [https://cran.r-project.org/ R] (you can choose another mirror here if you wish) and install it on your computer. Make sure you did it before installing RStudio.
 
 
 
2. Download [https://rstudio.com/products/rstudio/ RStudio] (you need RStudio Desktop Open Source License) and install it on your computer. It is recommended to create a shortcut for RStudio during installation.
 
 
 
It is possible avoid installing anything on your PC, using [https://rstudio.cloud rstudio.cloud] (an online version of RStudio).
 
 
 
For successful submission of assignments you should be able to create and save R code files (.R) and RMarkdown files (.Rmd).
 
 
 
 
 
== Homeworks ==
 
* Homework 1 (deadline: January 25, 12:00), Chapters 1, 2, 3, and 5 of the [https://www.datacamp.com/courses/free-introduction-to-r DataCamp] course "Introduction to R". Please fill in this [https://docs.google.com/forms/d/e/1FAIpQLSdjgKBM5JSo6D6ajhrWWfFG1ktcKgDfbdK_jQ_ZbW9GwNLzpQ/viewform form]. 
 
* Homework 2 (deadline: February 1, 12:00), Chapters 4 and 6 of the [https://www.datacamp.com/courses/free-introduction-to-r DataCamp] course "Introduction to R". 
 
After completing the course please provide either the [https://support.datacamp.com/hc/en-us/articles/360001548814-How-can-I-share-my-certificate-Statement-of-Accomplishment- Statement of Accomplishment] or a screenshot of your learning progress via [link TBA]. 
 
 
 
 
 
== Final project ==
 
Projects description TBA 
 
Projects pre-registration: link to submit your file TBA 
 
Final versions of project papers: link to sumbit your files TBA 
 
 
 
 
 
== References ==
 
* Gries, Stefan (2013). Statistics for Linguistics with R : A Practical Introduction (Vol. 2nd revised edition). Berlin: De Gruyter Mouton. [http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=604318 HSE library link]
 
* Levshina, Natalia (2015). How to Do Linguistics with R : Data Exploration and Statistical Analysis. Amsterdam: John Benjamins Publishing Company. [http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1093048 HSE library link]
 
* Baayen, Harald (2008). Analyzing Linguistic Data: A practical introduction to statistics. Cambridge UP. [http://www.sfs.uni-tuebingen.de/~hbaayen/publications/baayenCUPstats.pdf pdf]
 
 
 
* Gries, Stefan (2017). Quantitative Corpus Linguistics with R : A Practical Introduction (Vol. Second edition). Milton Park, Abingdon, Oxon: Routledge. eBook
 
* Empirical Bayes
 
* Harney, H. L. (2016). Bayesian Inference : Data Evaluation and Decisions (Vol. 2nd ed). Springer. eBook 
 
* McElreath, R. (2016). Statistical Rethinking : A Bayesian Course with Examples in R and Stan. eBook
 
* ggplot2
 
* Hadley, W. (2016). Ggplot2 : Elegant Graphics for Data Analysis. Springer. eBook
 
* R markdown [https://rstudio.com/wp-content/uploads/2015/02/rmarkdown-cheatsheet.pdf Rmd Cheat Sheet
 
 
 
== Course Info ==
 
 
 
This page contains the materials of the course "Linguistic Data: Quantitative Analysis and Visualisation", taught at the HSE Master's program "Computational Linguistics" in 2019-2020 academic year. Modules: 3-4.
 

Версия 15:28, 22 января 2020

  • Курс ведёт Илья Щуров.

Материалы

дата тема конспекты видео дополнительные материалы ДЗ
10 января Первое знакомство. Python как калькулятор конспект с комментариями, сырой ноутбук с занятия (без комментариев) видео PT вычисления, визуализатор Python ДЗ№1
14 января Списки конспект с комментариями (мы прошли до раздела «Присвоение и копирование списков», не включая его), split и join, сырой ноутбук с занятия видео PT списки
21 января Списки и цикл for конспект с комментариями (начиная с раздела « Присвоение и копирование списков»), enumerate, zip (часть про словари можно пропустить), сырой ноутбук с занятия. видео PT цикл for ДЗ№2

Программное обеспечение

  • Anaconda — вам нужна версия с Python 3.7.
  • Чтобы открыть ipynb-файл в Jupyter Notebook, проще всего его загрузить в рабочий каталог с помощью функции upload самого Jupyter Notebook. Аналогично, чтобы вытащить файл из Jupyter Notebook, можно использовать функцию Download → ipynb.