Основы анализа данных в Python: различия между версиями

Версия 19:02, 6 ноября 2024

Дорогие студенты!

Это страница курса «Основы анализа данных в Python», читаемого во 2 модуле 2024-2025 учебного года на ОП «Политология».

Преподаватель: Тамбовцева Алла Андреевна.

Содержание

1 Правила игры
2 Программное обеспечение
3 Материалы курса
- 3.1 Неделя 1. Шкалы данных. Описание данных.
4 Learning outcomes

Правила игры

Программа курса, организационная презентация.
Формула оценки: 0.25 * Тесты + 0.25 * Практикум + 0.5 * Экзамен.
Цель курса – подготовка к независимому экзамену по анализу данных. Демоверсию экзамена и тренировочные варианты можно
найти здесь в разделе Материалы для подготовки – Анализ данных. Базовый уровень (запись на курс в SmartLMS).
Курс включает темы, пройденные ранее в рамках обязательных курсов по ТВиМС и регрессионному анализу, поэтому теоретический материал
изучается (=повторяется) самостоятельно по предложенным материалам и в рамках онлайн-курса «Сбор и анализ данных в Python».
Демоверсия НЭ (ML – темы, относящиеся к машинному обучению, ML* – темы, которые не были затронуты в предыдущих обязательных курсах).

Программное обеспечение

В рамках этого курса мы будем использовать язык Python и среду разработки Jupyter Notebook.
Также есть возможность работать в аналоге Jupyter Notebook онлайн, используя ресурс Google Colab
(для создания и редактирования файлов нужен аккаунт Gmail).

NB. На независимом экзамене не разрешается использовать облачные ресурсы, включая Google Colab.

Если у вас ничего не установлено или вы успели «удалить весь Python», перед занятиями необходимо
установить дистрибутив Anaconda (скачать можно здесь, регистрацию можно пропустить), который
включает в себя интерпретатор языка Python, библиотеки для обработки, анализа и визуализации
данных, а также среду для работы Jupyter Notebook.

Материалы по работе в Jupyter Notebook и Google Colab:

Запуск Jupyter без Anaconda Navigator (инструкция).
Работа в Jupyter Notebook (видео), отличия Google Colab от Jupyter (видео).

Дополнительно для желающих:

Набор текста в Jupyter Notebook (видео, ipynb), больше о Markdown.
LaTeX: Overleaf, документация, материалы по LaTeX.

Материалы курса

Неделя 1. Шкалы данных. Описание данных.

Шкалы данных (слайды).
Практикум 1. Массивы NumPy (w01-practice.ipynb), решения (w01-practice-solutions.ipynb).
Описательные статистики (слайды, самостоятельное изучение).
Необязательное домашнее задание №1 (hw01.ipynb).

Дополнительно:

Введение в Python (qd-01-intro-python.ipynb), разбор практикума по введению в Python (qd-practice01-solutions.ipynb).
Последовательности: строки, списки, массивы Numpy (qd-02-lists-arrays.ipynb).

Learning outcomes

Неделя	Теория	Практика
№ 1	уметь определять шкалы данных; знать, что такое выборочная медиана и квартили, дисперсия и стандартное отклонение; знать особенности среднего и медианы и уметь делать предположения о наличии потенциально нехарактерных значений в выборке	уметь импортировать библиотеки, уметь создавать массивы Numpy на основе списков, уметь выполнять фильтрацию значений массивов, уметь считать объем, среднее и стандартное отклонение выборки, сохраненной в массив

@@ Строка 15: / Строка 15: @@
 == Программное обеспечение ==
-В рамках этого курса мы будем использовать язык '''Python''' и среду разработки '''Jupyter Notebook'''. Также есть возможность работать в аналоге Jupyter Notebook онлайн, используя ресурс [https://colab.research.google.com/ Google Colab] (для создания и редактирования файлов нужен аккаунт Gmail).
+В рамках этого курса мы будем использовать язык '''Python''' и среду разработки '''Jupyter Notebook'''. <br>Также есть возможность работать в аналоге Jupyter Notebook онлайн, используя ресурс [https://colab.research.google.com/ Google Colab] <br>(для создания и редактирования файлов нужен аккаунт Gmail).
 '''NB.''' На независимом экзамене не разрешается использовать облачные ресурсы, включая Google Colab.
-Если у вас ничего не установлено или вы успели «удалить весь Python», перед занятиями необходимо установить дистрибутив '''Anaconda''' (скачать можно [https://www.anaconda.com/download здесь], регистрацию можно пропустить), который включает в себя интерпретатор языка Python, библиотеки для обработки, анализа и визуализации данных, а также среду для работы Jupyter Notebook.
+Если у вас ничего не установлено или вы успели «удалить весь Python», перед занятиями необходимо <br>установить дистрибутив '''Anaconda''' (скачать можно [https://www.anaconda.com/download здесь], регистрацию можно пропустить), который <br>включает в себя интерпретатор языка Python, библиотеки для обработки, анализа и визуализации <br>данных, а также среду для работы Jupyter Notebook.
 Материалы по работе в Jupyter Notebook и Google Colab:

Основы анализа данных в Python: различия между версиями

Версия 19:02, 6 ноября 2024

Содержание

Правила игры

Программное обеспечение

Материалы курса

Неделя 1. Шкалы данных. Описание данных.

Learning outcomes

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Заглавная

Школа лингвистики

Политология

Факультет креативных индустрий

ОП Вычислительные социальные науки

Архив

Инструменты