Основы анализа данных в Python: различия между версиями
Строка 32: | Строка 32: | ||
Нарушение свойства репрезентативности и виды смещений. Ошибка выборки (sampling error). | Нарушение свойства репрезентативности и виды смещений. Ошибка выборки (sampling error). | ||
* '''Лекция 1.''' Введение в выборочные обследования ([https://www.dropbox.com/scl/fi/59cl9oqzsz9czmor6xxx9/01.pdf?rlkey=83j6fx7klob3ukjv4iegifrhh&dl=0 слайды], [https://www.dropbox.com/scl/fi/cv87g6pk97vonmqwtdpcq/01-random.ipynb?rlkey=jugubj6jzqbky12f9l33z9954&dl=0 ipynb] с примерами, файл [https://www.dropbox.com/scl/fi/q4haisl9kjckleenpbwzx/students.csv?rlkey=nykrh05054lgb419zvfhrq72b&dl=0 students.csv]). | * '''Лекция 1.''' Введение в выборочные обследования ([https://www.dropbox.com/scl/fi/59cl9oqzsz9czmor6xxx9/01.pdf?rlkey=83j6fx7klob3ukjv4iegifrhh&dl=0 слайды], [https://www.dropbox.com/scl/fi/cv87g6pk97vonmqwtdpcq/01-random.ipynb?rlkey=jugubj6jzqbky12f9l33z9954&dl=0 ipynb] с примерами, файл [https://www.dropbox.com/scl/fi/q4haisl9kjckleenpbwzx/students.csv?rlkey=nykrh05054lgb419zvfhrq72b&dl=0 students.csv]). | ||
− | * '''Практикум 1.''' Модуль random. Обработка данных с pandas ([https://www.dropbox.com/scl/fi/yuzzun71ilswwpdae30zj/practice01.ipynb?rlkey=zrjio5u50h4s7226hwwijw2ty&dl=0 ipynb], [https://www.dropbox.com/scl/fi/q8o5bu620my6ayu7k7ofr/beasts.csv?rlkey=i3mqs0bl46eauc396ei78o4np&dl=0 beasts.csv]). | + | * '''Практикум 1.''' Модуль random. Обработка данных с pandas ([https://www.dropbox.com/scl/fi/yuzzun71ilswwpdae30zj/practice01.ipynb?rlkey=zrjio5u50h4s7226hwwijw2ty&dl=0 ipynb], [https://www.dropbox.com/scl/fi/q8o5bu620my6ayu7k7ofr/beasts.csv?rlkey=i3mqs0bl46eauc396ei78o4np&dl=0 beasts.csv]), решения ([https://www.dropbox.com/scl/fi/txubvjdrfp24s4oo22bni/practice01-solutions.ipynb?rlkey=n4l5xbbrpw6g837ij0k13owi4&dl=0 ipynb]). |
Версия 03:44, 16 сентября 2023
Дорогие студенты!
Это страница обязательного курса «Основы анализа данных в Python», читаемого на программе «Политология» 3 курса бакалавриата в 1-2 модулях 2023-2024 учебного года.
Преподаватель: Тамбовцева Алла Андреевна.
Содержание
Правила игры и план курса
- Программа курса, организационная презентация.
- Формула оценки: 0.21 * Тесты + 0.28 * Домашнее задание + 0.3 * Экзамен + 0.21 * Контрольная работа.
- Подробный план курса, с примерными датами.
- Сопровождающий онлайн-курс «Сбор и анализ данных в Python».
Программное обеспечение
Перед занятиями необходимо установить дистрибутив Anaconda (скачать можно здесь), который включает в себя интерпретатор языка Python, библиотеки для обработки, анализа и визуализации данных, а также среду для работы Jupyter Notebook. Также есть возможность работать в Jupyter Notebook онлайн, используя ресурс Google Colab (для создания и редактирования файлов нужен аккаунт Gmail).
Установка Anaconda и запуск Jupyter Notebook:
- Для установки Anaconda нужно скачать установочный файл для своей системы отсюда, запустить его и следовать инструкциям.
- Среду Jupyter Notebook можно запускать через приложение Anaconda Navigator (находим Anaconda Navigator в списке программ, запускаем, кликаем на кнопку Launch под Jupyter Notebook) и отдельно от него (см. инструкцию).
- Работа в Jupyter Notebook (видео), работа в Google Colab (видео).
- Набор текста в Jupyter (видео, ipynb).
Для тех, кто не работал в Python и Jupyter: можно записаться на вышкинский онлайн-курс «Python как иностранный» (открыт для записи в SmartLMS). Для подготовки рабочего места рекомендуется ознакомиться со следующими материалами в теме 1: Видео. Подготовка рабочего места, инструкция по открытию файлов в Jupyter Notebook, Видео. Первая программа, Задачи для тренировки.
Материалы
Введение в выборочные обследования
Генеральная совокупность и выборка. Репрезентативность выборки. Способы формирования выборок.
Нарушение свойства репрезентативности и виды смещений. Ошибка выборки (sampling error).
- Лекция 1. Введение в выборочные обследования (слайды, ipynb с примерами, файл students.csv).
- Практикум 1. Модуль random. Обработка данных с pandas (ipynb, beasts.csv), решения (ipynb).