Анализ данных на Python

Материал из MathINFO
Перейти к навигации Перейти к поиску

Дорогие студенты!

Это страница обязательного курса «Анализ данных на Python», читаемого на программе «Разработка информационных систем для бизнеса»
2 курса бакалавриата в 4 модуле 2023-2024 учебного года.

Занятия ведёт: Тамбовцева Алла Андреевна.

Правила игры

Формула оценки: 0.4 × Лабораторные работы + 0.2 × ДЗ1 + 0.25 × ДЗ2 + 0.15 × ДЗ3.

Пояснения:

  • Лабораторные работы: небольшие домашние задания, обязательные к выполнению к следующему занятию.
    Могут включать задачи на закрепление пройденного материала или задачи, предполагающие самостоятельное
    изучение небольших блоков по основам Python по предложенных материалам (конспекты или видео).
    Всего запланировано 8 лабораторных работ с одинаковым весом.
  • Домашние задания: объёмные домашние задания по итогу нескольких пройденных тем. Представляют собой
    индивидуальные мини-проекты, в которых необходимо поработать с предложенными данными по инструкции
    и проинтерпретировать предложенные результаты.
  • Поздняя сдача лабораторных работ не предусмотрена.
  • Домашние задания, сданные после срока, оцениваются с использованием понижающих коэффициентов:
    опоздание в пределах часа – штраф 10% от полученной оценки, в пределах суток – штраф 30%.
    Домашние задания, сданные позже, не принимаются и не оцениваются.

Среда для работы

Перед занятиями необходимо установить дистрибутив Anaconda (скачать можно здесь), который включает в себя
интерпретатор языка Python, библиотеки для обработки, анализа и визуализации данных, а также среду для работы
Jupyter Notebook. Также есть возможность работать в Jupyter Notebook онлайн, используя ресурс Google Colab
(для создания и редактирования файлов нужен аккаунт Gmail).

Подробности по установке и работе – см. ниже в неделе 0.

Материалы курса

Неделя 0. Напоминания про Python и Jupyter Notebook

Для подготовки к работе на курсе можно ознакомиться со следующими материалами онлайн-курса:

А также с материалами по работе в Jupyter Notebook и Google Colab:

Дополнительно:

Неделя 1. Индексируемые структуры данных в Python

  • «Сырые» ipynb-файлы с занятий: группа 1, группа 2, группа 3, группа 4.
  • Обзор индексируемых структур данных в Python: строки, кортежи, списки (ipynb).
  • Цикл for и его аналоги: списковые включения и функция map() (ipynb).

Дополнительно:

Лабораторная работа 1. Условные конструкции и индексируемые структуры

Для выполнения лабораторной работы необходимо знать формулировку логических выражений
и конструкцию if-elif-else в Python. Для этого (на выбор) можно:

  • Прослушать материал темы 2 Условия и логические выражения онлайн-курса «Python как иностранный».
  • Прочитать конспект лекции Логические выражения и условные конструкции.
  • Изучить материалы онлайн-учебника Pythontutor.

Также могут пригодиться дополнительные материалы по методам на списках из недели 1.

Лабораторная работа Задания Дедлайн Куда сдавать
Лабораторная работа 1 ipynb 13 апреля 11:30 ссылка на Dropbox

Неделя 2. Знакомство с массивами NumPy

  • «Сырые» ipynb-файлы с занятий: пара 1, пара 2.
  • Списки vs массивы (ipynb).
  • Описание выборки, сохранённой в массив (ipynb).

Дополнительно:

Лабораторная работа 2. Работа с массивами, ввод и вывод

Для выполнения лабораторной работы помимо материалов недели 2 необходимо понимать
устройство ввода и вывода в Python и быть знакомыми с методами .split() и .join(). Для этого можно:

  • Прочитать конспект лекции Ввод-вывод и форматирование строк.
  • Прочитать конспект лекции Методы .split() и .join() и разбор задач по этой теме.
Лабораторная работа Задания Дедлайн Куда сдавать
Лабораторная работа 2 ipynb 20 апреля 11:30 ссылка на Dropbox

Неделя 3. Словари, массивы NumPy, датафреймы Pandas

  • Файл к занятию: ipynb.
  • Словари и массивы, последовательности и датафреймы Pandas (ipynb).
  • Введение в датафреймы pandas: загрузка и описание данных (ipynb), файл Salaries.csv.

Дополнительно:

Лабораторная работа 3. Функции и lambda-функции

Для выполнения лабораторной работы помимо материалов недели 3 необходимо уметь писать
пользовательские функции, lambda-функции и сочетать их с другими функциями Python. Для этого можно:

  • Прослушать материал темы 8 Функции (достаточно первого раздела) онлайн-курса «Python как иностранный».
  • Прочитать конспект лекции Функции (для желающих – более подробная лекция И.В.Щурова).
  • Прочитать конспект по lambda-функциям.
Лабораторная работа Задания Дедлайн Куда сдавать
Лабораторная работа 3 ipynb 27 апреля 11:30 ссылка на Dropbox

Неделя 4. Операции с датафреймами Pandas, введение в визуализацию

  • Файл к занятию (ipynb).
  • Операции с датафреймами Pandas, файл Salaries.csv.
  • Практикум по pandas (ipynb), решения (ipynb), файл final.xlsx.

Дополнительно:

Лабораторная работа 4. Методы на строках и работа с txt-файлами

Для выполнения лабораторной работы необходимо самостоятельно познакомиться с обработкой txt-файлов.
Для этого (на выбор) можно:

  • Прослушать материал темы 9 Текстовые файлы и таблицы онлайн-курса «Python как иностранный».
  • Прочитать конспект лекции Чтение и запись txt-файлов (txt-файл здесь).

Также могут пригодиться дополнительные материалы по методам на строках из недели 1.

Лабораторная работа Задания Дедлайн Куда сдавать
Лабораторная работа 4 ipynb 4 мая 23:59 ссылка на Dropbox

Неделя 4*. Обработка текстов и облака слов

Синхронного занятия нет, предлагается видеозапись и конспект.
Данная тема будет включена во вторую часть первого домашнего задания.