Перейти к основному содержанию
Изображение курса" Модуль 1. Python для анализа данных
Изображение курса
Текст краткого изложения курса:

В этом курсе вы будете изучать основные инструменты и техники работы с данными в Python. Вы научитесь использовать библиотеку NumPy для работы с массивами чисел, получать и предобрабатывать данные с помощью объекта DataFrame, анализировать данные с помощью библиотеки Pandas и выводить статистические результаты.

Курс включает в себя следующие темы, которые вы последовательно изучите в течение четырех недель.

  1. Библиотека NumPy.

  2. Получение и предобработка данных. Первичная работа с объектом DataFrame.

  3. Описательная статистика. Анализ данных с помощью Pandas.

  4. Статистика вывода.

После освоения курса вы:

  • узнаете о возможностях основных библиотек, используемых для анализа данных; 

  • сможете использовать базовые операции по работе с массивами, математические и статистические функции библиотеки NumPy для решения прикладных задач; 

  • сможете решать системы линейных уравнений в Python матричным методом, решать задачи с помощью системы линейных уравнений;

  • вы узнаете виды, источники и способы хранения данных (csv, tsv-файлы и другие); 

  • узнаете структуры данных и инструменты, предоставляемые библиотекой Pandas для работы с данными;

  • сможете получить информацию о DataFrame, вычислить описательные статистики для числовых данных, обратиться к элементам DataFrame по индексу и порядковому номеру, изменить индекс;

  • сможете выполнять поиск, фильтрацию и сортировку DataFrame с применением методов библиотеки Pandas;

  • сможете работать с несколькими таблицами с помощью инструментов библиотеки Pandas;

  • сможете отличать и понимать базовые статистические концепции — генеральная совокупность, выборка; 

  • узнаете, как использовать библиотеки Python для анализа данных в некоторых задачах машинного обучения.

В конце курса нужно будет пройти проверочный тест и задание на оценку.

Продвинутые методы машинного обучения
Изображение курса" Модуль 2. Визуализация данных
Изображение курса
Текст краткого изложения курса:

В этом курсе вы будете рассматривать средства построения графиков и диаграмм, которые помогут вам наглядно представить данные и принять правильные решения на основе анализа данных. Вы научитесь не только проводить анализ данных, но и визуализировать его и готовить отчет в виде интерактивной презентации.

Курс состоит из четырех недель и включает в себя следующие темы.

  1. Введение в визуализацию. Библиотека Matplotlib.

  2. Прикладные инструменты визуализации данных.

  3. Диаграммы в контексте: инфопанели и презентации.

  4. Примеры использования библиотек Python.

После освоения курса вы:

  • узнаете когнитивные законы и принципы восприятия информации человеком;

  • узнаете возможности библиотеки Matplotlib для построения различных видов графиков и настройки их отображения;

  • узнаете об инструментах для визуализации данных, используемых в работе аналитика; 

  • изучите функциональные возможности сервиса Yandex DataLens для построения и настройки графиков;

  • сможете строить некоторые виды графиков в Yandex DataLens; 

  • сможете строить графики и диаграммы с помощью библиотеки Altair, добавлять в графики интерактив и выполнять их настройку; 

  • сможете строить статистические диаграммы с использованием библиотеки Seaborn;

  • сможете создавать презентации на основе диаграмм с помощью движка Reveal.js, встраивая в него диаграммы из Yandex DataLens; 

  • сможете создавать интерактивные инфопанели, применяя функционал библиотеки Altair;

  • сможете выбрать библиотеки Python для решения задачи анализа данных;

  • сможете использовать функциональные возможности нескольких библиотек в одном проекте.

В конце курса вам необходимо пройти проверочный тест и выполнить задание-проект по исследованию данных, по желанию.

Продвинутые методы машинного обучения
Изображение курса" Модуль 3. Введение в машинное обучение
Изображение курса
Текст краткого изложения курса:

В этом курсе мы обзорно рассмотрим основные подходы в машинном обучении и вспомним понятия линейной алгебры, которые пригодятся при более глубоком изучении методов машинного обучения.

Курс состоит из четырех недель и включает в себя следующие темы.

1. Введение в линейную алгебру для машинного обучения.

2. Машинное обучение с учителем: линейные модели, измерение качества модели, ансамблевые модели.

3. Машинное обучение без учителя: методы кластеризации, методы понижения размерности, рекомендательные системы.

4. Нейросети: основы нейронных сетей, архитектуры нейронных сетей.

В конце курса вам необходимо пройти проверочный тест и выполнить практическое задание на оценку. 

После освоения курса вы:

  • сможете применять NumPy для работы с векторами и матрицами; 

  • сможете вычислять косинусную меру близости векторов и использовать ее для нахождения разницы между словами;

  • узнаете виды линейных моделей обучения, метрики измерения качества линейных моделей; 

  • узнаете базовые сведения об ансамблевых моделях и сравните производительность ансамблевых моделей; 

  • сможете строить модели линейной и логистической регрессии с использованием библиотек Python; 

  • сможете рассчитывать метрику качества линейной и логистической регрессии;

  • сможете строить ансамблевые модели — решающее дерево, случайный лес, градиентный бустинг;

  • обзорно познакомитесь с методами кластеризации и методами понижения размерности, принципами построения рекомендательных систем; 

  • сможете реализовать методы кластерного анализа на примере искусственных данных, выполнить расчет оценок качества кластеризации с помощью библиотек Python; 

  • сможете реализовать методы понижения размерности применительно к датасету с помощью Python; 

  • сможете составить матрицу рейтингов с помощью Python и выполнять операции с ней;

  • узнаете основные библиотеки Python, используемые для работы с нейросетями;

  • сможете написать программу для вычисления результата сигмоидальной функции активации для заданных входных данных; 

  • сможете написать код, реализующий свертку изображения и фильтра; 

  • сможете реализовать простую нейросеть, состоящую из одного входного слоя, одного скрытого слоя и одного выходного слоя.

В конце курса вам необходимо пройти проверочный тест и выполнить практическое задание на оценку. 

Продвинутые методы машинного обучения
Accessibility

Background Colour

Font Face

Font Size

1

Text Colour