Все курсы | Центр «Пуск»

Название курса Модуль 1. Python для анализа данных

В этом курсе вы будете изучать основные инструменты и техники работы с данными в Python. Вы научитесь использовать библиотеку NumPy для работы с массивами чисел, получать и предобрабатывать данные с помощью объекта DataFrame, анализировать данные с помощью библиотеки Pandas и выводить статистические результаты.

Курс включает в себя следующие темы, которые вы последовательно изучите в течение четырех недель.

Библиотека NumPy.
Получение и предобработка данных. Первичная работа с объектом DataFrame.
Описательная статистика. Анализ данных с помощью Pandas.
Статистика вывода.

После освоения курса вы:

узнаете о возможностях основных библиотек, используемых для анализа данных;
сможете использовать базовые операции по работе с массивами, математические и статистические функции библиотеки NumPy для решения прикладных задач;
сможете решать системы линейных уравнений в Python матричным методом, решать задачи с помощью системы линейных уравнений;
вы узнаете виды, источники и способы хранения данных (csv, tsv-файлы и другие);
узнаете структуры данных и инструменты, предоставляемые библиотекой Pandas для работы с данными;
сможете получить информацию о DataFrame, вычислить описательные статистики для числовых данных, обратиться к элементам DataFrame по индексу и порядковому номеру, изменить индекс;
сможете выполнять поиск, фильтрацию и сортировку DataFrame с применением методов библиотеки Pandas;
сможете работать с несколькими таблицами с помощью инструментов библиотеки Pandas;
сможете отличать и понимать базовые статистические концепции — генеральная совокупность, выборка;
узнаете, как использовать библиотеки Python для анализа данных в некоторых задачах машинного обучения.

В конце курса нужно будет пройти проверочный тест и задание на оценку.

Продвинутые методы машинного обучения

Подать заявку на курс

Название курса Модуль 2. Визуализация данных

В этом курсе вы будете рассматривать средства построения графиков и диаграмм, которые помогут вам наглядно представить данные и принять правильные решения на основе анализа данных. Вы научитесь не только проводить анализ данных, но и визуализировать его и готовить отчет в виде интерактивной презентации.

Курс состоит из четырех недель и включает в себя следующие темы.

Введение в визуализацию. Библиотека Matplotlib.
Прикладные инструменты визуализации данных.
Диаграммы в контексте: инфопанели и презентации.
Примеры использования библиотек Python.

После освоения курса вы:

узнаете когнитивные законы и принципы восприятия информации человеком;
узнаете возможности библиотеки Matplotlib для построения различных видов графиков и настройки их отображения;
узнаете об инструментах для визуализации данных, используемых в работе аналитика;
изучите функциональные возможности сервиса Yandex DataLens для построения и настройки графиков;
сможете строить некоторые виды графиков в Yandex DataLens;
сможете строить графики и диаграммы с помощью библиотеки Altair, добавлять в графики интерактив и выполнять их настройку;
сможете строить статистические диаграммы с использованием библиотеки Seaborn;
сможете создавать презентации на основе диаграмм с помощью движка Reveal.js, встраивая в него диаграммы из Yandex DataLens;
сможете создавать интерактивные инфопанели, применяя функционал библиотеки Altair;
сможете выбрать библиотеки Python для решения задачи анализа данных;
сможете использовать функциональные возможности нескольких библиотек в одном проекте.

В конце курса вам необходимо пройти проверочный тест и выполнить задание-проект по исследованию данных, по желанию.

Продвинутые методы машинного обучения

Подать заявку на курс

Название курса Модуль 3. Введение в машинное обучение

В этом курсе мы обзорно рассмотрим основные подходы в машинном обучении и вспомним понятия линейной алгебры, которые пригодятся при более глубоком изучении методов машинного обучения.

Курс состоит из четырех недель и включает в себя следующие темы.

1. Введение в линейную алгебру для машинного обучения.

2. Машинное обучение с учителем: линейные модели, измерение качества модели, ансамблевые модели.

3. Машинное обучение без учителя: методы кластеризации, методы понижения размерности, рекомендательные системы.

4. Нейросети: основы нейронных сетей, архитектуры нейронных сетей.

В конце курса вам необходимо пройти проверочный тест и выполнить практическое задание на оценку.

После освоения курса вы:

сможете применять NumPy для работы с векторами и матрицами;
сможете вычислять косинусную меру близости векторов и использовать ее для нахождения разницы между словами;
узнаете виды линейных моделей обучения, метрики измерения качества линейных моделей;
узнаете базовые сведения об ансамблевых моделях и сравните производительность ансамблевых моделей;
сможете строить модели линейной и логистической регрессии с использованием библиотек Python;
сможете рассчитывать метрику качества линейной и логистической регрессии;
сможете строить ансамблевые модели — решающее дерево, случайный лес, градиентный бустинг;
обзорно познакомитесь с методами кластеризации и методами понижения размерности, принципами построения рекомендательных систем;
сможете реализовать методы кластерного анализа на примере искусственных данных, выполнить расчет оценок качества кластеризации с помощью библиотек Python;
сможете реализовать методы понижения размерности применительно к датасету с помощью Python;
сможете составить матрицу рейтингов с помощью Python и выполнять операции с ней;
узнаете основные библиотеки Python, используемые для работы с нейросетями;
сможете написать программу для вычисления результата сигмоидальной функции активации для заданных входных данных;
сможете написать код, реализующий свертку изображения и фильтра;
сможете реализовать простую нейросеть, состоящую из одного входного слоя, одного скрытого слоя и одного выходного слоя.

В конце курса вам необходимо пройти проверочный тест и выполнить практическое задание на оценку.

Продвинутые методы машинного обучения

Подать заявку на курс

Продвинутые методы машинного обучения

Название курса Модуль 1. Python для анализа данных

Название курса Модуль 2. Визуализация данных

Название курса Модуль 3. Введение в машинное обучение

Адрес

Категории курсов

Навигация