Продвинутые методы машинного обучения
В этом курсе вы будете изучать основные инструменты и техники работы с данными в Python. Вы научитесь использовать библиотеку NumPy для работы с массивами чисел, получать и предобрабатывать данные с помощью объекта DataFrame, анализировать данные с помощью библиотеки Pandas и выводить статистические результаты.
Курс включает в себя следующие темы, которые вы последовательно изучите в течение четырех недель.
-
Библиотека NumPy.
-
Получение и предобработка данных. Первичная работа с объектом DataFrame.
-
Описательная статистика. Анализ данных с помощью Pandas.
-
Статистика вывода.
После освоения курса вы:
-
узнаете о возможностях основных библиотек, используемых для анализа данных;
-
сможете использовать базовые операции по работе с массивами, математические и статистические функции библиотеки NumPy для решения прикладных задач;
-
сможете решать системы линейных уравнений в Python матричным методом, решать задачи с помощью системы линейных уравнений;
-
вы узнаете виды, источники и способы хранения данных (csv, tsv-файлы и другие);
-
узнаете структуры данных и инструменты, предоставляемые библиотекой Pandas для работы с данными;
-
сможете получить информацию о DataFrame, вычислить описательные статистики для числовых данных, обратиться к элементам DataFrame по индексу и порядковому номеру, изменить индекс;
-
сможете выполнять поиск, фильтрацию и сортировку DataFrame с применением методов библиотеки Pandas;
-
сможете работать с несколькими таблицами с помощью инструментов библиотеки Pandas;
-
сможете отличать и понимать базовые статистические концепции — генеральная совокупность, выборка;
-
узнаете, как использовать библиотеки Python для анализа данных в некоторых задачах машинного обучения.
В конце курса нужно будет пройти проверочный тест и задание на оценку.
В этом курсе вы будете рассматривать средства построения графиков и диаграмм, которые помогут вам наглядно представить данные и принять правильные решения на основе анализа данных. Вы научитесь не только проводить анализ данных, но и визуализировать его и готовить отчет в виде интерактивной презентации.
Курс состоит из четырех недель и включает в себя следующие темы.
-
Введение в визуализацию. Библиотека Matplotlib.
-
Прикладные инструменты визуализации данных.
-
Диаграммы в контексте: инфопанели и презентации.
-
Примеры использования библиотек Python.
После освоения курса вы:
-
узнаете когнитивные законы и принципы восприятия информации человеком;
-
узнаете возможности библиотеки Matplotlib для построения различных видов графиков и настройки их отображения;
-
узнаете об инструментах для визуализации данных, используемых в работе аналитика;
-
изучите функциональные возможности сервиса Yandex DataLens для построения и настройки графиков;
-
сможете строить некоторые виды графиков в Yandex DataLens;
-
сможете строить графики и диаграммы с помощью библиотеки Altair, добавлять в графики интерактив и выполнять их настройку;
-
сможете строить статистические диаграммы с использованием библиотеки Seaborn;
-
сможете создавать презентации на основе диаграмм с помощью движка Reveal.js, встраивая в него диаграммы из Yandex DataLens;
-
сможете создавать интерактивные инфопанели, применяя функционал библиотеки Altair;
-
сможете выбрать библиотеки Python для решения задачи анализа данных;
-
сможете использовать функциональные возможности нескольких библиотек в одном проекте.
В конце курса вам необходимо пройти проверочный тест и выполнить задание-проект по исследованию данных, по желанию.
В этом курсе мы обзорно рассмотрим основные подходы в машинном обучении и вспомним понятия линейной алгебры, которые пригодятся при более глубоком изучении методов машинного обучения.
Курс состоит из четырех недель и включает в себя следующие темы.
1. Введение в линейную алгебру для машинного обучения.
2. Машинное обучение с учителем: линейные модели, измерение качества модели, ансамблевые модели.
3. Машинное обучение без учителя: методы кластеризации, методы понижения размерности, рекомендательные системы.
4. Нейросети: основы нейронных сетей, архитектуры нейронных сетей.
В конце курса вам необходимо пройти проверочный тест и выполнить практическое задание на оценку.
После освоения курса вы:
-
сможете применять NumPy для работы с векторами и матрицами;
-
сможете вычислять косинусную меру близости векторов и использовать ее для нахождения разницы между словами;
-
узнаете виды линейных моделей обучения, метрики измерения качества линейных моделей;
-
узнаете базовые сведения об ансамблевых моделях и сравните производительность ансамблевых моделей;
-
сможете строить модели линейной и логистической регрессии с использованием библиотек Python;
-
сможете рассчитывать метрику качества линейной и логистической регрессии;
-
сможете строить ансамблевые модели — решающее дерево, случайный лес, градиентный бустинг;
-
обзорно познакомитесь с методами кластеризации и методами понижения размерности, принципами построения рекомендательных систем;
-
сможете реализовать методы кластерного анализа на примере искусственных данных, выполнить расчет оценок качества кластеризации с помощью библиотек Python;
-
сможете реализовать методы понижения размерности применительно к датасету с помощью Python;
-
сможете составить матрицу рейтингов с помощью Python и выполнять операции с ней;
-
узнаете основные библиотеки Python, используемые для работы с нейросетями;
-
сможете написать программу для вычисления результата сигмоидальной функции активации для заданных входных данных;
-
сможете написать код, реализующий свертку изображения и фильтра;
-
сможете реализовать простую нейросеть, состоящую из одного входного слоя, одного скрытого слоя и одного выходного слоя.
В конце курса вам необходимо пройти проверочный тест и выполнить практическое задание на оценку.
Background Colour
Font Face
Font Size
Text Colour