Модуль 1. Python для анализа данных
Варианты зачисления на курс
В этом курсе вы будете изучать основные инструменты и техники работы с данными в Python. Вы научитесь использовать библиотеку NumPy для работы с массивами чисел, получать и предобрабатывать данные с помощью объекта DataFrame, анализировать данные с помощью библиотеки Pandas и выводить статистические результаты.
Курс включает в себя следующие темы, которые вы последовательно изучите в течение четырех недель.
-
Библиотека NumPy.
-
Получение и предобработка данных. Первичная работа с объектом DataFrame.
-
Описательная статистика. Анализ данных с помощью Pandas.
-
Статистика вывода.
После освоения курса вы:
-
узнаете о возможностях основных библиотек, используемых для анализа данных;
-
сможете использовать базовые операции по работе с массивами, математические и статистические функции библиотеки NumPy для решения прикладных задач;
-
сможете решать системы линейных уравнений в Python матричным методом, решать задачи с помощью системы линейных уравнений;
-
вы узнаете виды, источники и способы хранения данных (csv, tsv-файлы и другие);
-
узнаете структуры данных и инструменты, предоставляемые библиотекой Pandas для работы с данными;
-
сможете получить информацию о DataFrame, вычислить описательные статистики для числовых данных, обратиться к элементам DataFrame по индексу и порядковому номеру, изменить индекс;
-
сможете выполнять поиск, фильтрацию и сортировку DataFrame с применением методов библиотеки Pandas;
-
сможете работать с несколькими таблицами с помощью инструментов библиотеки Pandas;
-
сможете отличать и понимать базовые статистические концепции — генеральная совокупность, выборка;
-
узнаете, как использовать библиотеки Python для анализа данных в некоторых задачах машинного обучения.
В конце курса нужно будет пройти проверочный тест и задание на оценку.
Background Colour
Font Face
Font Size
Text Colour