Представляем вам практический курс по инструментам и технологиям работы с большими данными. Вы освоите все необходимые навыки машинного обучения для потоковых данных и распределенной среды. В программу включены необходимые знания из областей Data Science и Data Engineering, которые позволят вам обрабатывать большие данные и писать распределенные алгоритмы на Spark.
Содержание: 01. Градиентный спуск и линейные модели
02. Обзор основных методов и метрик машинного обучения
03. Основы программирования на Scala
04. Распределенные хранилища
05. Эволюция параллельных алгоритмов
06. Менеджеры ресурсов в распределенных системах
07. Основы Apache Spark
08. Эволюция параллельных алгоритмов №2
09. Перенос МЛ-алгоритмов в распределенную среду
10. ML в Apache Spark
...
Читать дальше »