Loading...
Error

Н.А. Бутаков и др. - Обработка больших данных с Apache Spark [2019 г., программирование, PDF, DJVU] RUS

Статистика раздачи
Размер:  13 MB   |    Зарегистрирован:  5 месяцев 20 дней   |    Скачан:  6 раз

Полного источника не было: 11 дней

Сидов:  0  |  0 KB/s  ]   Личеров:  0  |  0 KB/s  ]

* - сиды/пиры с внешних источников

   
 
Автор Сообщение

Паукан Пол:Муж

30-Апр-2019 16:13

Н.А. Бутаков и др. - Обработка больших данных с Apache Spark (2019) [PDF, DJVU]

Автор: Н.А. Бутаков, М.В. Петров, Д. Насонов
Издательство: СПб: Университет ИТМО
Жанр: Программирование
Формат: PDF, DJVU
Качество: PDF-Изначально электронное (ebook)/DJVU-Хороший скан
Иллюстрации: Цветные

Описание:
Учебно-методическое пособие содержит теоретический материал и примеры выполнения задач для курса «Введение в технологии обработки больших данных». Пособие составлено с учётом проведения лабораторных работ с помощью фреймворка Apache Spark. Содержание дисциплины охватывает круг вопросов, связанных с организацией построения ETL-конвейеров на основе Spark SQL и DataFrame API для распределенного выполнения на кластерных вычислительных системах, включая использование итеративных вычислений, важных для машинного обучения, рассмотрения shuffle механизмов и принципов организации управлением памятью в Spark. В результате освоения дисциплины студенты приобретают способности разработки программ и построения конвейеров обработки различных данных, навыки по работе с распределенными кластерными системами, а также способности к применению машинного обучения на распределенных наборах данных.
Введение
Архитектура распределенного приложения Spark
Основные концепции Spark
RDD и граф преобразований
Основные этапы обработки данных
Загрузка данных из внешнего хранилища
Изменение размещения данных и количества партиций
Как происходит вычисление над данными в Spark
Ветвление и итеративные вычисления
Shuffle механизм
Управление памятью в Apache Spark
DataFrame API и Spark SQL
Датафреймы
Начало работы с DataFrame API: SparkSession
Использование пользовательских функций (UDF)
Пользовательские функции агрегации
Создание, настройка и запуск Spark проекта
Настройка окружения
Создание нового проекта
Запуск Scala проекта в Intellij Idea
Первое Spark приложение
Заключение
Список литературы

Скриншоты:
pic pic pic pic

Этот торрент недоступен для скачивания без регистрации, однако доступен по публичной magnet-ссылке (источники с публичных трекеров). Перед использованием ссылки прочтите, пожалуйста Пользовательское соглашение, а также как можно дольше оставайтесь на раздаче! Для того, чтобы скачать сам торрент-файл (который видит больше источников), а также для того, чтобы поблагодарить релизера, вам необходимо зарегистрироваться. Если регистрироваться лень - вы можете также попробовать скачать релиз по нашим партнерским ссылкам ниже. Кроме того, зарегистрированным пользователям не показывается всплывающая реклама при скачивании.

[underverse.name].t132010.torrent
Трекер: Зарегистрирован   [ 30.04.2019 16:13 ]  

Статус: проверено (by Паукан at 30.04.2019 16:14)
Поблагодарили: пока никто не поблагодарил...
Тип торрента: публичный - доступные источники с открытых трекеров: 
Размер: 13 MB (занимает 0 DVDR, для записи нужно 1 болванка DVDR/RW)
 
 

Яндекс.Метрика powered by Sphinx


В Н И М А Н И Е
Сайт не распространяет и не хранит электронные версии произведений, а лишь бесплатно и без коммерческой выгоды (не требуя взамен платы,
SMS и т.д.) предоставляет доступ к создаваемому пользователями каталогу ссылок на торрент-файлы, которые содержат только списки хеш-сумм.
Убедительная просьба с жалобами обращаться напрямую к пользователю, разместившему торрент файл.

Вверх