Программирование [bigdata team] Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka (2023)

Администратор
Команда форума
Администратор
Модератор
VIP Разбойник
Регистрация
22 Фев 2018
Сообщения
24.605
Реакции
666.957
Монетки
335284.5
    Голосов: 0
    0.0 5 0 0 https://tor15.sharewood.me/threads/bigdata-team-prakticheskij-kurs-po-big-data-chast-3-rt-nosql-data-layout-kafka-2023.210271/
  • #1
Автор: bigdata team
Название: Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka (2023)

1704465930158.png


Описание:

Вы научитесь работать с потоковой обработкой данных, познакомитесь с Kafka и Spark Structured Streaming, освоите NoSQL поверх больших данных, подружите Spark с Cassandra.

Подробнее о каждом модуле и полезных навыках, которые вы освоите в модуле, мы рассказали ниже.

В этом модуле вы изучите:
▶ подходы к Realtime-обработке;
▶ гарантии обработки, переход от одной гарантии к другой, архитектуры "Лямбда" и "Каппа";
▶ Spark Streaming vs. Spark RDD, Spark Structured Streaming vs. Spark DataFrames, DStream;
▶ архитектура Kafka, Kafka Streams, репликация в Kafka. Отличие Kafka от классических очередей;
▶ семантики доставки сообщений, сжатие данных в Kafka, синхронная и асинхронная репликация.
▶ отличия Key-Value хранилищ от реляционных БД;
▶ компактификация и её виды, CQLSH;
▶ архитектура Cassandra;
▶ обеспечение надёжности и высокодоступности в Key-Value хранилищах;
▶ интеграция Spark с Cassandra.
▶ как бороться с Data Skew с помощью MapReduce подходов в разных фреймворках;
▶ trade-off между CPU и IO-bound приложениями, подходы к сжатию в Big Data, горячие и холодные данные;
▶ форматы данных в Big Data: ORC vs Parquet, Avro, ...

Подробнее:
Для просмотра содержимого вам необходимо авторизоваться.

Скачать:
Для просмотра содержимого вам необходимо авторизоваться
 
11
Сверху Снизу