Выставки/Фестивали

Курс "HIVE: Hadoop SQL администратор Hive"

Интернет

Отзывов: 0

Завершилось 16 дек 2020
ещё события

Time4
07-ноя-2020 23:05 / Всем

Описание мероприятия
Основные концепции Apache Hive. Архитектура Hive. Инструменты администриования и исполнения запросов: beeline/Hive shell & HUE Query Editor. Схема чтения и записи в Hive. Структура и формат хранения файлов HIVE. Синтаксис HiveQL. Hive DDL и DML операции. Импорт и экспорт в Apache Hive. Загрузка данных в таблицы Hive. Внешние и управляемые таблицы в HiveQL. Оптимизации производительности с использование Partition, Buckets. Импорт/экспорт данных БД. Форматы хранения данных и применение компрессии. Реализация JOIN в Hive. Map JOIN. Comon JOIN. Skewed JOIN. Collocated JOIN. Advanced HiveQL и Hadoop SQL. Интеграция Hive с Pig, Impala, Hbase, Spark, Sqoop. Thrift сервер. User Defined Functions. Hive на Spark. Hive на Tez. Сценарии применения Hive. Практические лабораторные работы на кластере в AWS по настройке партиционирования больших данных на файловой системе HDFS, оптимизация исполнения запросов и интеграция с существующими решениями Cloudera Impala, HBase, Spark SQL и Sqoop.