DataLakeCatalog
Движок базы данных DataLakeCatalog позволяет подключить ClickHouse к внешним
каталогам данных и выполнять запросы к данным в открытых табличных форматах без необходимости дублирования данных.
Это превращает ClickHouse в мощный движок запросов, который бесшовно работает
с инфраструктурой вашего существующего дата-лейка.
Поддерживаемые каталоги
Движок DataLakeCatalog поддерживает следующие каталоги данных:
- AWS Glue Catalog — для таблиц Iceberg в средах AWS
- Databricks Unity Catalog — для таблиц Delta Lake и Iceberg
- Hive Metastore — традиционный каталог экосистемы Hadoop
- REST Catalogs — любой каталог, поддерживающий спецификацию REST для Iceberg
Создание базы данных
Чтобы использовать движок DataLakeCatalog, необходимо включить приведённые ниже настройки:
Базы данных с движком DataLakeCatalog можно создавать с помощью следующего синтаксиса:
Поддерживаются следующие настройки:
| Setting | Description |
|---|---|
catalog_type | Тип каталога: glue, unity (Delta), rest (Iceberg), hive, onelake (Iceberg) |
warehouse | Имя хранилища/базы данных, которое будет использоваться в каталоге. |
catalog_credential | Учетные данные для аутентификации в каталоге (например, API-ключ или токен) |
auth_header | Пользовательский HTTP-заголовок для аутентификации в сервисе каталога |
auth_scope | Область действия OAuth2 для аутентификации (если используется OAuth) |
storage_endpoint | URL конечной точки базового хранилища |
oauth_server_uri | URI сервера авторизации OAuth2 для аутентификации |
vended_credentials | Логический флаг, указывающий, использовать ли выдаваемые учетные данные (специфично для AWS) |
aws_access_key_id | Идентификатор ключа доступа AWS для доступа к S3/Glue (если не используются выдаваемые учетные данные) |
aws_secret_access_key | Секретный ключ доступа AWS для доступа к S3/Glue (если не используются выдаваемые учетные данные) |
region | Регион AWS для сервиса (например, us-east-1) |
Примеры
Ниже приведены примеры использования движка DataLakeCatalog:
- Unity Catalog
- Glue Catalog
- OneLake Catalog
может использоваться при включенииallow_experimental_database_icebergилиallow_database_iceberg.