Перейти к основному содержанию
Перейти к основному содержанию

Ингестия данных

ClickHouse интегрируется с рядом решений для интеграции и трансформации данных. Для получения дополнительной информации ознакомьтесь со страницами ниже:

Инструмент ингестии данныхОписание
AirbyteПлатформа интеграции данных с открытым исходным кодом. Позволяет создавать ELT-конвейеры данных и поставляется с более чем 140 готовыми коннекторами.
Apache SparkМногоязычный движок для выполнения задач дата-инжиниринга, data science и машинного обучения на одноузловых машинах или кластерах.
Apache FlinkСредство для потоковой ингестии и обработки данных в ClickHouse через API DataStream Flink с поддержкой пакетной записи.
Amazon GlueПолностью управляемый бессерверный сервис интеграции данных от Amazon Web Services (AWS), упрощающий процессы обнаружения, подготовки и трансформации данных для аналитики, машинного обучения и разработки приложений.
Azure SynapseПолностью управляемый облачный аналитический сервис от Microsoft Azure, объединяющий Big Data и хранилище данных и упрощающий интеграцию, трансформацию и аналитику данных в масштабе с использованием SQL, Apache Spark и конвейеров данных.
Azure Data FactoryОблачный сервис интеграции данных, который позволяет создавать, планировать и оркестрировать конвейеры обработки данных в масштабе.
Apache BeamУнифицированная модель программирования с открытым исходным кодом, которая позволяет разработчикам задавать и выполнять конвейеры пакетной и потоковой (непрерывной) обработки данных.
BladePipeИнструмент сквозной интеграции данных в режиме реального времени с задержкой менее секунды, обеспечивающий бесшовный обмен данными между платформами.
dbtПозволяет аналитическим инженерам трансформировать данные в их хранилищах, просто записывая select-выражения.
dltБиблиотека с открытым исходным кодом, которую можно добавить в Python-скрипты для загрузки данных из различных и часто «грязных» источников в хорошо структурированные, постоянно обновляемые датасеты.
FivetranПлатформа автоматизированного перемещения данных, обеспечивающая перенос данных из, в и между вашими облачными платформами данных.
NiFiПрограммное обеспечение управления рабочими процессами с открытым исходным кодом, предназначенное для автоматизации потоков данных между программными системами.
VectorВысокопроизводительный конвейер данных наблюдаемости, который позволяет организациям контролировать свои данные наблюдаемости.