Поддерживает ли ClickHouse распределённый JOIN?
ClickHouse поддерживает распределённый JOIN на кластере.
Когда данные сорасположены в кластере (например, JOIN выполняется по идентификатору пользователя, который также является ключом шардирования), ClickHouse предоставляет возможность выполнять JOIN без перемещения данных по сети.
Когда данные не сорасположены, ClickHouse позволяет выполнять широковещательный JOIN, при котором части присоединяемых данных рассылаются по узлам кластера.
По состоянию на 2025 год ClickHouse не выполняет алгоритм shuffle-join, который предполагает перераспределение обеих сторон соединения по сети по всему кластеру в соответствии с ключами соединения.