approx_top_sum
Возвращает массив приблизительно самых частых значений и количества их вхождений в указанном столбце. Полученный массив сортируется в порядке убывания приблизительной частоты значений (не по самим значениям). Дополнительно учитывается вес значения.
Эта функция не гарантирует точный результат. В некоторых ситуациях возможны ошибки, и она может возвращать часто встречающиеся значения, которые не являются самыми частыми.
Максимальное значение параметра N — 65536.
Параметры
N— количество элементов для возврата. Необязательный параметр. Значение по умолчанию: 10.reserved— определяет, сколько ячеек зарезервировать для значений. Если uniq(column) > reserved, результат функции topK будет приближённым. Необязательный параметр. Значение по умолчанию: N * 3.
Аргументы
column— значение, для которого вычисляется частота.weight— вес. Каждое значение учитываетсяweightраз при вычислении частоты. UInt64.
Пример
Запрос:
Результат:
Смотрите также