approx_top_k
Возвращает массив приблизительно наиболее часто встречающихся значений и количества их вхождений в указанном столбце. Результирующий массив отсортирован по убыванию приблизительной частоты значений (а не по самим значениям).
Эта функция не даёт гарантированного результата. В отдельных случаях возможны ошибки, и она может возвращать часто встречающиеся значения, которые на самом деле не являются самыми частотными.
Максимальное значение N = 65536.
Параметры
N— количество возвращаемых элементов. Необязательный параметр. Значение по умолчанию: 10.reserved— определяет, сколько ячеек зарезервировать под значения. Если uniq(column) > reserved, результат работы функции topK будет приблизительным. Необязательный параметр. Значение по умолчанию: N * 3.
Аргументы
column— значение, для которого вычисляется частота.
Пример
Запрос:
Результат:
approx_top_count
Является синонимом функции approx_top_k
См. также