Перейти к основному содержанию
Перейти к основному содержанию

quantileDeterministic

Вычисляет приближённый квантиль числовой последовательности данных.

Эта функция использует reservoir sampling с размером резервуара до 8192 и детерминированным алгоритмом выборки. Результат детерминирован (воспроизводим). Чтобы получить точный квантиль, используйте функцию quantileExact.

При использовании нескольких функций quantile* с разными уровнями в одном запросе их внутренние состояния не объединяются (то есть запрос работает менее эффективно, чем мог бы). В этом случае используйте функцию quantiles.

Синтаксис

quantileDeterministic(level)(expr, determinator)

Псевдоним: medianDeterministic.

Аргументы

  • level — Уровень квантиля. Необязательный параметр. Постоянное число с плавающей запятой от 0 до 1. Рекомендуется использовать значение level в диапазоне [0.01, 0.99]. Значение по умолчанию: 0.5. При level=0.5 функция вычисляет медиану.
  • expr — Выражение над значениями столбца, результатом которого являются числовые типы данных, Date или DateTime.
  • determinator — Число, хеш которого используется вместо генератора случайных чисел в алгоритме выборки из резервуара (reservoir sampling), чтобы сделать результат выборки детерминированным. В качестве determinator можно использовать любое детерминированное положительное число, например идентификатор пользователя или идентификатор события. Если одно и то же значение determinator встречается слишком часто, функция работает некорректно.

Возвращаемое значение

  • Приблизительный квантиль указанного уровня.

Тип:

  • Float64 для числового типа данных на входе.
  • Date, если входные значения имеют тип Date.
  • DateTime, если входные значения имеют тип DateTime.

Пример

Входная таблица:

┌─val─┐
│   1 │
│   1 │
│   2 │
│   3 │
└─────┘

Запрос:

SELECT quantileDeterministic(val, 1) FROM t

Результат:

┌─quantileDeterministic(val, 1)─┐
│                           1.5 │
└───────────────────────────────┘

См. также