Перейти к основному содержанию
Перейти к основному содержанию

quantileExactWeighted

Точно вычисляет квантиль последовательности числовых данных с учётом веса каждого элемента.

Для получения точного значения все переданные значения объединяются в массив, который затем частично сортируется. Каждое значение учитывается с его весом так, как если бы оно присутствовало weight раз. В алгоритме используется хеш-таблица. Благодаря этому при частом повторении переданных значений функция потребляет меньше ОЗУ, чем quantileExact. Вы можете использовать эту функцию вместо quantileExact, задав вес, равный 1.

При использовании в запросе нескольких функций quantile* с разными уровнями квантилей их внутренние состояния не объединяются (то есть запрос работает менее эффективно, чем мог бы). В этом случае используйте функцию quantiles.

Синтаксис

quantileExactWeighted(level)(expr, weight)

Псевдоним: medianExactWeighted.

Аргументы

  • level — Уровень квантиля. Необязательный параметр. Константа с плавающей запятой от 0 до 1. Рекомендуется использовать значение level в диапазоне [0.01, 0.99]. Значение по умолчанию: 0.5. При level=0.5 функция вычисляет медиану.
  • expr — Выражение над значениями столбца, результатом которого являются числовые типы данных, Date или DateTime.
  • weight — Столбец с весами элементов последовательности. Вес — это количество вхождений значения, представленное беззнаковым целочисленным типом.

Возвращаемое значение

  • Квантиль указанного уровня.

Тип возвращаемого значения:

  • Float64 для числового типа данных на входе.
  • Date, если входные значения имеют тип Date.
  • DateTime, если входные значения имеют тип DateTime.

Пример

Входная таблица:

┌─n─┬─val─┐
│ 0 │   3 │
│ 1 │   2 │
│ 2 │   1 │
│ 5 │   4 │
└───┴─────┘

Запрос:

SELECT quantileExactWeighted(n, val) FROM t

Результат:

┌─quantileExactWeighted(n, val)─┐
│                             1 │
└───────────────────────────────┘

См. также