Перейти к основному содержанию
Перейти к основному содержанию

meanZTest

Применяет z-критерий для сравнения средних по выборкам из двух генеральных совокупностей.

Синтаксис

meanZTest(дисперсия_популяции_x, дисперсия_популяции_y, уровень_доверия)(данные_выборки, индекс_выборки)

Значения обеих выборок находятся в столбце sample_data. Если sample_index равен 0, то значение в этой строке относится к выборке первой генеральной совокупности. В противном случае оно относится к выборке второй генеральной совокупности. Нулевая гипотеза состоит в том, что средние значения генеральных совокупностей равны. Предполагается нормальное распределение. Дисперсии генеральных совокупностей могут быть неравны и считаются известными.

Аргументы

  • sample_data — Данные выборки. Integer, Float или Decimal.
  • sample_index — Индекс выборки. Integer.

Параметры

  • population_variance_x — Дисперсия для генеральной совокупности x. Float.
  • population_variance_y — Дисперсия для генеральной совокупности y. Float.
  • confidence_level — Уровень доверия для вычисления доверительных интервалов. Float.

Возвращаемые значения

Tuple из четырех элементов:

  • вычисленная t-статистика. Float64.
  • вычисленное p-значение. Float64.
  • вычисленная нижняя граница доверительного интервала. Float64.
  • вычисленная верхняя граница доверительного интервала. Float64.

Пример

Входная таблица:

┌─sample_data─┬─sample_index─┐
│        20.3 │            0 │
│        21.9 │            0 │
│        22.1 │            0 │
│        18.9 │            1 │
│          19 │            1 │
│        20.3 │            1 │
└─────────────┴──────────────┘

Запрос:

SELECT meanZTest(0.7, 0.45, 0.95)(sample_data, sample_index) FROM mean_ztest

Результат:

┌─meanZTest(0.7, 0.45, 0.95)(sample_data, sample_index)────────────────────────────┐
│ (3.2841296025548123,0.0010229786769086013,0.8198428246768334,3.2468238419898365) │
└──────────────────────────────────────────────────────────────────────────────────┘