Перейти к основному содержанию
Перейти к основному содержанию

Npy

InputOutputAlias

Описание

Формат Npy предназначен для загрузки массива NumPy из файла .npy в ClickHouse. Формат файла NumPy — это бинарный формат, используемый для эффективного хранения массивов числовых данных. Во время импорта ClickHouse рассматривает внешнюю размерность массива как массив строк с одним столбцом.

В таблице ниже приведены поддерживаемые типы данных Npy и соответствующие им типы в ClickHouse:

Соответствие типов данных

Тип данных Npy (INSERT)Тип данных ClickHouseТип данных Npy (SELECT)
i1Int8i1
i2Int16i2
i4Int32i4
i8Int64i8
u1, b1UInt8u1
u2UInt16u2
u4UInt32u4
u8UInt64u8
f2, f4Float32f4
f8Float64f8
S, UStringS
FixedStringS

Пример использования

Сохранение массива в формате .npy на Python

import numpy as np
arr = np.array([[[1],[2],[3]],[[4],[5],[6]]])
np.save('example_array.npy', arr)

Чтение файлов NumPy в ClickHouse

SELECT *
FROM file('example_array.npy', Npy)
┌─array─────────┐
│ [[1],[2],[3]] │
│ [[4],[5],[6]] │
└───────────────┘

Выбор данных

Вы можете выбрать данные из таблицы ClickHouse и сохранить их в файл формата Npy с помощью следующей команды clickhouse-client:

$ clickhouse-client --query="SELECT {column} FROM {some_table} FORMAT Npy" > {filename.npy}

Настройки формата