vitastor/docs/config/network.ru.md

13 KiB
Raw Blame History

ДокументацияКонфигурация → Параметры сетевого протокола


Read in English

Параметры сетевого протокола

Данные параметры используются клиентами и OSD и влияют на логику сетевого взаимодействия между клиентами, OSD, а также etcd.

tcp_header_buffer_size

  • Тип: целое число
  • Значение по умолчанию: 65536

Размер буфера для чтения данных с дополнительным копированием. Пакеты Vitastor содержат 128-байтные заголовки, за которыми следуют данные размером от 4 КБ и для мелких операций ввода-вывода обычно выгодно за 1 вызов читать сразу несколько пакетов, даже не смотря на то, что это требует лишний раз скопировать данные. Часть каждого пакета за пределами значения данного параметра читается без дополнительного копирования. Вы можете попробовать поменять этот параметр и посмотреть, как он влияет на производительность случайного и линейного доступа.

use_sync_send_recv

  • Тип: булево (да/нет)
  • Значение по умолчанию: false

Если установлено в истину, то вместо io_uring для передачи данных по сети будут использоваться обычные синхронные системные вызовы send/recv. Для OSD это бессмысленно, так как OSD в любом случае нуждается в io_uring, но, в принципе, это может применяться для клиентов со старыми версиями ядра.

use_rdma

  • Тип: булево (да/нет)
  • Значение по умолчанию: true

Пытаться использовать RDMA для связи при наличии доступных устройств. Отключите, если вы не хотите, чтобы Vitastor использовал RDMA. TCP-клиенты также могут работать с RDMA-кластером, так что отключать RDMA может быть нужно только если у клиентов есть RDMA-устройства, но они не имеют соединения с кластером Vitastor.

rdma_device

  • Тип: строка

Название RDMA-устройства для связи с Vitastor OSD (например, "rocep5s0f0"). Имейте в виду, что поддержка RDMA в Vitastor требует функций устройства Implicit On-Demand Paging (Implicit ODP) и Scatter/Gather (SG). Например, адаптеры Mellanox ConnectX-3 и более старые не поддерживают Implicit ODP и потому не поддерживаются в Vitastor. Запустите ibv_devinfo -v от имени суперпользователя, чтобы посмотреть список доступных RDMA-устройств, их параметры и возможности.

Обратите внимание, что если вы используете RoCE/RoCEv2, вам также необходимо правильно настроить для него коммутаторы, иначе вы можете столкнуться с нестабильной производительностью. Подробную информацию о настройке коммутатора для RoCEv2 ищите в документации производителя. Обычно это подразумевает настройку сети без потерь на основе PFC (Priority Flow Control) и ECN (Explicit Congestion Notification).

rdma_port_num

  • Тип: целое число
  • Значение по умолчанию: 1

Номер порта RDMA-устройства, который следует использовать. Имеет смысл только для устройств, у которых более 1 порта. Чтобы узнать, сколько портов у вашего адаптера, посмотрите phys_port_cnt в выводе команды ibv_devinfo -v.

rdma_gid_index

  • Тип: целое число
  • Значение по умолчанию: 0

Номер глобального идентификатора адреса RDMA-устройства, который следует использовать. Разным gid_index могут соответствовать разные протоколы связи: RoCEv1, RoCEv2, iWARP. Чтобы понять, какой нужен вам - смотрите строчки со словом "GID" в выводе команды ibv_devinfo -v.

ВАЖНО: Если вы хотите использовать RoCEv2 (как мы и рекомендуем), то правильный rdma_gid_index, как правило, 1 (IPv6) или 3 (IPv4).

rdma_mtu

  • Тип: целое число
  • Значение по умолчанию: 4096

Максимальная единица передачи (Path MTU) для RDMA. Должно быть равно 1024, 2048 или 4096. Обычно нет смысла менять значение по умолчанию, равное 4096.

rdma_max_sge

  • Тип: целое число
  • Значение по умолчанию: 128

Максимальное число записей разделения/сборки (scatter/gather) для RDMA. OSD в любом случае согласовывают реальное значение при установке соединения, так что менять этот параметр обычно не нужно.

rdma_max_msg

  • Тип: целое число
  • Значение по умолчанию: 132096

Максимальный размер одной RDMA-операции отправки или приёма.

rdma_max_recv

  • Тип: целое число
  • Значение по умолчанию: 16

Максимальное число буферов для RDMA-приёма данных на одно соединение (RDMA требует заранее выделенных буферов для приёма данных). Каждый буфер имеет размер rdma_max_msg байт. Таким образом, настройка прямо влияет на потребление памяти - один Vitastor-клиент с RDMA использует rdma_max_recv * rdma_max_msg * ЧИСЛО_OSD байт памяти, по умолчанию - примерно 2 МБ * число OSD.

rdma_max_send

  • Тип: целое число
  • Значение по умолчанию: 8

Максимальное число RDMA-операций отправки, отправляемых в очередь одного соединения. Желательно, чтобы оно было меньше rdma_max_recv, чтобы у принимающей стороны в процессе работы не заканчивались буферы на приём. Не влияет на потребление памяти - дополнительная память на операции отправки не выделяется.

peer_connect_interval

  • Тип: секунды
  • Значение по умолчанию: 5
  • Минимальное значение: 1

Время ожидания перед повторной попыткой соединиться с недоступным OSD.

peer_connect_timeout

  • Тип: секунды
  • Значение по умолчанию: 5
  • Минимальное значение: 1

Максимальное время ожидания попытки соединения с OSD.

osd_idle_timeout

  • Тип: секунды
  • Значение по умолчанию: 5
  • Минимальное значение: 1

Время неактивности соединения с OSD, после которого клиенты или другие OSD посылают запрос проверки состояния соединения.

osd_ping_timeout

  • Тип: секунды
  • Значение по умолчанию: 5
  • Минимальное значение: 1

Максимальное время ожидания ответа на запрос проверки состояния соединения. Если OSD не отвечает за это время, соединение отключается и производится повторная попытка соединения.

up_wait_retry_interval

  • Тип: миллисекунды
  • Значение по умолчанию: 500
  • Минимальное значение: 50

Когда OSD получают от клиентов запросы ввода-вывода, относящиеся к не поднятым на данный момент на них PG, либо к PG в процессе синхронизации, они отвечают клиентам специальным кодом ошибки, означающим, что клиент должен некоторое время подождать перед повторением запроса. Именно это время ожидания задаёт данный параметр.

max_etcd_attempts

  • Тип: целое число
  • Значение по умолчанию: 5

Максимальное число попыток выполнения запросов к etcd для тех запросов, которые нельзя повторять бесконечно.

etcd_quick_timeout

  • Тип: миллисекунды
  • Значение по умолчанию: 1000

Максимальное время выполнения запросов к etcd, которые должны завершаться быстро, таких, как обновление резервации (lease).

etcd_slow_timeout

  • Тип: миллисекунды
  • Значение по умолчанию: 5000

Максимальное время выполнения запросов к etcd, для которых не обязательно гарантировать быстрое выполнение.

etcd_keepalive_timeout

  • Тип: секунды
  • Значение по умолчанию: max(30, etcd_report_interval*2)

Таймаут для HTTP Keep-Alive в соединениях к etcd. Должен быть больше, чем etcd_report_interval, чтобы keepalive гарантированно работал.

etcd_ws_keepalive_timeout

  • Тип: секунды
  • Значение по умолчанию: 30

Интервал проверки живости вебсокет-подключений к etcd.

client_dirty_limit

  • Тип: целое число
  • Значение по умолчанию: 33554432

При работе без immediate_commit=all - это лимит объёма "грязных" (не зафиксированных fsync-ом) данных, при достижении которого клиент будет принудительно вызывать fsync и фиксировать данные. Также стоит иметь в виду, что в этом случае до момента fsync клиент хранит копию незафиксированных данных в памяти, то есть, настройка влияет на потребление памяти клиентами.

Параметр не влияет на сами OSD.