Изменения

Производительность Ceph

28 байтов добавлено, 23:24, 24 марта 2019
Нет описания правки
Блюстор — «новое» хранилище. От «нового» хранилища честно ожидаешь лучшей или хотя бы не худшей производительности в любых сценариях.
И таки да, при линейной записи Bluestore фактически в 2 раза быстрее Filestore - Filestore — двойную запись там честно ликвидировали, крупные блоки пишутся только 1 раз — сразу на устройство, а не 2 (в журнал и потом на устройство).
Но вот со случайной записью всё не так однозначно.
* В HDD-only конфигурациях (по крайней мере, если "снять ручник" «снять ручник» https://tracker.ceph.com/issues/38559) по random 4k write iops Bluestore тоже в честных 2 раза быстрее, чем Filestore.* В HDD+SSD кластерах производительность у Bluestore идеально стабильная, но сильно меньшая, чем у Filestore в пике. От блюстора невозможно добиться "сглаживания пиков" «сглаживания пиков» случайной записи через SSD-журнал. Он устроен так, что отказывается писать быстрее, чем в среднем может писать HDD. То есть даже с SSD-журналом вы получите лишь 100-200 100—200 iops с 1 диска - диска — в то время, как в Filestore, пока в журнале есть место, можно иметь 1000-2000 1000—2000 iops.*: И проблема не только в том, что параметры по умолчанию - умолчанию — deferred_batch_ops и max_deferred_txc - max_deferred_txc — задают частый сброс операций на медленный диск (раз в 64 операции). Проблема ещё в том, что в Bluestore отсутствуют механизмы фоновой очистки "журнала" «журнала» (очереди отложенной записи). Поэтому, когда очередь забивается, производительность просто падает до HDD-шной до перезапуска OSD. Ну и сама очередь находится в RocksDB, поэтому сильно поднимать её размер, по идее, неполезно.* В All-Flash кластерах (то есть, на быстрых дисках) Bluestore латентнее Filestore, возможно, на 30-5050 %. Однако эти 30-5050 % относятся к latency именно самого блюстора, в абсолютном выражении составляют ~0.1 мс и на фоне общей задержки Ceph-а практически не заметны. Кроме того, latency ничего не говорит о параллельной пиковой пропускной способности, а она по крайней мере не хуже, чем в Filestore (обычно чуть лучше, +5..1010 %). Жор CPU тоже чуть меньше.
Как это полечить?