Изменения

Перейти к: навигация, поиск

Производительность Ceph

200 байтов добавлено, 18:16, 20 марта 2020
Нет описания правки
* На уровне RADOS снапшоты свои и их уже 2 вида: снапшоты пулов и снапшоты объектов.
* На уровне RBD тоже свои снапшоты, причём они отличаются от RADOS-снапшотов, хоть внутри и реализованы частично через них. RBD снапшоты, можно сказать, неюзабельны ни для чего, кроме быстрого снятия бэкапов, за которым тут же следует удаление снапшота. Откат к RBD снапшотам очень медленный и реализован не просто ужасно, а отвратительно — отвратительно — копированием содержимого снапшота поверх образа, ''даже неизменённых частей''. Кроме того, при откате цепочка последующих снапшотов уничтожается.* В Bluestore снапшоты эффективны — эффективны — после снятия снапшота случайная запись практически не замедляется, в отличие от Filestore, где принцип работы снапшотов схож со старым LVM и при записи даже 4 КБ после снятия снапшота соответствующий 4 МБ объект копируется целиком.* Но при этом эта оптимизация снапшотов — снапшотов — «виртуальные клоны» — клоны» — реализована именно на уровне Bluestore, ни клиент, ни OSD о ней ничего не знают и поэтому она… ломается при ребалансе. Выглядит это так: ты добавляешь в кластер диск, он заполняется, а доступного места больше не становится. Почему? Потому что изначально, при записи, Bluestore получил запрос «клонировать 4 МБ объект в новую версию» и сделал это внутри себя, реально не копируя данные, а потом перезаписал 4 КБ. А при ребалансе эта связь порвалась и объект стал занимать все 4 МБ… Fail.* Также на уровне RBD есть клоны, которые, с одной стороны, более юзабельны — юзабельны — реализованы они через ссылку на родительский образ — а с , соответственно, откат к такому «снапшоту» быстрый — достаточно просто создать новый клон. С другойстороны, для них клонов не работает эта самая блюсторовская оптимизация, поэтому они опять-таки копируют объекты целиком при любой записи… что выливается в 40 иопс на запись (QD=1) в NVMe кластере.
* В CephFS ещё одна реализация снапшотов, и там отката нет вообще.
В общем, наговнокодили — наговнокодили — мама не горюй…
== Контроллеры ==

Навигация