Изменения

Перейти к: навигация, поиск

Highload-2023: Отчёт Виталия Филиппова

854 байта добавлено, 07:24, 30 ноября 2023
м
Дата скетчи
== Дата скетчи ==
 
В целом неплохой доклад про алгоритмы семейства Data Sketches. Я так понимаю, это новое собирательное название для уже некоторое время существующего класса алгоритмов - потоковых статистических алгоритмов.
 
TLDR - всё это реализовано в библиотеке [https://datasketches.apache.org/ Apache DataSketches] на Java и C++, бери и юзай.
 
В докладе охвачены алгоритмы:
* Подсчёт числа уникальных элементов в потоке: HLL (HyperLogLog), CPC (Compressed Probability Counting), Theta Sketch
*
 
COUNTMIN SKETCH MISRAGRIES
 
Квантили гистограммы
 
Mank Rajagopalan Lindsay
 
Идея
== Катаем гусей ==

Навигация