13 652
правки
Изменения
м
→Дата скетчи
== Дата скетчи ==
В целом неплохой доклад про алгоритмы семейства Data Sketches. Я так понимаю, это новое собирательное название для уже некоторое время существующего класса алгоритмов - потоковых статистических алгоритмов.
TLDR - всё это реализовано в библиотеке [https://datasketches.apache.org/ Apache DataSketches] на Java и C++, бери и юзай.
В докладе охвачены алгоритмы:
* Подсчёт числа уникальных элементов в потоке: HLL (HyperLogLog), CPC (Compressed Probability Counting), Theta Sketch
*
COUNTMIN SKETCH MISRAGRIES
Квантили гистограммы
Mank Rajagopalan Lindsay
Идея
== Катаем гусей ==