Selection bias в антифроде
AUC 0.99, precision 0.95, а фрода в проде стало больше. Разбираем selection bias, feedback loop и почему стандартные метрики антифрод-модели врут.
5 статей
AUC 0.99, precision 0.95, а фрода в проде стало больше. Разбираем selection bias, feedback loop и почему стандартные метрики антифрод-модели врут.
Как построить дерево метрик: декомпозиция, MECE, две North Star, корреляция сиблингов и guardrail-метрики. Разбираем подводные камни с примерами из e-commerce.
Энтропия Шеннона, Information Gain в деревьях и cross-entropy loss в нейросетях — это одна формула 1948 года. Разбираем связь с примерами и кодом.
Gini coefficient — это тот же ROC-AUC, но на честной шкале. Разбираем связь через U-статистику Манна-Уитни, сравниваем визуализации и показываем козыри Gini.
Разбираем задачу с интервью: какой максимальный ROC-AUC можно получить на 6 сэмплах, если он не единица? Решение через механику пар, формулы и проверка на Python.