Новая каузальная модель Google для более точной оценки справедливости моделей машинного обучения по подгруппам

Понимание справедливости по подгруппам в машинном обучении

Оценка справедливости моделей машинного обучения требует анализа их работы на разных подгруппах, определяемых по признакам, таким как раса, пол или социально-экономический статус. Это особенно важно в таких сферах, как здравоохранение, где предвзятость модели может привести к неравенству в лечении или диагностике. Анализ по подгруппам помогает выявить скрытые предубеждения в данных или дизайне модели. Справедливость — это не только статистическое равенство, но и обеспечение равных реальных результатов.

Проблемы с распределением данных и структурными смещениями

Различия в работе модели по подгруппам часто обусловлены не самой моделью, а особенностями распределения данных, отражающими социальные и структурные неравенства. Требование одинаковой производительности без учета этих факторов может привести к неправильным выводам. Кроме того, если данные для обучения не репрезентативны из-за смещений выборки или исключений, модели плохо обобщаются, что усиливает неравенство, особенно при неизвестной структуре смещения.

Ограничения традиционных метрик справедливости

Текущие метрики справедливости, такие как демографический паритет, равные шансы и достаточность, часто основываются на разделенных показателях и условной независимости. Например, равные шансы требуют схожих показателей истинных и ложных срабатываний для разных групп. Однако эти метрики могут быть ошибочными при сдвигах распределения. Различия в распространенности меток по подгруппам могут привести к тому, что даже точные модели не проходят критерии, создавая ложное впечатление предвзятости.

Каузальная модель для оценки справедливости

Исследователи из Google и партнерских организаций предложили модель, основанную на каузальных графах, которая явно описывает процессы генерации данных, различия между подгруппами и смещения выборки. Такой подход не требует предположений о равномерном распределении и помогает глубже понять вариации производительности по подгруппам. Рекомендуется сочетать традиционные показатели с каузальным анализом, чтобы выявлять источники различий, а не полагаться только на метрики.

Моделирование различных типов сдвигов распределения

Модель использует направленные ацикличные графы для классификации сдвигов: сдвиг ковариат, сдвиг исхода и сдвиг представления. В графах учитываются такие переменные, как принадлежность к подгруппе, исход и ковариаты. Сдвиг ковариат означает изменение распределения признаков при сохранении связи с исходом, сдвиг исхода — изменение этой связи в разных подгруппах. Также рассматриваются сдвиг меток и механизмы выборки, объясняющие смещения данных. Это позволяет предсказывать, когда подгрупповая модель улучшит справедливость, а когда нет. Такой системный подход определяет, когда стандартные оценки справедливости корректны или вводят в заблуждение.

Эмпирические результаты

В экспериментах с моделями Байеса-оптимума исследователи проверяли выполнение критериев справедливости, таких как достаточность и разделение, в разных каузальных структурах. Достаточность (независимость исхода от подгруппы при заданном прогнозе) выполнялась при сдвиге ковариат, но не при сложных сдвигах. Разделение (независимость прогноза от подгруппы при фиксированном исходе) наблюдалось только при сдвиге меток без учета подгруппы во входных данных. Эти результаты подчеркивают важность учета подгрупп в моделях. Если смещение выборки зависит только от признаков или подгрупп, критерии соблюдаются, но зависимость от исхода усложняет поддержание справедливости.

Значение для оценки справедливости

Оценка справедливости только по метрикам подгрупп может быть ошибочной из-за влияния структуры данных. Предложенная каузальная модель предоставляет инструменты для распознавания и интерпретации этих нюансов, объединяя статистическую справедливость с реальными аспектами. Хотя модель не гарантирует идеальное равенство, она создает прозрачную основу для понимания влияния алгоритмических решений на разные группы населения.

Подробнее можно узнать из оригинальной статьи и репозитория GitHub. Следите за обновлениями в Twitter и присоединяйтесь к сообществам, таким как ML SubReddit с более чем 100 тысячами участников, а также подпишитесь на рассылки.