FILTER MODE ACTIVE

#интерпретируемость

Найдено записей: 10

#интерпретируемость15.11.2025

OpenAI обучает весово разреженные трансформеры для выявления компактных интерпретируемых цепей

'OpenAI использует обучение с жесткой весовой разреженностью, чтобы извлекать небольшие и проверяемые цепи, объясняющие поведение модели на простых Python задачах.'

#интерпретируемость13.11.2025

Новый прозрачный LLM OpenAI показывает, как «думает» ИИ

'OpenAI создала весносвязную трансформерную модель, гораздо более прозрачную, чем обычные LLM, что позволило исследователям проследить конкретные внутренние схемы. Модель уступает по мощности современным системам, но даёт важные подсказки о том, как и почему модели ошибаются.'

#интерпретируемость16.09.2025

Интерпретируемая детекция мотивов ДНК с многомасштабной CNN и механизмом внимания

'Руководство по построению многомасштабной CNN с механизмом внимания для классификации последовательностей ДНК, с полным кодом и способами визуализации интерпретаций.'

#интерпретируемость28.08.2025

PadChest-GR: новый стандарт — мультимодальный, двуязычный датасет с предложенческим выравниванием для радиологии

'PadChest-GR связывает предложенческие двуязычные радиологические тексты с пространственно обоснованными аннотациями рентгеновских снимков грудной клетки, повышая интерпретируемость моделей и снижая риск галлюцинаций.'

#интерпретируемость04.07.2025

Thought Anchors: точный анализ ключевых этапов рассуждений в больших языковых моделях

Thought Anchors — новый фреймворк, который улучшает понимание процессов рассуждений в больших языковых моделях за счет анализа вклада предложений и причинного влияния.

#интерпретируемость07.05.2025

Университет Фудань представляет Lorsa: разбор суперпозиции внимания в трансформерах с помощью разреженных механизмов

Исследователи из Университета Фудань разработали Lorsa — механизм разреженного внимания, позволяющий выделять атомарные единицы внимания, скрытые в суперпозиции трансформеров, что улучшает интерпретируемость языковых моделей.