#proof-of-concept20.06.2025
UC Berkeley представляет CyberGym: масштабный бенчмарк для оценки AI в кибербезопасности на реальных уязвимостях больших кодовых баз
UC Berkeley представил CyberGym — обширный бенчмарк для оценки AI-агентов на реальных уязвимостях в крупных программных проектах, раскрывающий возможности и ограничения современных моделей.