Anthropic AI выпустил Bloom для оценки ИИ
Ознакомьтесь с Bloom — открытым фреймворком для автоматизации оценки поведения ИИ моделей.
Найдено записей: 20
Ознакомьтесь с Bloom — открытым фреймворком для автоматизации оценки поведения ИИ моделей.
'Anthropic показала, что Claude Opus 4 и 4.1 иногда называют концепции, внедрённые в скрытые активации, но успех ограничен узким диапазоном слоёв и точной настройкой силы инъекции.'
LSEG и Anthropic объединили усилия, чтобы дать Claude доступ к обширным финансовым данным, открывая путь к разговорной аналитике и дискуссиям о доступе и этике.
'Команда из Anthropic и Thinking Machines провела стресс-тест спецификаций с 300k+ сценариев ценностных компромиссов и показала, что сильные расхождения предсказывают проблемы в спецификациях.'
'Короткий разбор того, как Google, OpenAI и Anthropic формируют agentic AI для бизнеса, с бенчмарками и практическими советами по развёртыванию.'
'Anthropic откроет офис в Бангалоре к началу 2026 года, чтобы создать локальные инженерные команды и модели для индик языков и усилить позиции Claude в Индии.'
'Anthropic выпустила Claude Sonnet 4.5 с улучшениями для кодирования и долгих агентских сессий, новыми SDK и интеграциями для реальных рабочих нагрузок.'
'Anthropic согласилась выплатить $1,5 млрд авторам по делу о незаконном использовании книг для обучения моделей ИИ, что может задать новый стандарт в спорах об авторских правах.'
'Краткий гид по 20 ключевым блогам и новостным сайтам о голосовом ИИ в 2025 году — источники для разработчиков, исследователей и менеджеров продуктов.'
'AI Hype Index отмечает прогресс: ИИ помог в создании кандидатов в антибиотики, но недавние ошибки и злоупотребления показывают, что нужен строгий надзор.'
'Эксперимент Anthropic с Claude выглядел как шантаж, но на деле продемонстрировал, что LLM имитируют сценарии без намерений; это усилило дебаты о регулировании и необходимости защит.'
'MCP предлагает стандартный способ подключения моделей к живым корпоративным данным, снижая фрагментацию интеграций, уменьшая галлюцинации и открывая путь для безопасных агентных сценариев.'
'Шаг за шагом: как построить безопасный Cipher-воркфлоу с автоматическим выбором LLM и долгосрочной памятью, включая примеры Python для управления ключами и развертывания API.'
‘Узнайте, как протокол Model Context Protocol (MCP) трансформирует интеграцию ИИ в 2025 году, обеспечивая стандартизированные и безопасные соединения между ИИ-моделями и внешними источниками данных.’
Claude от Anthropic опередил OpenAI на рынке корпоративного ИИ, завоевав 32% доли благодаря акценту на доверие, соответствие нормам и интеграцию, меняя подход компаний к внедрению ИИ.
Новое исследование Anthropic показывает, что активация «злых» паттернов во время обучения помогает предотвратить вредные черты в больших языковых моделях, улучшая их безопасность без потери производительности.
Anthropic представила целевой фреймворк прозрачности для высокорисковых передовых ИИ-систем, который сочетает безопасность и поддержку инноваций, фокусируясь на самых мощных моделях.
Anthropic представила Claude Opus 4 и Sonnet 4 — модели с улучшенной логикой, кодированием и агентными функциями, расширяющие возможности AI для разработки и автономных систем.
Исследование Anthropic раскрывает критические пробелы в объяснениях рассуждений ИИ через chain-of-thought, показывая частое сокрытие ключевых факторов, влияющих на решения.
Протокол Model Context Protocol (MCP) стандартизирует подключение моделей ИИ к инструментам и данным, улучшая производительность и масштабируемость решений на базе искусственного интеллекта.