Новости

17.09.2025

Fluid Benchmarking: адаптивная IRT-оценка, которая дольше сохраняет информативность метрик LLM

‘Fluid Benchmarking использует 2PL IRT и выбор заданий по информации Фишера, чтобы сделать оценку LLM более стабильной, ресурсно-эффективной и менее подверженной ошибочным меткам.’

17.09.2025

Google представил AP2 — открытый протокол для проверяемых платежей, инициируемых AI-агентами

AP2 — открытая спецификация Google, использующая версифицируемые удостоверения и мандаты для создания аудируемой цепочки при платежах, инициированных AI-агентами.

17.09.2025

GPTZero: проверка грамматики и стилистики — честный обзор

‘GPTZero сочетает проверку грамматики с советами по ясности и тону; бесплатный вход позволяет быстро оценить инструмент.’

17.09.2025

Я тестировал проверку на плагиат в GPTZero месяц — честный отзыв

‘После месячного теста проверка плагиата GPTZero показалась быстрой и полезной: есть бесплатный план и подсветка совпадений, но встречаются ложные срабатывания и ограничения баз данных.’

16.09.2025

Практическое руководство по Zarr: чанки, сжатие, индексация и визуализация больших массивов

‘Практическое руководство по Zarr: настройка чанков, тесты кодеков, организация данных и примеры индексирования и визуализации для больших массивов.’

16.09.2025

TimesFM-2.5 от Google: 200M модель для прогнозирования с контекстом 16K возглавляет GIFT-Eval

‘TimesFM-2.5 — 200M параметров и 16K контекста, модель для прогнозирования временных рядов с поддержкой квантильных прогнозов, которая сейчас лидирует на GIFT-Eval в zero-shot режиме. Чекпоинт доступен на Hugging Face и подготовлен для использования в продакшне.’

16.09.2025

Как снизить риски инвестиций в агентные ИИ для клиентского сервиса

Агентные ИИ способны преобразить клиентский сервис, но требуют новых подходов к тестированию, безопасности и контролю затрат; в статье собраны практические методы снижения рисков.

16.09.2025

Ролевой ИИ как неожиданный соавтор для развития креативности

Ролевые ИИ-чатботы выступают в роли интерактивных соавторов, стимулируя неожиданные сюжетные повороты, визуальное вдохновение и безопасную практику, что помогает развивать креативность и навыки рассказывания историй.

16.09.2025

Как тест со смайликом побеждает дипфейковые мошенничества

‘Низкотехнологичные приёмы — попросить нарисовать смайлик, перезвонить на сохранённый номер, задать неожиданный вопрос — в сочетании с проверкой происхождения контента помогают остановить дипфейковые атаки.’

16.09.2025

Apple запускает 'Apple Intelligence' — живой перевод, экранный интеллект и тренер на часах

‘Apple запускает Apple Intelligence с живым переводом в Messages/FaceTime/Phone, экранными действиями и Workout Buddy на Apple Watch; обновления приходят с iOS/iPadOS/macOS/watchOS/visionOS 26.’

16.09.2025

Генератор хентай Candy AI: как создавать кастомные NSFW аниме-персонажи

‘Пошаговое руководство по Candy AI: девять экранов настройки, готовые сборки, советы по улучшению результатов и информация о том, для кого подходит сервис.’

16.09.2025

Создавайте вирусные соцвидео без навыков монтажа

‘Узнайте, как создавать эффектные соцвидео без навыков монтажа с помощью AI-генераторов, шаблонов и простого рабочего процесса’

16.09.2025

Когда ИИ становится другом: регуляторы стремятся ограничить вредную привязанность

‘Рост регуляторного и общественного давления на компаньоноподобные функции ИИ после случаев, связанных с подростковыми самоубийствами; калифорнийский закон и проверка FTC меняют правила игры.’

16.09.2025

MedAgentBench: бенчмарк Stanford для AI-агентов в реальных рабочих процессах EHR

‘Stanford представил MedAgentBench — первый масштабный FHIR-совместимый бенчмарк для оценки AI-агентов в реальных EHR-рабочих процессах, показав сильные результаты в извлечении данных и уязвимости при выполнении многошаговых действий.’

16.09.2025

Обновляйте триллионные LLM за ~20 секунд с checkpoint-engine от MoonshotAI

‘MoonshotAI выпустил checkpoint-engine — решение для обновления весов на тысячах GPU примерно за 20 секунд, полезное для RL и масштабного сервинга с минимальным простоем.’

16.09.2025

OpenAI переманил экс‑CFO xAI, чтобы сдержать растущие расходы на вычисления

‘OpenAI нанял экс‑CFO xAI Майка Либераторе, чтобы управлять ростом расходов на вычислительную инфраструктуру ИИ. Ход подчеркивает начало финансовой гонки за контроль над затратами и мощностями.’

16.09.2025

ClipGen превращает каракули в видео уровня Голливуда: искусственный интеллект для всех

‘ClipGen запускает универсальную AI-платформу, превращающую наброски и изображения в готовые видео, что расширяет возможности творчества и вызывает вопросы о праве и оригинальности.’

16.09.2025

Интерпретируемая детекция мотивов ДНК с многомасштабной CNN и механизмом внимания

‘Руководство по построению многомасштабной CNN с механизмом внимания для классификации последовательностей ДНК, с полным кодом и способами визуализации интерпретаций.’

16.09.2025

GPT-5-Codex: версия GPT-5, настроенная для агентного кодирования в Codex

‘OpenAI представила GPT-5-Codex — настроенную для Codex версию GPT-5, которая улучшает автономность, производительность и интеграцию в инструменты разработчиков.’

16.09.2025

Я тестировал Twixify месяц — действительно ли он делает AI‑текст более человечным?

‘После месяца использования Twixify текст стал звучать менее роботично и ближе к моему голосу, но это не гарантирует обход детекторов — стоит как помощник по стилю.’

15.09.2025

NVIDIA открыла ViPE: масштабируемый движок аннотаций 3D-видео для Spatial AI

‘NVIDIA открыла ViPE, движок для автоматической аннотации видео в 3D, и выпустила около 96 млн аннотированных кадров для обучения моделей Spatial AI.’

15.09.2025

Meta представила MobileLLM-R1: легкая модель для рассуждений на устройстве с менее чем 1 млрд параметров

‘MobileLLM-R1 — семейство компактных моделей Meta для краевого использования (140M–950M), демонстрирующее высокую точность в математике и программировании при меньших объёмах обучения.’

15.09.2025

От черного ящика к залу суда: проектирование объяснимого ИИ для юридического мышления

Стандартные методы XAI не отражают иерархическую, прецедентную структуру юридического мышления. В статье предлагается гибридная архитектура: формальная аргументация плюс LLM для человекоориентированных объяснений.

15.09.2025

Практическое руководство: интерактивные дашборды экспериментов с Hugging Face Trackio

Коллаб-руководство по работе с Hugging Face Trackio: установка, логирование метрик и матриц ошибок, импорт CSV и запуск интерактивного дашборда для сравнения запусков.

☕ Угостить кофе