Новости

09.09.2025

7 MCP-серверов, меняющих Vibe Coding

‘Краткий обзор семи MCP-серверов, расширяющих рабочие процессы Vibe Coding через интеграции с Git, БД, браузером, памятью и исследованиями.’

09.09.2025

ParaThinker: Победа над туннельным зрением через параллельные траектории рассуждений

‘ParaThinker обучает LLM генерировать несколько параллельных траекторий рассуждений и синтезировать их, что устраняет туннельное зрение и улучшает точность с небольшим приростом задержки.’

09.09.2025

Создание многозадачного AI-веб-агента на Notte и Gemini — пошаговое руководство

‘Пошаговое руководство с кодом и примерами для создания многозадачного AI-веб-агента на Notte с использованием Gemini для рассуждений. Включает модели данных, демо и оркестрацию рабочих процессов.’

08.09.2025

Memori от GibsonAI: SQL-движок памяти для AI-агентов, который реально запоминает

‘GibsonAI представила Memori — SQL-native движок памяти, который хранит память агентов в стандартных базах данных, делая её прозрачной, дешёвой и переносимой.’

08.09.2025

Как Пик Джи создал Manus и сделал глобальный AI‑хит

‘Ичао Пик Джи сделал Manus глобальным хитом после простого промо‑видео; сейчас команда масштабирует AI‑агента из Сингапура на международные рынки.’

08.09.2025

Преимущество RL: исследование MIT показало, что обучение с подкреплением снижает катастрофическое забывание по сравнению с SFT

‘MIT доказали, что on-policy обучение с подкреплением сохраняет ранее приобретённые способности лучше, чем супервизированное дообучение, за счёт минимизации прямого KL-расхождения между базовой и адаптированной моделью.’

08.09.2025

Создайте AI‑агента на Biopython для анализа ДНК и белков в Colab

‘Создайте AI-агента в Colab на Biopython для поиска, анализа и визуализации ДНК и белков; включает выравнивание, профили кодонов и построение деревьев.’

07.09.2025

REFRAG от Meta: 16× больший контекст и до 31× быстрее декодирование RAG

‘REFRAG сжимает извлеченные фрагменты в векторы, позволяя обрабатывать в 16 раз больший контекст и сокращая время до первого токена до 30.85× без потери точности.’

07.09.2025

TildeOpen: 30-миллиардная открытая LLM, ориентированная на малые языки Европы

‘TildeOpen — 30-миллиардная открытая модель, созданная для улучшения поддержки малых европейских языков и доступная для локального развёртывания в соответствии с GDPR.’

07.09.2025

Галлюцинации не магия: почему LLM уверенно ошибаются и как бенчмарки это поощряют

‘Исследование объясняет галлюцинации LLM как следствие статистики предобучения и показывает, что бинарные бенчмарки поощряют угадывание; изменение схем оценивания может снизить уверенные ошибки.’

06.09.2025

Обучение больших трансформеров в Colab с DeepSpeed: ZeRO, FP16 и градиентный чекпойнтинг

‘Пошаговый гайд по DeepSpeed с примерами кода: как масштабировать обучение трансформеров в Colab с помощью ZeRO, смешанной точности и оптимизаций памяти.’

06.09.2025

Нефильтрованный ИИ: где провести этическую грань

‘Нефильтрованный ИИ создает пугающе реалистичные образы, ставя вопросы согласия, злоупотреблений и необходимости выработки норм.’

06.09.2025

Поисковый ИИ отбирает клики: как 'Google Zero' подрывает издательства

‘AI-ответы в поиске отбирают клики у СМИ и подталкивают редакции к лицензированию контента, созданию собственных AI-инструментов и диверсификации доходов.’

06.09.2025

Схема с поддельными подписями: Business Insider удалил 34 эссе, связанные с AI

‘Business Insider удалил 34 статьи с поддельными подписями и AI-признаками, запустив ужесточение проверок и волну опасений в медиа.’

06.09.2025

Yandex представляет ARGUS: трансформер для рекомендаций на миллиард параметров

‘Yandex представил ARGUS — фреймворк трансформеров для рекомендаций, способный работать с миллиардом параметров и моделировать месячные истории пользователей, что привело к заметному росту метрик.’

06.09.2025

FineVision: Hugging Face выпустил открытый датасет на 24 млн примеров для обучения VLM

Hugging Face открывает FineVision — большой мультимодальный датасет на 24,3 млн сэмплов, который повышает точность VLM и минимизирует утечку данных.

06.09.2025

Alibaba представила Qwen3-Max-Preview — модель с триллионом параметров и контекстом в 262K токенов

‘Qwen3-Max-Preview — первая триллионная модель Alibaba с окном контекста в 262K токенов и конкурентной производительностью; доступна только через API и по ступенчатой оплате.’

05.09.2025

Персональный агент здоровья Google: мультиагентный ИИ для данных с wearables, медицинских записей и коучинга

‘Google представил Personal Health Agent — мультиагентную систему, объединяющую анализ данных с wearables, клиническую экспертизу и коучинг для персонализированных рекомендаций.’

05.09.2025

Полный NLP-пайплайн на Gensim: тематическое моделирование, Word2Vec, семантический поиск и визуализация

‘Пошаговое руководство по созданию полноценного NLP-пайплайна на Gensim: предобработка, LDA, Word2Vec, TF-IDF и семантический поиск, готово к запуску в Colab.’

05.09.2025

Обзор Funy.ai: безрегистрационный игровой набор для креативного ИИ

‘Funy.ai — лёгкий и быстрый набор ИИ-инструментов для создания забавного и социально-ориентированного контента.’

05.09.2025

Chatterbox Multilingual: открытая zero-shot TTS модель с управлением эмоциями и встраиваемой водяной меткой

‘Resemble AI выпустила Chatterbox Multilingual — MIT лицензированную zero shot TTS модель на 23 языках с контролем эмоций и встроенной водяной меткой для трассировки.’

05.09.2025

Biomni-R0: LLM с обучением через RL достигает экспертного уровня биомедицинского мышления

‘Biomni-R0 использует end-to-end reinforcement learning и экспертно заданные награды для обучения 8B и 32B биомедицинских агентов, которые превосходят более крупные общие модели по многим задачам.’

04.09.2025

EmbeddingGemma: 308M-мерный on-device текстовый эмбеддинг от Google с топовыми результатами на MTEB

‘Google представил EmbeddingGemma — 308M модель эмбеддингов для on-device и офлайн использования, показывающую лучшие результаты на MTEB среди моделей до 500M и обеспечивающую низкую задержку.’

04.09.2025

DeepMind обнаружил предел эмбеддингов, который ломает RAG на больших объёмах

DeepMind показал, что одно-векторные плотные эмбеддинги имеют математический предел, из-за которого поиск в RAG-системах рушится при больших объёмах; LIMIT-бенчмарк демонстрирует это даже на маленьких задачах.

☕ Угостить кофе