FILTER MODE ACTIVE

#RAG

Найдено записей: 26

#RAG17.01.2026

Создание самооценочной AI-системы с LlamaIndex

Научитесь создавать AI-систему с поддержкой поиска и оценки в этом подробном руководстве.

ЧИТАТЬ →

#RAG05.12.2025

Apple представила CLaRa для повышения сжатия RAG

Откройте для себя CLaRa – революционную систему, улучшающую получение с добавлением информации с помощью новых методов сжатия документов.

ЧИТАТЬ →

#RAG10.11.2025

Какая память лучше для LLM-агентов: вектор, граф или логи событий?

'Обзор шести паттернов памяти для LLM-агентов в трёх семействам: вектор, граф и логи/эпизоды, с разбором задержек, успешности поисков и типичных отказов.'

ЧИТАТЬ →

#RAG03.11.2025

Создание персистентного персонализированного агентного ИИ с распадом памяти и самооценкой

'Пошаговый гайд о том, как персистентная память, распад и простое извлечение превращают чат-бота в персонализированного агента; включает полный Python-демо и оценку эффекта.'

ЧИТАТЬ →

#RAG02.11.2025

Какой OCR выбрать в 2025 году? Практичное сравнение топ-6 систем документной аналитики

'Практичное сравнение шести ведущих OCR и систем документной аналитики 2025 с акцентом на качество распознавания, макет, языки, развёртывание и интеграцию с LLM. Помогает выбрать инструмент под конкретные рабочие нагрузки и требования соответствия.'

ЧИТАТЬ →

#RAG23.10.2025

Создание корпоративного AI-ассистента на Colab с RAG и политиками безопасности

'Практическое руководство по созданию AI-ассистента на Colab с RAG и встроенными политиками безопасности, включая редактирование PII и проверку запросов.'

ЧИТАТЬ →

#RAG19.09.2025

5% ИИ, 100% инженерии: почему агенты зависят от инфраструктуры

'Надежность агентных систем достигается инженерными контролями — данные, права доступа, и наблюдаемость важнее выбора модели.'

ЧИТАТЬ →

#RAG14.09.2025

Создавайте AI быстро: 5 no-code платформ для инженеров и разработчиков

'Обзор пяти no-code платформ, которые упрощают создание AI ассистентов, RAG систем и дообучение моделей без написания кода'

ЧИТАТЬ →

#RAG13.09.2025

IBM представила два компактных эмбеддинга Granite на базе ModernBERT с поддержкой длинного контекста

'IBM представила два компактных ModernBERT-эмбеддинга Granite R2 с поддержкой 8k контекста, высокой скоростью и коммерческой лицензией Apache 2.0.'

ЧИТАТЬ →

#RAG07.09.2025

REFRAG от Meta: 16× больший контекст и до 31× быстрее декодирование RAG

'REFRAG сжимает извлеченные фрагменты в векторы, позволяя обрабатывать в 16 раз больший контекст и сокращая время до первого токена до 30.85× без потери точности.'

ЧИТАТЬ →

#RAG04.09.2025

EmbeddingGemma: 308M-мерный on-device текстовый эмбеддинг от Google с топовыми результатами на MTEB

'Google представил EmbeddingGemma — 308M модель эмбеддингов для on-device и офлайн использования, показывающую лучшие результаты на MTEB среди моделей до 500M и обеспечивающую низкую задержку.'

ЧИТАТЬ →

#RAG04.09.2025

DeepMind обнаружил предел эмбеддингов, который ломает RAG на больших объёмах

DeepMind показал, что одно-векторные плотные эмбеддинги имеют математический предел, из-за которого поиск в RAG-системах рушится при больших объёмах; LIMIT-бенчмарк демонстрирует это даже на маленьких задачах.

ЧИТАТЬ →

#RAG02.09.2025

AI-агент с памятью: краткосрочные сводки и векторная долговременная память на FAISS

'Узнайте, как создать AI-агента, который суммирует недавние разговоры для краткосрочного контекста и сохраняет дистиллированные факты в FAISS-векторную память для долговременного воспоминания.'

ЧИТАТЬ →

#RAG30.08.2025

Токенизация против чанкинга: как правильно делить текст для AI

'Разберитесь, когда использовать токенизацию, а когда чанкинг, чтобы оптимизировать стоимость, производительность моделей и сохранение контекста в AI-приложениях.'

ЧИТАТЬ →

#RAG27.08.2025

Agentic RAG: как автономные агенты меняют поиск и генерацию контента (2025)

'Agentic RAG добавляет планирование, использование инструментов и самопроверку к традиционному RAG, обеспечивая более точные и адаптивные ответы.'

ЧИТАТЬ →

#RAG24.08.2025

Построение граф‑агента на Gemini: полный код для планирования, поиска, вычислений и самокритики

Пошаговое руководство с полным кодом для создания граф‑структурированного AI‑агента на базе Gemini, реализующего планирование, поиск, вычисления и автоматическую проверку ответа.

ЧИТАТЬ →

#RAG23.08.2025

LLM или SLM? Практическое руководство для финансов в 2025 году

'Для банков и страховщиков в 2025 году: SLM — для быстрых, структурированных задач и строгой локализации данных; LLM — для длинных контекстов и сложного синтеза при строгом управлении рисками.'

ЧИТАТЬ →

#RAG19.08.2025

AlphaAgents от BlackRock: мультиагентные LLM для нового подхода к формированию акцийного портфеля

'AlphaAgents распределяет задачи анализа акций между специализированными LLM-агентами, объединяя фундамент, сентимент и оценку стоимости для улучшения результатов и управления риском.'

ЧИТАТЬ →

#RAG17.08.2025

Масштабирование корпоративного ИИ: 11 ключевых концепций для руководителей

'Одиннадцать ключевых концепций, которые помогут лидерам вывести проекты ИИ из пилотов в масштабируемую эксплуатацию: интеграция, данные, доверие и перестройка процессов.'

ЧИТАТЬ →

#RAG12.08.2025

Как контекстная инженерия превратила LLM в бизнес-критичную инфраструктуру

'Реальные кейсы показывают, как контекстная инженерия снижает ошибки, повышает продуктивность и экономит время, переводя ИИ в бизнес-критичные приложения.'

ЧИТАТЬ →

#RAG11.08.2025

NuMind представляет NuMarkdown-8B-Thinking: reasoning VLM для надежной конвертации документов в Markdown

'NuMind представила NuMarkdown-8B-Thinking, reasoning VLM который анализирует разметку документов и выводит чистый Markdown, готовый для RAG и архивов.'

ЧИТАТЬ →

#RAG09.08.2025

Graph-R1: агентная гиперграфовая RAG для многошагового вывода с обучением с подкреплением

'Graph-R1 сочетает гиперграфовые знания, агентный многошаговый поиск и сквозное RL, достигая высоких показателей точности и эффективности в QA.'

ЧИТАТЬ →

#RAG09.08.2025

AI-агенты в 2025: что работает, какие риски и как запускать

'Короткое руководство по AI-агентам в 2025: что это, где они работают надёжно, основные риски и как выстраивать продакшен.'

ЧИТАТЬ →

#RAG26.07.2025

EraRAG: Революционная система поиска для динамичных и растущих данных на основе многоуровневых графов

EraRAG представляет масштабируемую систему поиска, оптимизированную для динамично растущих данных, выполняя эффективные локализованные обновления на многоуровневом графе, что значительно улучшает производительность и точность поиска.

ЧИТАТЬ →

#RAG14.07.2025

MMSearch-R1: Революция в мультимодальном поиске в LMM с помощью обучения с подкреплением

MMSearch-R1 представляет собой систему обучения с подкреплением, которая позволяет большим мультимодальным моделям эффективно и избирательно выполнять поиск по запросу, улучшая точность и снижая нагрузку на систему поиска.

ЧИТАТЬ →

#RAG07.05.2025

WebThinker: Усиление больших моделей рассуждения для автономного поиска в интернете и научных отчетов

WebThinker — новый агент ИИ, который позволяет большим моделям рассуждения самостоятельно искать информацию в интернете и создавать детальные научные отчеты, значительно повышая эффективность в сложных задачах.

ЧИТАТЬ →