RAG (Retrieval Augment Generation) - Стратегическая Мастерская: База знаний (Черновик)

### Проблема и решение: зачем нужен RAG? Представьте: у вас есть LLM (большая языковая модель), которая умеет отлично генерировать текст, но без контекста не знает, что именно хочет пользователь. Допустим, сотрудник спрашивает: «Как исправить ошибку X в системе Y?». Если у модели нет доступа к внутренним инструкциям, тикетам и документации, она либо выдумает ответ (галлюцинация), либо честно признается: _«Не знаю»_. RAG решает эту проблему, добавляя модели нужный контекст. **RAG** решает эту проблему, комбинируя два этапа: 1. **Retrieval (поиск)**: Находит релевантные данные в базе знаний с помощью векторного поиска. Это быстрее и точнее, чем поиск по ключевым словам, так как учитывает семантику. 2. **Augmented Generation (подкреплённая генерация)**: Передаёт найденные данные LLM, чтобы она сгенерировала точный и полезный ответ. ## Материалы и статьи - [[HABR RAG и векторные БД НЕ Сизифов LLM на Java и Spring Ai]] # Связи Up:: %% Каталог: `=this.file.folder` Prev:: Next:: СDate:: [[25-09-01]]  # 📥 Inbox ## Обратные ссылки без упоминания ```dataview list from [[]] and !outgoing([[]]) ``` & updated for the last time : `=this.file.mtime` %%