### Проблема и решение: зачем нужен RAG?
Представьте: у вас есть LLM (большая языковая модель), которая умеет отлично генерировать текст, но без контекста не знает, что именно хочет пользователь. Допустим, сотрудник спрашивает: «Как исправить ошибку X в системе Y?».
Если у модели нет доступа к внутренним инструкциям, тикетам и документации, она либо выдумает ответ (галлюцинация), либо честно признается: _«Не знаю»_. RAG решает эту проблему, добавляя модели нужный контекст.
**RAG** решает эту проблему, комбинируя два этапа:
1. **Retrieval (поиск)**: Находит релевантные данные в базе знаний с помощью векторного поиска. Это быстрее и точнее, чем поиск по ключевым словам, так как учитывает семантику.
2. **Augmented Generation (подкреплённая генерация)**: Передаёт найденные данные LLM, чтобы она сгенерировала точный и полезный ответ.
## Материалы и статьи
- [[HABR RAG и векторные БД НЕ Сизифов LLM на Java и Spring Ai]]
# Связи
Up::
%%
Каталог: `=this.file.folder`
Prev::
Next::
СDate:: [[25-09-01]] <!-- Шаблонное выражение выполнено заранее -->
# 📥 Inbox
## Обратные ссылки без упоминания
```dataview
list from [[]] and !outgoing([[]])
```
& updated for the last time : `=this.file.mtime`
%%