Зачем мне 20+ разных LLM-моделей в работе?
Я часто думаю о том, как правильно подобрать LLM для AI бизнес-помощника под определенную функцию. За последние два года протестировала почти все варианты: универсального решения не существует.
1️⃣ Российские модели вроде GigaChat и YandexGPT беру для задач, где важна юридическая чистота. Анализ договоров, подготовка документооборота, работа с персональными данными сотрудников. GigaChat особенно хорош для правовых вопросов - быстро находит нестыковки в контрактах и предлагает правки с учетом актуального законодательства. Когда нужно быть уверенной, что информация остается в российской юрисдикции и соответствует 152-ФЗ, выбираю их.
2️⃣ Зарубежные сервисы использую для разных специализированных задач. Claude незаменим для глубокой аналитики - исследование рынков, конкурентный анализ, сценарное планирование с рисками. Правда, для регистрации требует подтверждение по номеру телефона, что не всегда удобно для корпоративных аккаунтов.
Gemini прекрасно работает с визуалом: презентации, обработка изображений и видео, креативные кампании. OpenAI беру для универсальных задач и генерации идей - от email-рассылок до концептов новых продуктов.
Grok использую для отслеживания актуальных трендов и проведения анализа рынка.
Qwen и DeepSeek стали приятным открытием: работают без VPN, что очень удобно. Qwen отлично справляется с обработкой больших объемов данных и строит комплексные отчеты для ежемесячной аналитики продаж. DeepSeek незаменим для технических задач: код, математические модели, оценка IT-архитектуры.
Manus добавила недавно - это уже не просто чат-бот, а автономный агент. Автоматизирует целые процессы, интегрируется с CRM и базами данных, структурирует хаотичные массивы информации. Для малого бизнеса окупается быстро, хотя тоже просит номер телефона при регистрации.
3️⃣ Локальные модели использую для коммерческих и конфиденциальных данных, если лень обезличивать. Qwen, Gemma, облегченные GPT требуют серьезных вложений - от двух тысяч долларов за GPU, как подержанная машина. Но для базовых задач хватает младших версий. Gemma 7B обрабатывает внутренние документы, Qwen 14B разбирает финансовые отчеты. Советую сначала протестировать модели в облаке, а потом уже ставить на свои серверы.
Я часто передаю результат от одной к другой - Claude анализирует рынок, Gemini создает визуализацию, DeepSeek проверяет техническую реализуемость, а Grok мониторит реакцию аудитории. Как в хорошей команде, где каждый специалист силен в своей области, но вместе они дают прирост эффективности в два-три раза.
Главное правило, которое я выработала: не пытаться втиснуть все задачи в одну модель. Каждая хороша в своей области, и грамотное сочетание дает максимальный результат.
Всем мира, здоровья, добра! И отличных выходных!
#ИИмодели
From Channel
[[Ольга Пугачева: бизнес с ИИ]]
https://t.me/olgapugacheva_ai/135
%% Forward By
%%