AI‑архивариус знаний
Тихо слушает групповые чаты Telegram, фильтрует шум, извлекает факты и отвечает через RAG‑пайплайн. Без лишнего — только полезное.
Как это работает
Сообщения проходят через многоуровневый AI-пайплайн — каждый уровень выполняет свою задачу.
Сообщение из чата
Бот тихо слушает чат и принимает текст, голос, изображения, файлы и ссылки.
Сплиттер списков
Если сообщение содержит несколько фактов — разбиваем на отдельные записи.
SAVE или SKIP
Быстрая модель определяет — полезная информация или шум. Без лишних затрат.
Тезис, теги, даты
Умная модель формирует краткий тезис, подбирает теги и извлекает даты событий.
Эмбеддинг текста
Текст превращается в вектор для семантического поиска по базе знаний.
PostgreSQL + pgvector
Факт сохраняется с автодедупликацией. Готов к гибридному поиску: вектор + ключевые слова.
Возможности
Полный цикл: от приёма сообщений до ответов на вопросы.
Пайплайн записи
Многоуровневая обработка входящих сообщений
- Тихий слушатель — фиксирует факты от всех
- Настраиваемая модерация (strict / moderate / relaxed / off)
- Разбор списков на отдельные записи
- Извлечение дат событий
- Голос, изображения, файлы, ссылки
- Автодедупликация
RAG-пайплайн
Ответы на вопросы по накопленной базе знаний
- Гибридный поиск (вектор + ключевые слова)
- Генерация ответов с контекстом
- Указание источников
- Даты событий в результатах
- Доменные глоссарии
Управление доступом
Четырёхуровневая ролевая модель
- Super Admin — полный контроль
- Admin — управление вайтлистом
- Whitelisted — запросы к базе
- Contributor — только запись
Эксплуатация
Продакшн-готовая инфраструктура
- Health / Ready / Metrics эндпоинты
- 14 метрик Prometheus
- Graceful shutdown с таймаутами
- CI/CD: линт, типы, 394+ тестов
- Multi-stage Docker, non-root
Чем мы отличаемся
Cogni-Vault — не скрипт автоматизации, а архитектура когнитивной обработки.
| Характеристика | Типичный RAG-бот | Cogni-Vault |
|---|---|---|
| AI-пайплайн | 1 модель на все задачи | 6 моделей по тирам (L1–L4, OCR, STT) |
| Фильтрация шума | Нет или по длине текста | AI-фильтр SAVE / SKIP с 4 уровнями модерации |
| Обработка данных | Сырое сохранение | Факты, теги, даты, разбор списков |
| Поиск | Только векторный | Гибрид: вектор + ключевые слова |
| Форматы ввода | Текст | Текст, голос, фото, PDF, DOCX, ссылки |
| Группировка | Нет | Debouncer быстрых сообщений |
| Доступ | Токен бота | 4-уровневая ролевая модель |
| Мониторинг | Нет | Health / Ready / 14 метрик Prometheus |
| Провайдеры | 1 API, 1 модель | Мульти-провайдер, любой OpenAI-совм. API |
| Запуск | Нужна интеграция | docker compose up — и бот в чате |
Уровни AI-моделей
Оптимизация затрат: каждая задача использует модель подходящего уровня.
Dumb Model
Быстрый бинарный фильтр: SAVE или SKIP.
Embedding Model
Превращает текст в вектор для семантического поиска.
DumbSmart Model
Классификация, тезисы, теги и извлечение дат.
Smart Model
RAG-ответы с tool calling по всей базе знаний.
Vision
Извлечение текста из изображений и фотографий.
Whisper
Распознавание речи из голосовых сообщений.
Технологический стек
Попробуйте сами
Откройте репозиторий, клонируйте и разверните за минуту с Docker Compose.