AI • Telegram • RAG • BSD

AI‑архивариус знаний

Тихо слушает групповые чаты Telegram, фильтрует шум, извлекает факты и отвечает через RAG‑пайплайн. Без лишнего — только полезное.

377+ тестов
6 AI-моделей
14 метрик Prometheus
4 роли доступа

Как это работает

Сообщения проходят через многоуровневый AI-пайплайн — каждый уровень выполняет свою задачу.

01
Вход

Сообщение из чата

Бот тихо слушает чат и принимает текст, голос, изображения, файлы и ссылки.

02
Разбор

Сплиттер списков

Если сообщение содержит несколько фактов — разбиваем на отдельные записи.

03
L1 Фильтр

SAVE или SKIP

Быстрая модель определяет — полезная информация или шум. Без лишних затрат.

04
L3 Извлечение

Тезис, теги, даты

Умная модель формирует краткий тезис, подбирает теги и извлекает даты событий.

05
L2 Вектор

Эмбеддинг текста

Текст превращается в вектор для семантического поиска по базе знаний.

06
Хранение

PostgreSQL + pgvector

Факт сохраняется с автодедупликацией. Готов к гибридному поиску: вектор + ключевые слова.

Возможности

Полный цикл: от приёма сообщений до ответов на вопросы.

Запись

Пайплайн записи

Многоуровневая обработка входящих сообщений

  • Тихий слушатель — фиксирует факты от всех
  • Настраиваемая модерация (strict / moderate / relaxed / off)
  • Разбор списков на отдельные записи
  • Извлечение дат событий
  • Голос, изображения, файлы, ссылки
  • Автодедупликация
Поиск

RAG-пайплайн

Ответы на вопросы по накопленной базе знаний

  • Гибридный поиск (вектор + ключевые слова)
  • Генерация ответов с контекстом
  • Указание источников
  • Даты событий в результатах
  • Доменные глоссарии
Безопасность

Управление доступом

Четырёхуровневая ролевая модель

  • Super Admin — полный контроль
  • Admin — управление вайтлистом
  • Whitelisted — запросы к базе
  • Contributor — только запись
Продакшн

Эксплуатация

Продакшн-готовая инфраструктура

  • Health / Ready / Metrics эндпоинты
  • 14 метрик Prometheus
  • Graceful shutdown с таймаутами
  • CI/CD: линт, типы, 394+ тестов
  • Multi-stage Docker, non-root

Чем мы отличаемся

Cogni-Vault — не скрипт автоматизации, а архитектура когнитивной обработки.

Характеристика Типичный RAG-бот Cogni-Vault
AI-пайплайн 1 модель на все задачи 6 моделей по тирам (L1–L4, OCR, STT)
Фильтрация шума Нет или по длине текста AI-фильтр SAVE / SKIP с 4 уровнями модерации
Обработка данных Сырое сохранение Факты, теги, даты, разбор списков
Поиск Только векторный Гибрид: вектор + ключевые слова
Форматы ввода Текст Текст, голос, фото, PDF, DOCX, ссылки
Группировка Нет Debouncer быстрых сообщений
Доступ Токен бота 4-уровневая ролевая модель
Мониторинг Нет Health / Ready / 14 метрик Prometheus
Провайдеры 1 API, 1 модель Мульти-провайдер, любой OpenAI-совм. API
Запуск Нужна интеграция docker compose up — и бот в чате
Cogni-Vault не просто сохраняет сообщения — он их осмысляет. Входящий текст проходит через фильтрацию, извлечение фактов, тегирование и векторизацию перед сохранением в базу знаний.

Уровни AI-моделей

Оптимизация затрат: каждая задача использует модель подходящего уровня.

L1

Dumb Model

Быстрый бинарный фильтр: SAVE или SKIP.

Фильтрация Низкая стоимость
L2

Embedding Model

Превращает текст в вектор для семантического поиска.

Векторизация pgvector
L3

DumbSmart Model

Классификация, тезисы, теги и извлечение дат.

Тезисы Теги Даты
L4

Smart Model

RAG-ответы с tool calling по всей базе знаний.

RAG Tool calling
OCR

Vision

Извлечение текста из изображений и фотографий.

Изображения Фото
STT

Whisper

Распознавание речи из голосовых сообщений.

Голос Транскрипция

Технологический стек

Runtime Python 3.11+
Bot Framework aiogram 3.x
База данных PostgreSQL 16
Вектора pgvector
ORM SQLAlchemy 2.0
Миграции Alembic
Конфигурация Pydantic v2
Логирование structlog
Контейнеры Docker Compose
CI/CD GitVerse
LLM API Cloud.ru
Лицензия BSD-3-Clause

Попробуйте сами

Откройте репозиторий, клонируйте и разверните за минуту с Docker Compose.