AI • Telegram • RAG • BSD

AI‑архивариус знаний

Тихо слушает групповые чаты Telegram, фильтрует шум, извлекает факты и отвечает через RAG‑пайплайн. Без лишнего — только полезное.

Репозиторий Документация

377+ тестов

6 AI-моделей

14 метрик Prometheus

4 роли доступа

Как это работает

Сообщения проходят через многоуровневый AI-пайплайн — каждый уровень выполняет свою задачу.

Вход

Сообщение из чата

Бот тихо слушает чат и принимает текст, голос, изображения, файлы и ссылки.

Разбор

Сплиттер списков

Если сообщение содержит несколько фактов — разбиваем на отдельные записи.

L1 Фильтр

SAVE или SKIP

Быстрая модель определяет — полезная информация или шум. Без лишних затрат.

L3 Извлечение

Тезис, теги, даты

Умная модель формирует краткий тезис, подбирает теги и извлекает даты событий.

L2 Вектор

Эмбеддинг текста

Текст превращается в вектор для семантического поиска по базе знаний.

Хранение

PostgreSQL + pgvector

Факт сохраняется с автодедупликацией. Готов к гибридному поиску: вектор + ключевые слова.

Возможности

Полный цикл: от приёма сообщений до ответов на вопросы.

Запись

Пайплайн записи

Многоуровневая обработка входящих сообщений

Тихий слушатель — фиксирует факты от всех
Настраиваемая модерация (strict / moderate / relaxed / off)
Разбор списков на отдельные записи
Извлечение дат событий
Голос, изображения, файлы, ссылки
Автодедупликация

Поиск

RAG-пайплайн

Ответы на вопросы по накопленной базе знаний

Гибридный поиск (вектор + ключевые слова)
Генерация ответов с контекстом
Указание источников
Даты событий в результатах
Доменные глоссарии

Безопасность

Управление доступом

Четырёхуровневая ролевая модель

Super Admin — полный контроль
Admin — управление вайтлистом
Whitelisted — запросы к базе
Contributor — только запись

Продакшн

Эксплуатация

Продакшн-готовая инфраструктура

Health / Ready / Metrics эндпоинты
14 метрик Prometheus
Graceful shutdown с таймаутами
CI/CD: линт, типы, 394+ тестов
Multi-stage Docker, non-root

Чем мы отличаемся

Cogni-Vault — не скрипт автоматизации, а архитектура когнитивной обработки.

Характеристика	Типичный RAG-бот	Cogni-Vault
AI-пайплайн	1 модель на все задачи	6 моделей по тирам (L1–L4, OCR, STT)
Фильтрация шума	Нет или по длине текста	AI-фильтр SAVE / SKIP с 4 уровнями модерации
Обработка данных	Сырое сохранение	Факты, теги, даты, разбор списков
Поиск	Только векторный	Гибрид: вектор + ключевые слова
Форматы ввода	Текст	Текст, голос, фото, PDF, DOCX, ссылки
Группировка	Нет	Debouncer быстрых сообщений
Доступ	Токен бота	4-уровневая ролевая модель
Мониторинг	Нет	Health / Ready / 14 метрик Prometheus
Провайдеры	1 API, 1 модель	Мульти-провайдер, любой OpenAI-совм. API
Запуск	Нужна интеграция	docker compose up — и бот в чате

Cogni-Vault не просто сохраняет сообщения — он их осмысляет. Входящий текст проходит через фильтрацию, извлечение фактов, тегирование и векторизацию перед сохранением в базу знаний.

Уровни AI-моделей

Оптимизация затрат: каждая задача использует модель подходящего уровня.

Dumb Model

Быстрый бинарный фильтр: SAVE или SKIP.

Фильтрация Низкая стоимость

Embedding Model

Превращает текст в вектор для семантического поиска.

Векторизация pgvector

DumbSmart Model

Классификация, тезисы, теги и извлечение дат.

Тезисы Теги Даты

Smart Model

RAG-ответы с tool calling по всей базе знаний.

RAG Tool calling

OCR

Vision

Извлечение текста из изображений и фотографий.

Изображения Фото

STT

Whisper

Распознавание речи из голосовых сообщений.

Голос Транскрипция

Технологический стек

Runtime Python 3.11+

Bot Framework aiogram 3.x

База данных PostgreSQL 16

Вектора pgvector

ORM SQLAlchemy 2.0

Миграции Alembic

Конфигурация Pydantic v2

Логирование structlog

Контейнеры Docker Compose

CI/CD GitVerse

LLM API Cloud.ru

Лицензия BSD-3-Clause

Попробуйте сами

Откройте репозиторий, клонируйте и разверните за минуту с Docker Compose.

Репозиторий Документация