WorkAdvisor: интеллектуальный ассистент по выполненным работам

Описание проекта

Этот проект представляет собой интеллектуального Telegram-бота, использующего современные технологии RAG (Retrieval-Augmented Generation), OCR, векторные базы данных и LLM (Large Language Models) для обработки текстовых и изображений-запросов. Бот способен отвечать на вопросы, опираясь на внутреннюю базу знаний, а также распознавать текст с изображений и генерировать по нему ответы.

Проект построен по модульному принципу.

Основные компоненты:

main.py - Точка входа: обработка входящих сообщений от Telegram
src/bot/ - Бот
src/graph_service.py - Оркестрация логики обработки запроса (State Graph)
src/rag_service.py - Поиск релевантных документов
src/llm_service.py - Генерация ответа с помощью LLM
src/ocr_service.py - Распознавание текста на изображениях
src/embedding_service.py - Генерация эмбеддингов через Yandex Cloud
src/clickhouse_service.py - Хранение и поиск по векторам (эмбеддингам)
src/prompt_service.py - Управление шаблонами промптов
src/semantic_coverage_service.py - Оценка качества ответа (насколько он покрывает контекст)

Как работает система

main.py — Приём и маршрутизация запросов Файл main.py — это точка входа, которая:

Получает обновления от Telegram (через webhook или polling).
Проверяет, что сообщение от доверенного пользователя (dmitry_plus).
Определяет тип контента: текст или фото.
Формирует начальное состояние GraphState.
Запускает GraphService для обработки.
Отправляет ответ в чат.

Режимы работы:

Если прислано изображение, извлекается base64-данные и передаётся в граф.

Если прислан текст, он сразу становится query.

src/graph_service.py — Граф обработки запроса Граф построен с использованием LangGraph — библиотеки для построения stateful-агентов.

Структура состояния

{
    "query": str,           // Текст запроса
    "relevants": list,      // Найденные документы
    "context": str,         // Объединённый текст документов
    "response": str,        // Готовый ответ
    "image_data": str,      // base64 изображения
    "prompt_template": PromptTemplate
}

route_image_or_query - Если есть изображение → ocr, иначе → retrieve
ocr - Распознаёт текст с изображения через OCRService и записывает в query
retrieve - Ищет релевантные документы через RAGService
init_prompt - Загружает нужный шаблон промпта (в зависимости от типа запроса)
generate - Генерирует ответ через LLMService
decide_to_generate - Проверяет, есть ли ошибка или уже ответ — если да, завершает граф

Визуализация графа

src/ocr_service.py — Распознавание текста

Использует Yandex Cloud Vision OCR API.
Принимает base64-изображение.
Поддерживает русский и английский языки.
Работает с рукописным текстом (model: "handwritten").
Возвращает распознанный текст, который становится новым query.

src/rag_service.py — Поиск по базе знаний Реализует RAG-подход:

Подготовка данных:

Документы загружаются из DataFrame (например, CSV с задачами).
Текст разбивается на чанки (RecursiveCharacterTextSplitter).
Каждый чанк векторизуется через YandexEmbeddingService.
Сохраняется в ClickHouse с метаданными (id, title, url, text, embedding).

Поиск:

Запрос векторизуется.
Ищутся ближайшие по косинусному расстоянию документы.
Формируется context из текста найденных чанков.

src/embedding_service.py — Генерация эмбеддингов

Использует Yandex Cloud ML SDK.

Два типа моделей:

doc — для векторизации документов.
query — для векторизации поисковых запросов.

Эмбеддинги используются в поиске и оценке качества.

src/clickhouse_service.py — Векторная база данных

Использует ClickHouse как векторное хранилище. Таблица tasks_clickhouse содержит:

id, title, url, text, embedding

Поддерживает поиск по косинусному расстоянию: cosineDistance(embedding, [...]).

src/llm_service.py — Генерация ответа

Использует YandexGPT через langchain_community.llms.YandexGPT.

Цепочка: PromptTemplate → LLM.

Поддержка Langfuse для:

Логирования запросов/ответов.
Мониторинга времени выполнения.
Оценки качества (через semantic_coverage).

В ответ добавляется ссылка на источники (формируются из метаданных)

src/prompt_service.py — Управление промптами

Загружает шаблоны из файлов:

prompts/answer_from_documents.txt — для текстовых запросов.
prompts/text_from_image_to_query.txt — для запросов с изображений.

Поддерживает передачу шаблона напрямую (для тестов).

Возвращает PromptTemplate из LangChain.

src/semantic_coverage_service.py— Оценка качества ответа

Рассчитывает семантическое покрытие:

Усредняет эмбеддинги релевантных документов → context_embedding.
Получает эмбеддинг ответа → response_embedding.
Считает косинусное сходство между ними.
Результат: число от 0 до 1 (чем ближе к 1 — тем лучше ответ отражает контекст).

Процесс запуска проекта

Создаем .env файл

Копируем файл .env.template в .env и заполняем переменные окружения.

Запускаем clickhouse сервер

docker run -d --rm --network=host --name otus-project-clickhouse --ulimit nofile=262144:262144 clickhouse

Запускаем сборку RAG

.venv/bin/python rag_create.py

Запускаем телеграм-бот

.venv/bin/python main.py

Скрины с демонстрацией работы проекта

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
img		img
prompts		prompts
src		src
tasks		tasks
.env.template		.env.template
.gitignore		.gitignore
README.md		README.md
graph_mermaid.png		graph_mermaid.png
graph_test.py		graph_test.py
main.py		main.py
ocr_test.py		ocr_test.py
rag_create.py		rag_create.py
rag_test.py		rag_test.py
text_query_test.py		text_query_test.py
Презентация.pptx		Презентация.pptx

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

WorkAdvisor: интеллектуальный ассистент по выполненным работам

Описание проекта

Как работает система

Визуализация графа

Процесс запуска проекта

Создаем .env файл

Запускаем clickhouse сервер

Запускаем сборку RAG

Запускаем телеграм-бот

Скрины с демонстрацией работы проекта

Текстовый запрос в телеграм-бот

Запрос в виде картинки в телеграм-бот

Результат выполнения кода в консоли при текстовом запросе

Результат выполнения кода в консоли при запросе картинкой

Экспорт данных мониторинга в langfuse

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

WorkAdvisor: интеллектуальный ассистент по выполненным работам

Описание проекта

Как работает система

Визуализация графа

Процесс запуска проекта

Создаем .env файл

Запускаем clickhouse сервер

Запускаем сборку RAG

Запускаем телеграм-бот

Скрины с демонстрацией работы проекта

Текстовый запрос в телеграм-бот

Запрос в виде картинки в телеграм-бот

Результат выполнения кода в консоли при текстовом запросе

Результат выполнения кода в консоли при запросе картинкой

Экспорт данных мониторинга в langfuse

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages