Технологический стек
Технологический стек: современный ИИ в юридической практике¶
Этот раздел показывает одну общую карту технологического стека, собранную по слоям — от пользователя до данных и автоматизации.
Диаграмма подходит как для слайда в докладе, так и для объяснения архитектуры на практике.
Полная карта технологий и их связей (по слоям)¶
graph TB
%% Слой 1: Пользователи
USER[1. Юрист / Пользователь]
%% Слой 1.5: Промпт-инжиниринг
PROMPT[1.1 Промпт-инжиниринг<br/>Few-shot / Chain-of-Thought / ReAct]
%% Слой 2: Интерфейсы
subgraph INTERFACE["2. Интерфейсы"]
WEB[2.1 Веб/мобильное приложение]
CHAT[2.2 Чат в CRM/DMS/портале]
API[2.3 API для интеграций]
end
%% Слой 3: Юридические приложения
subgraph APPS["3. ИИ-сервисы"]
APP1[3.1 Анализ договоров]
APP2[3.2 Due Diligence]
APP3[3.3 Юридический поиск]
APP4[3.4 Генерация документов]
end
%% Слой 4: Агенты и оркестрация
subgraph ORCHESTRATION["4. Агенты и оркестрация"]
AGENT[4.1 ИИ-агенты<br/>LangChain / LangGraph]
TEMPORAL[4.2 Temporal<br/>оркестрация процессов]
LANGFLOW[4.3 Langflow<br/>ИИ-пайплайны]
end
%% Слой 5: MCP-сервер (центральная интеграция)
MCP[5. MCP-сервер<br/>Model Context Protocol]
%% Слой 6: LLM модели
subgraph MODELS["6. LLM-модели"]
direction LR
PROP[6.1 Проприетарные<br/>GPT-4o, Claude 3.5,<br/>Gemini 2.0, GPT-5, DeepSeek]
OPEN[6.2 Открытые<br/>Llama 3, Mistral, Qwen]
end
%% Слой 7: Оптимизация открытых моделей
subgraph OPTIMIZE["7. Оптимизация моделей"]
direction LR
FINETUNE[7.1 Fine-tuning<br/>LoRA / QLoRA]
QUANT[7.2 Квантование<br/>4-8 bit / GGUF]
end
%% Слой 8: RAG система
subgraph RAG["8. RAG-система"]
direction LR
EMBED[8.1 Embedding-модели]
VDB[(8.2 Векторная БД<br/>Qdrant/Pinecone)]
end
%% Слой 9: Инструменты и автоматизация
subgraph TOOLS["9. Инструменты и<br/>автоматизация"]
direction LR
DB_TOOL[9.1 БД/SQL]
ERP_TOOL[9.2 ERP/CRM/1С/DMS]
RPA[9.3 n8n/RPA]
end
%% Слой 10: Данные
DATA[(10. Юридические данные<br/>Документы, база знаний, прецеденты,<br/>СЭД/DMS, CRM/ERP, судебные реестры)]
%% Связи по уровням (сверху вниз)
USER --> PROMPT
PROMPT --> WEB
PROMPT --> CHAT
PROMPT --> API
WEB --> APP1
WEB --> APP3
CHAT --> APP1
CHAT --> APP3
API --> APP2
API --> APP4
APP1 --> AGENT
APP2 --> AGENT
APP3 --> AGENT
APP4 --> AGENT
AGENT --> TEMPORAL
AGENT --> LANGFLOW
TEMPORAL --> MCP
LANGFLOW --> MCP
AGENT --> MCP
%% MCP как центральная точка
MCP --> PROP
MCP --> OPEN
MCP --> DB_TOOL
MCP --> ERP_TOOL
MCP --> RPA
%% Оптимизация для открытых моделей
OPEN --> FINETUNE
OPEN --> QUANT
%% RAG подключается к агенту
AGENT --> EMBED
EMBED --> VDB
%% Все ведёт к данным
VDB --> DATA
DB_TOOL --> DATA
ERP_TOOL --> DATA
RPA --> DATA
%% Стили
style USER fill:#e3f2fd,stroke:#1976d2,stroke-width:3px
style PROMPT fill:#fff9c4,stroke:#f57f17,stroke-width:2px
style MCP fill:#fff3e0,stroke:#f57c00,stroke-width:3px
style DATA fill:#f3e5f5,stroke:#7b1fa2,stroke-width:3px
style INTERFACE fill:#e1f5ff
style APPS fill:#f5f5f5
style ORCHESTRATION fill:#fff4e1
style MODELS fill:#c8e6c9
style OPTIMIZE fill:#e8f5e9
style RAG fill:#fffde7
style TOOLS fill:#fce4ec Пояснения по слоям¶
1. Пользователь и промпт-инжиниринг
Юрист взаимодействует с системой через промпты. Few-shot — обучение на примерах в промпте, Chain-of-Thought (CoT) — пошаговое рассуждение, ReAct — объединение рассуждения и действий для решения задач.
2. Интерфейсы
Точки входа: веб/мобильные приложения, чат-интерфейсы в CRM/DMS, API для интеграций с внешними системами.
3. ИИ-сервисы
Прикладные юридические сервисы: анализ договоров, Due Diligence, юридический поиск, генерация документов.
4. Агенты и оркестрация
ИИ-агенты (LangChain/LangGraph) координируют выполнение задач. Temporal обеспечивает надежную оркестрацию долгих процессов, Langflow — визуальное построение ИИ-пайплайнов.
5. MCP-сервер
Model Context Protocol — центральный протокол для интеграции моделей с инструментами и данными, единая точка подключения к различным ресурсам.
6. LLM-модели
Проприетарные (GPT-4o, Claude 3.5, Gemini 2.0) и открытые модели (Llama 3, Mistral, Qwen) для обработки естественного языка и генерации ответов.
7. Оптимизация моделей
Fine-tuning (LoRA/QLoRA) — дообучение под задачи, квантование (4-8 bit, GGUF) — сжатие для эффективного запуска на доступном оборудовании.
8. RAG-система
Retrieval-Augmented Generation: embedding-модели преобразуют документы в векторы, векторная БД (Qdrant/Pinecone) обеспечивает быстрый семантический поиск релевантной информации.
9. Инструменты и автоматизация
Интеграция с базами данных, ERP/CRM/1С/DMS системами, RPA-платформами (n8n) для автоматизации рутинных операций.
10. Данные
Источники: юридические документы, база знаний, прецеденты, системы документооборота (СЭД/DMS), CRM/ERP, судебные реестры.