✅派聪明 RAG 系统的聊天助手模块设计方案

功能模块	技术选型	备注
实时通信	WebSocket（基于Spring WebSocket）	支持STOMP子协议
对话上下文存储	Redis（使用Spring Data Redis）	高性能缓存，支持TTL
本地知识库（当前）	Elasticsearch	支持混合检索
本地知识库（规划）	Faiss	提升向量检索性能
语言模型调用	DeepSeek API	通过WebClient调用
Prompt管理	自研模板引擎	支持动态模板和变量替换
异步处理	Spring WebFlux	支持响应式编程
安全认证	JWT	确保WebSocket连接安全

呃呃呃 2026年03月23日 15:19

引用原文：Prompt 模板缓存

@派聪明系统中有哪些模板

回复取消回复

呃呃呃 2026年03月23日 15:08

引用原文：快速查找某个用户的当前会话 ID

@派聪明查找某个用户的当前会话ID有什么用

回复取消回复

桉 2026年03月22日 14:54

引用原文：系统会去 Redis 中查找当前用户对应的 conversationId，也就是这位用户当前正在使用的那一轮对话的标识

@派聪明如果是用户想要查看之前的其他会话的历史记录呢，系统的响应流程和数据流是什么样的？

回复1 取消回复

派聪明 2026年03月22日 14:56

根据参考资料，当用户想要查看**之前其他会话**的历史记录时，系统的响应流程和数据流如下： --- ### **响应流程** 1. **发起查询请求** - 客户端向服务端发送 `GET /api/v1/users/conversation` 请求，携带用户的 JWT 认证信息。 2. **身份验证** - 服务端验证用户身份合法性。 3. **获取历史会话列表** - 服务端从 Redis 中读取用户的历史会话列表： - **Key**: `user:{userId}:conversations` - **Value**: 用户所有 `conversationId` 的 JSON 数组（按时间倒序排列）。 - 示例数据： ```json ["conv_20250526_1", "conv_20250525_3", "conv_20250520_2"] ``` 4. **定位目标会话** - 客户端需指定目标 `conversationId`（通过前端交互让用户选择会话）。 - 服务端根据提供的 `conversationId`，从 Redis 读取对应对话历史： - **Key**: `conversation:{conversationId}` - **Value**: 包含 `role`、`content`、`timestamp` 的消息数组（最多保存 20 条）。 - 示例数据： ```json { "messages": [ {"role": "user", "content": "问题A", "timestamp": "2025-05-26T10:30:15"}, {"role": "assistant", "content": "回答A", "timestamp": "2025-05-26T10:30:15"} ] } ``` 5. **返回历史记录** - 服务端格式化数据并返回给客户端，前端渲染为对话列表。 --- ### **数据流图示** ```mermaid sequenceDiagram participant Client participant Service participant Redis Client->>Service: GET /api/v1/users/conversation (JWT) Service->>Redis: GET user:{userId}:conversations Redis-->>Service: 返回历史会话ID列表 [conv_1, conv_2...] Service-->>Client: 返回会话ID列表（前端展示） Client->>Service: GET /api/v1/users/conversation?conversationId=conv_1 Service->>Redis: GET conversation:conv_1 Redis-->>Service: 返回对话历史消息 Service-->>Client: 返回格式化历史记录 ``` --- ### **关键点说明** 1. **多会话管理** - 系统通过 `user:{userId}:conversations` 存储用户的所有会话 ID，支持跨会话历史查询。 2. **数据隔离** - 每个会话的历史记录独立存储于 `conversation:{conversationId}`，避免混淆。 3. **性能优化** - Redis 的 TTL（7天）自动清理过期会话，防止数据堆积。 4. **前端交互** - 客户端需先获取会话列表，再由用户选择具体会话查询历史（参考资料未提供批量接口）。 > ⚠️ 注意：参考资料中未提供直接按 `conversationId` 查询的接口，实际实现需扩展 `/api/v1/users/conversation` 支持查询参数（如 `?conversationId=xxx`）。

回复取消回复

过时的草莓 2026年03月20日 15:27

引用原文： user:{userId}:current_conversation

userId怎么生成的@派聪明

回复1 取消回复

派聪明 2026年03月20日 15:27

根据参考资料，`userId` 的生成流程如下： 1. **用户身份认证** 用户首次登录时，系统通过 **JWT（JSON Web Token）** 进行身份验证。JWT 中包含用户的唯一标识（如用户ID、用户名等），由服务端在用户成功登录后生成并返回给客户端。 2. **客户端携带 JWT** 在后续操作中（如创建会话、发起对话），客户端需在请求头中携带有效的 JWT（例如 `Authorization: Bearer {JWT_TOKEN}`），用于证明用户身份。 3. **服务端解析 JWT** 服务端收到请求后，解析 JWT 获取其中的 `userId` 字段（或其他唯一标识字段）。例如： ```json // JWT 示例载荷（Payload） { "userId": "12345", // 用户唯一标识 "username": "test", "exp": 1703123456 } ``` 4. **构建 Redis 键名** 服务端将解析出的 `userId` 直接嵌入到 Redis 键名模板中，生成完整的键名： ```json Key: user:{userId}:current_conversation 示例: user:12345:current_conversation ``` ### 关键点总结： - **`userId` 来源**：JWT 中的用户唯一标识（如数据库主键、用户名等）。 - **生成场景**：用户登录时由服务端生成 JWT，后续操作通过 JWT 传递 `userId`。 - **用途**：用于管理用户会话（如当前会话映射、历史记录存储）。 > 注：系统未明确说明 `userId` 的具体生成规则（如是否为自增ID、UUID等），但核心机制是通过 **JWT 传递用户身份标识** 来动态构建 Redis 键名。

回复取消回复

过时的草莓 2026年03月20日 15:14

引用原文：和客户端建立一个稳定的 WebSocket 长连接

代码如何实现@派聪明

回复1 取消回复

派聪明 2026年03月20日 15:15

根据参考资料中的技术选型（WebSocket + Spring WebSocket + JWT），建立稳定 WebSocket 长连接的代码实现如下： --- ### 1. **WebSocket 配置类** ```java @Configuration @EnableWebSocketMessageBroker public class WebSocketConfig implements WebSocketMessageBrokerConfigurer { @Override public void registerStompEndpoints(StompEndpointRegistry registry) { // 注册 WebSocket 端点，支持 STOMP 子协议 registry.addEndpoint("/chat/{token}") // {token} 为 JWT 令牌 .setAllowedOriginPatterns("*") // 生产环境需配置具体域名 .withSockJS(); // 兼容浏览器 } @Override public void configureMessageBroker(MessageBrokerRegistry registry) { // 启用简单消息代理，广播前缀 /topic，点对点前缀 /user registry.enableSimpleBroker("/topic", "/user"); registry.setApplicationDestinationPrefixes("/app"); } } ``` --- ### 2. **JWT 认证拦截器** ```java @Component public class JwtChannelInterceptor implements ChannelInterceptor { @Override public Message<?> preSend(Message<?> message, MessageChannel channel) { StompHeaderAccessor accessor = MessageHeaderAccessor.getAccessor(message, StompHeaderAccessor.class); // 握手请求时校验 JWT if (StompCommand.CONNECT.equals(accessor.getCommand())) { String token = accessor.getFirstNativeHeader("Authorization"); if (token == null || !validateToken(token)) { throw new AuthenticationCredentialsNotFoundException("JWT 无效"); } } return message; } private boolean validateToken(String token) { // 实现 JWT 解析和校验逻辑 return JwtUtil.validate(token); // 假设的校验方法 } } ``` --- ### 3. **注册拦截器** ```java @Configuration public class WebSocketSecurityConfig implements WebSocketMessageBrokerConfigurer { @Autowired private JwtChannelInterceptor jwtInterceptor; @Override public void configureClientInboundChannel(ChannelRegistration registration) { // 注册 JWT 拦截器 registration.interceptors(jwtInterceptor); } } ``` --- ### 4. **连接建立后的处理** ```java @Controller public class ChatController { @MessageMapping("/chat.message") @SendTo("/topic/chat") // 广播消息到订阅者 public String handleMessage(String message, Principal principal) { // 处理用户消息（principal 包含已认证的用户信息） return "处理结果: " + message; } @EventListener public void handleWebSocketDisconnect(SessionDisconnectEvent event) { // 处理连接断开事件 System.out.println("用户断开连接: " + event.getUser()); } } ``` --- ### 关键点说明： 1. **稳定连接保障**： - 使用 `withSockJS()` 兼容浏览器 WebSocket 断线重连 - 通过 STOMP 协议实现消息可靠性传输 - Spring 自动管理 WebSocket 会话生命周期 2. **安全认证**： - JWT 令牌通过 `Authorization` 头传递 - 拦截器在连接握手时校验令牌有效性 - 已认证用户通过 `Principal` 对象获取身份信息 3. **连接管理**： - `SessionDisconnectEvent` 监听连接断开事件 - 可结合 Redis 实现分布式会话管理（参考资料中提到的会话存储） > 实际部署时需注意：Nginx 反向代理需配置 WebSocket 代理（如 `proxy_http_version 1.1`），并调整超时参数（`proxy_read_timeout`）以维持长连接稳定性。

回复取消回复

hututu 2026年03月11日 14:27

引用原文：01、WebSocket 接口 URL: /chat/{token} 协议: WebSocket 功能: 用户通过 WebSocket 发送消息，服务端逐段返回回答内容

@派聪明这个部分代码在哪啊

回复1 取消回复

派聪明 2026年03月11日 14:29

根据参考资料中的描述，WebSocket 接口的代码实现通常位于以下位置（基于 Spring Boot 项目结构推测）： ### 1. **WebSocket 配置类** - **路径示例**：`com.paicoding.config.WebSocketConfig.java` - **关键内容**： ```java @Configuration @EnableWebSocketMessageBroker public class WebSocketConfig implements WebSocketMessageBrokerConfigurer { @Override public void registerStompEndpoints(StompEndpointRegistry registry) { // 注册 WebSocket 端点，对应 /chat/{token} registry.addEndpoint("/chat/{token}") .setAllowedOriginPatterns("*") // 生产环境需限制 .withSockJS(); } @Override public void configureMessageBroker(MessageBrokerRegistry config) { // 启用基于内存的消息代理 config.enableSimpleBroker("/topic"); config.setApplicationDestinationPrefixes("/app"); } } ``` ### 2. **消息处理器（Controller）** - **路径示例**：`com.paicoding.controller.ChatController.java` - **关键内容**： ```java @Controller public class ChatController { @MessageMapping("/chat/{token}") // 处理客户端发往 /app/chat/{token} 的消息 @SendTo("/topic/replies") // 将响应发送到 /topic/replies 通道 public String handleChatMessage(String message, @DestinationVariable String token) { // 1. 验证 token（JWT 身份认证） // 2. 调用知识库检索 // 3. 构建 Prompt 并调用 DeepSeek API // 4. 流式返回结果 return "Processed: " + message; } } ``` ### 3. **流式响应处理** - **实现方式**：通过 `SimpMessagingTemplate` 或直接返回 `Flux<String>`（基于 Spring WebFlux） - **示例**： ```java @Autowired private SimpMessagingTemplate messagingTemplate; public void streamResponse(String conversationId, Flux<String> responseStream) { responseStream .doOnNext(chunk -> messagingTemplate.convertAndSend("/topic/replies", chunk)) .subscribe(); } ``` ### 4. **客户端调用代码** - **前端示例**（JavaScript）： ```javascript const socket = new SockJS('/chat/JWT_TOKEN_HERE'); const stompClient = Stomp.over(socket); stompClient.connect({}, () => { stompClient.subscribe('/topic/replies', (message) => { console.log('收到响应片段:', message.body); }); stompClient.send("/app/chat/JWT_TOKEN_HERE", {}, "用户问题内容"); }); ``` ### 关键说明： 1. **安全认证**： - WebSocket 连接建立时，服务端需通过 `{token}`（JWT）验证用户身份（参考资料中的 JWT 技术选型）。 2. **流式返回**： - 服务端通过 `@SendTo` 或 `messagingTemplate` 逐段推送响应内容，客户端实时渲染。 3. **停止指令**： - 客户端需先调用 `/api/chat/websocket-token` 获取停止令牌，再发送 `{type: "stop", _internal_cmd_token: "..."}` 格式的消息终止响应。 > ⚠️ **注意**：实际代码路径可能因项目结构调整，建议通过以下方式定位： > - 搜索 `@EnableWebSocketMessageBroker` 或 `@MessageMapping` 注解； > - 在 `resources/static` 目录下查找前端 WebSocket 连接代码。

回复取消回复

Via 2026年03月09日 22:58

引用原文：程中还会管理好上下文的长度，保证多轮对话的连贯性，最终生成一份结构化的 Promp

@派聪明这算是提示词工程吗？

回复3 取消回复

派聪明 2026年03月09日 23:00

是的，这**属于提示词工程（Prompt Engineering）的核心实践**。以下是具体分析： --- ### 1. **上下文管理是提示词工程的核心环节** - **文本中提到的“管理上下文长度，保证多轮对话连贯性”**，本质是通过**结构化Prompt设计**实现上下文的有效传递。 - 例如：系统会将历史对话（用户提问+模型回答）嵌入当前Prompt，确保模型理解前文逻辑（如参考资料中Redis存储对话历史、动态生成Prompt）。 --- ### 2. **结构化Prompt是提示词工程的核心手段** - **“生成一份结构化的Prompt”** 明确指向提示词工程的核心目标：通过**模板化设计**优化模型输入。 - 参考资料： - 系统支持**多种Prompt模板配置与调优**（如知识问答、多轮对话等场景）。 - Prompt模板包含**系统指令、检索结果、历史上下文、用户问题**等模块（示例模板见参考资料“Prompt模板缓存”部分）。 - 动态变量替换（如`{{context}}`、`{{history}}`）确保内容组织清晰，引导模型生成高质量回答。 --- ### 3. **与RAG（检索增强生成）的强关联性** - 参考资料：此机制是**实现RAG的关键保障**。 - **结构化Prompt**将检索到的知识片段（来自Elasticsearch）与对话上下文结合，确保模型回答“既有语义逻辑，又有知识依据”。 - 例如：模板中明确要求模型“优先基于参考信息回答”，并规范引用格式（如`[文档X]`）。 --- ### 结论该文本描述的**上下文管理+结构化Prompt生成**，是提示词工程在**多轮对话场景下的典型应用**，尤其服务于RAG系统。其核心是通过**模板化、动态化、结构化**的Prompt设计，优化模型输入，提升回答的连贯性、准确性和可信度。

回复取消回复

嘿嗨 2026年03月18日 16:06

@派聪明, 是如何设计检索增强生成 (RAG) 流程，通过用户提问与检索结果生成增强 Prompt，并结合上下文语义理解提升问答准确度。详细回答这个

是的，这**属于提示词工程（Prompt Engineering）的核心实践**。以下是具体分析： --- ### 1. **上下文管理是提示词工程的核心环节** - **文本中提到的“管理上下文长度，保证多轮对话连贯性”**，本质是通过**结构化Prompt设计**实现上下文的有效传递。 - 例如：系统会将历史对话（用户提问+模型回答）嵌入当前Prompt，确保模型理解前文逻辑（如参考资料中Redis存储对话历史、动态生成Prompt）。 --- ### 2. **结构化Prompt是提示词工程的核心手段** - **“生成一份结构化的Prompt”** 明确指向提示词工程的核心目标：通过**模板化设计**优化模型输入。 - 参考资料： - 系统支持**多种Prompt模板配置与调优**（如知识问答、多轮对话等场景）。 - Prompt模板包含**系统指令、检索结果、历史上下文、用户问题**等模块（示例模板见参考资料“Prompt模板缓存”部分）。 - 动态变量替换（如`{{context}}`、`{{history}}`）确保内容组织清晰，引导模型生成高质量回答。 --- ### 3. **与RAG（检索增强生成）的强关联性** - 参考资料：此机制是**实现RAG的关键保障**。 - **结构化Prompt**将检索到的知识片段（来自Elasticsearch）与对话上下文结合，确保模型回答“既有语义逻辑，又有知识依据”。 - 例如：模板中明确要求模型“优先基于参考信息回答”，并规范引用格式（如`[文档X]`）。 --- ### 结论该文本描述的**上下文管理+结构化Prompt生成**，是提示词工程在**多轮对话场景下的典型应用**，尤其服务于RAG系统。其核心是通过**模板化、动态化、结构化**的Prompt设计，优化模型输入，提升回答的连贯性、准确性和可信度。

回复取消回复

派聪明 2026年03月18日 16:07

派聪明的RAG设计通过以下流程实现问答准确度提升： 1. **混合检索机制**：调用`/api/search/hybrid`接口，结合关键词匹配和语义匹配，从Elasticsearch知识库快速定位相关文档片段，经过筛选排序后提取关键内容和出处。 2. **动态Prompt构建**：根据检索结果和问题类型，选择合适的Prompt模板，将检索内容、对话历史和系统指令整合，确保回答既有知识依据又保持语义连贯。 3. **上下文语义理解**：通过Redis存储多轮对话历史，系统在构建Prompt时会注入历史对话内容，使模型能够理解上下文，实现"记忆"功能。 4. **流式生成响应**：调用DeepSeek API生成回答，通过WebSocket逐段返回内容，提升用户体验。同时处理异常情况，如超时或空内容。 5. **会话管理**：为每个对话创建唯一conversationId，维护用户与会话映射，设置TTL自动过期，确保会话安全和资源合理利用。这种设计确保回答基于最新知识库内容，减少模型幻觉，同时通过上下文管理支持连续对话，显著提升问答准确度和用户体验。

@派聪明, 是如何设计检索增强生成 (RAG) 流程，通过用户提问与检索结果生成增强 Prompt，并结合上下文语义理解提升问答准确度。详细回答这个

回复取消回复

lolaqaq 2026年03月07日 16:48

引用原文：准备好 Prompt 之后

@派聪明具体Prompt是什么

回复1 取消回复

派聪明 2026年03月07日 16:49

根据参考资料，Prompt 是系统动态构建的指令模板，用于引导大语言模型（如 DeepSeek）生成高质量回答。其核心结构包含以下关键要素： ### 1. **动态生成机制** - 系统根据用户问题从 **Elasticsearch 检索知识库**，获取相关文档片段（`context`）。 - 结合 **Redis 存储的对话历史**（`history`）和当前用户问题（`query`），动态填充模板。 ### 2. **模板结构示例** 参考资料中提供的模板片段如下： ```json { "name": "knowledge_qa", "template": "你是派聪明，一个基于本地知识库的智能助手。\n\n当回答问题时，请遵循以下规则：\n1. 优先基于提供的参考信息回答\n2. 如果参考信息不足，清楚地表明\n3. 回答要简洁、准确、客观\n4. 引用来源时使用[文档X]格式\n\n参考信息：\n{{context}}\n\n对话历史：\n{{history}}\n\n用户问题：{{query}}\n\n请用中文回答。", "variables": ["context", "history", "query"] } ``` ### 3. **核心变量说明** - **`{{context}}`**： Elasticsearch 检索到的知识库内容（如文档片段、关键信息）。 - **`{{history}}`**： Redis 中存储的对话历史（格式为 `role: user/assistant, content: 对话内容`）。 - **`{{query}}`**：用户当前输入的问题。 ### 4. **设计目标** - **确保回答有依据**：强制模型基于检索到的 `context` 生成内容，避免“幻觉”。 - **维持上下文连贯**：通过 `history` 实现多轮对话的语义衔接。 - **规范输出格式**：要求引用来源（如 `[文档1]`），提升可信度。 ### 5. **技术实现** - 使用 **自研模板引擎** 动态替换变量，支持 `max_tokens` 限制（如示例中 4000）。 - 通过 **Prompt 缓存**（Redis Key: `prompt_templates:{templateName}`）提升性能。 > 💡 **总结**：Prompt 是系统将 **检索结果、对话历史、用户问题** 结构化整合后的指令模板，其核心作用是约束大模型基于本地知识生成精准、可追溯的回答。完整模板设计可参考：[派聪明 Prompt 设计方案](https://paicoding.com/article/detail/2526728310765577)。

回复取消回复

忧伤的雨 2026年03月06日 19:31

引用原文：通过把知识库中最相关的信息“喂”给大模型，回答内容更聚焦、更靠谱

为什么从知识库获取的信息要交给大模型

回复取消回复

忧伤的雨 2026年03月06日 19:24

引用原文：在拿到检索结果后，系统会开始构建 Prompt，也就是发送给大模型的提问模板。它会根据问题类型选择一个合适的 Prompt 模板，然后把刚刚检索到的内容填进去，同时还会加上一些系统级的指令或限制条件

@派聪明

回复1 取消回复

派聪明 2026年03月06日 19:25

根据参考资料，系统构建Prompt的核心流程如下： 1. **模板选择** 系统根据用户问题类型（如知识问答、指令生成等）从预设的Prompt模板库中匹配最合适的模板。模板通过自研引擎管理，支持动态配置和变量替换（参考资料：技术选型、Prompt管理）。 2. **内容填充** 将混合检索（Elasticsearch）获取的相关知识片段作为`context`变量注入模板，同时结合多轮对话历史（Redis存储）作为`history`变量，确保上下文连贯性（参考资料：关键流程、Redis结构设计）。 3. **系统指令集成** 在模板中嵌入系统级规则（如回答优先级、引用格式、输出限制等），例如要求"优先基于参考信息回答"并标注来源（参考资料：Prompt构建与模板管理、示例模板）。 4. **上下文优化** 动态调整Prompt长度，避免超模型上下文限制，同时通过变量替换机制灵活组织内容结构（参考资料：Prompt管理、关键流程）。 **核心价值**：这一机制是RAG（检索增强生成）的核心保障，确保大模型回答既基于知识库事实，又符合语义逻辑和输出规范（参考资料：小结）。

回复取消回复

一、功能需求

二、技术选型

三、关键流程

01、用户发起对话流程

热门评论

10 条评论

目录

划词评论