Qwen-Agent 内置RAG学习

张开发

• 2026/4/12 3:49:41 • 15 分钟阅读

分享文章

1、概述Qwen-Agent的内置rag系统默认基于BM25 关键词检索算法实现文档匹配是轻量级内存式RAGAssistant 传入files参数即激活内置 RAG适合小批量文件处理。【内存加载流程】1、文档解析与分块doc_parser(qwen_agent\tools\simple_doc_parser.py)按文件后缀pdf、txt、docx等解析文件按默认500字符将文本切分成多个文本块生成{page_content, metadata}的字典列表2、内存存储分块列表存储在内存中不持久化到磁盘3、检索执行retrieval遍历内存中的分块列表默认使用BM25打分排序(不支持向量检索)返回Top-N相关块4、模型推理将得分最高的若干个文本块拼接到prompt给大模型生成回答2、Qwen-Agent的多文件 RAG 问答程序import os from qwen_agent.agents import Assistant llm_cfg { model: qwen-turbo, api_key: os.getenv(DASHSCOPE_API_KEY), temperature: 0.8 } system_instruction 你是一个文档问答助手必须根据提供的文档内容回答问题不要编造答案。 # 获取文件夹下所有文件 file_dir os.path.join(./, docs) files [] if os.path.exists(file_dir): # 遍历目录下的所有文件 for file in os.listdir(file_dir): file_path os.path.join(file_dir, file) if os.path.isfile(file_path): # 确保是文件而不是目录 files.append(file_path) print(files, files) bot Assistant( llmllm_cfg, system_messagesystem_instruction, function_list[], filesfiles ) messages [] query 介绍下雇主责任险 # 将用户请求添加到聊天历史。 messages.append({role: user, content: query}) response [] current_index 0 print(助手回答, end) for response in bot.run(messagesmessages): if current_index 0: # 尝试获取并打印召回的文档内容 if hasattr(bot, retriever) and bot.retriever: print(\n 召回的文档内容 ) retrieved_docs bot.retriever.retrieve(query) if retrieved_docs: for i, doc in enumerate(retrieved_docs): print(f\n文档片段 {i1}:) print(f内容: {doc.page_content}) print(f元数据: {doc.metadata}) else: print(没有召回任何文档内容) print(\n) current_response response[0][content][current_index:] current_index len(response[0][content]) print(current_response, end) # 将机器人的回应添加到聊天历史。 messages.append({role: assistant, content: response[-1][content]})【运行如图】文档解析Start parsing / Finished parsing文本分块Start chunking / Finished chunkingBM25检索Building prefix dict from the default dictionary第一次运行在工作目录下会有workspace里面保存了解析阶段的缓存Qwen-Agent 下次启动程序时会优先读取 workspace 里面的缓存文件。

更多文章

前端开发 2026/4/12 3:20:57

期货反向跟单—越想占便宜，越容易踩坑

做期货反向跟单的朋友们，是不是都有过这样的经历：运营的时候总琢磨着，怎么能想出点 “高招”，让项目赚得更多、风险更小？我敢说，绝大多数运营者都挖空心思琢磨过对自己有利的思路，但现实往往打脸…

张开发

前端开发 2026/4/9 9:17:50

EcomGPT电商智能助手效果展示：自动识别‘雪纺材质’等专业术语并关联消费心智

EcomGPT电商智能助手效果展示：自动识别‘雪纺材质’等专业术语并关联消费心智 1. 引言：电商文案的痛点与AI解决方案电商从业者每天面临一个共同挑战：如何将商品的专业属性转化为打动消费者的营销语言。一件"雪纺材质V领连衣裙"在…

张开发

前端开发 2026/4/9 9:17:20

Simula Arduino库：面向机器人开发的行为树嵌入式框架

1. CRC Simula Arduino IDE 库概述CRC Simula Arduino IDE Library 是专为 Chicago Robotics 公司推出的 Simula 系列嵌入式开发板设计的官方支持库。该库并非通用型 CRC（循环冗余校验）算法实现，其名称中的 “CRC” 实为 “Chicago Robotics …

张开发

前端开发 2026/4/9 9:15:25

SMUDebugTool终极指南：三步掌握Ryzen系统调试与性能调优

SMUDebugTool终极指南：三步掌握Ryzen系统调试与性能调优【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://…

张开发

前端开发 2026/4/9 9:14:30

OpenClaw教育应用：Qwen2.5-VL-7B自动化习题生成与批改

OpenClaw教育应用：Qwen2.5-VL-7B自动化习题生成与批改 1. 为什么需要AI辅助教学工具作为一名经常需要准备教学材料的讲师，我深刻体会到传统备课的痛点。每次设计练习题时，既要考虑知识点的覆盖广度，又要确保题目难度适中&#…

张开发

前端开发 2026/4/9 9:12:05

docker容器进程探究

在工作中，总是遇到一些端口被占用，然后我们还不知道被那个进程占用的情况，然后今天我就整合了一套可以查询出到底是那个进程占用了端口的流程第一步：执行netststat命令，查看占用端口的进程号 netstat -nplt|grep 8064…

张开发

前端开发 2026/4/11 1:15:45

多平台直播效率提升方案：obs-multi-rtmp插件全栈技术指南

多平台直播效率提升方案：obs-multi-rtmp插件全栈技术指南【免费下载链接】obs-multi-rtmp OBS複数サイト同時配信プラグイン项目地址: https://gitcode.com/gh_mirrors/ob/obs-multi-rtmp 在当今内容创作生态中，直播已成为连接创作者与受众的核…

张开发

前端开发 2026/4/9 9:11:10

2026 小程序生态三大确定性趋势：智能化、低成本、全场景覆盖

一、小程序生态迈入成熟期：数据揭示行业新图景截至2026年第一季度，中国小程序生态已形成以微信为核心，抖音、支付宝、百度等多平台协同发展的产业格局。艾瑞咨询《2026年中国小程序生态发展报告》显示，小程序活跃用户规模突破10亿…

张开发

前端开发 2026/4/9 9:10:04

原神帧率解锁技术指南：突破限制与性能释放完全手册

原神帧率解锁技术指南：突破限制与性能释放完全手册【免费下载链接】genshin-fps-unlock unlocks the 60 fps cap 项目地址: https://gitcode.com/gh_mirrors/ge/genshin-fps-unlock 一、问题诊断：揭开帧率限制的技术枷锁 1.1 被束缚的硬件性能 …

张开发