CMLM-ZhongJing:如何让AI传承千年中医智慧?

张开发
2026/4/11 17:18:15 15 分钟阅读

分享文章

CMLM-ZhongJing:如何让AI传承千年中医智慧?
CMLM-ZhongJing如何让AI传承千年中医智慧【免费下载链接】CMLM-ZhongJing首个中医大语言模型——“仲景”。受古代中医学巨匠张仲景深邃智慧启迪专为传统中医领域打造的预训练大语言模型。 The first-ever Traditional Chinese Medicine large language model - CMLM-ZhongJing. Inspired by the profound wisdom of the ancient Chinese medical master Zhang Zhongjing, it is a pre-trained large language model designed specifically for the field of Traditional Chinese Medicine.项目地址: https://gitcode.com/gh_mirrors/cm/CMLM-ZhongJing当现代医学面临复杂慢性疾病和个体化治疗需求时传统中医的辨证施治理念展现出独特价值。然而中医知识的传承面临两大核心挑战一是经验丰富的医师培养周期长二是海量古籍文献难以系统化应用。这正是CMLM-ZhongJing项目要解决的核心问题——如何让AI真正理解并应用中医辨证思维作为首个专为传统中医领域设计的预训练大语言模型仲景模型不仅是一个技术产品更是连接古代医学智慧与现代人工智能的桥梁。该项目以古代中医学巨匠张仲景命名旨在将中医的辨证论治思想转化为可计算、可验证的AI系统为中医现代化提供全新路径。一、当AI遇见中医从数据困境到专业突破传统大语言模型在通用领域表现出色但在医疗等专业领域却面临幻觉输出的致命问题——错误的诊断或处方建议可能危及患者生命。CMLM-ZhongJing团队认识到单纯依靠Self-Instruct等通用方法无法满足中医领域对专业性的严苛要求。1.1 数据构建的革命性策略项目团队提出以专业性为核心的指令数据构建方法借鉴人类记忆与学习机制通过15种诊疗场景任务构建高质量指令数据。这一策略的核心在于将中医诊疗过程分解为可操作的认知任务患者治疗故事基于真实病例构建叙事医学框架诊断分析系统化辨证过程的数据化表达舌脉象分析将中医四诊信息结构化处方功用药方与证型的精准匹配批判性思维中医辨证的逻辑推理训练上图展示了人类医生参与的多任务治疗行为分解指令构建策略。通过TCM处方表作为输入结合大语言模型的处理能力生成覆盖15个诊疗场景的指令数据形成完整的诊疗行为分解闭环。1.2 13.5万专业指令数据的价值项目构建了涵盖中医古籍内容、名词解释、症状近义词/反义词、证候、症状、治法等多维度的13.5万条指令数据。这些数据不是简单的文本收集而是经过专业医师审核的结构化知识古籍内容31,395条覆盖《伤寒论》《金匮要略》等经典中医词典20,376条建立标准化的中医术语体系真实世界问题7,990条解决临床实际应用场景辨证分析6,592条训练模型的辨证思维能力这种数据构建方式确保了模型输出的专业性和准确性为中医AI应用奠定了坚实基础。二、技术架构专家知识引导的模型设计CMLM-ZhongJing的技术架构体现了专业引导的设计理念。项目基于Baichuan2-13B-Chat和Qwen1.5-1.8B-Chat两个基座模型进行微调采用LoRALow-Rank Adaptation技术实现高效参数优化。2.1 模型选择与优化策略项目团队选择了两个不同规模的基座模型进行对比研究# 模型初始化代码示例来自src/zhongjinggpt_1_b.py peft_model_id CMLL/ZhongJing-2-1_8b base_model_id Qwen/Qwen1.5-1.8B-Chat model AutoModelForCausalLM.from_pretrained(base_model_id, device_mapauto) model.load_adapter(peft_model_id)这种双模型策略具有重要实践意义ZhongjingGPT1_13B面向高性能GPU环境提供深度中医知识推理ZhongJing-2-1_8b轻量级版本可在单张Tesla T4显卡上部署2.2 多任务学习框架模型采用多任务学习框架将中医诊疗过程分解为多个子任务并行训练# 多轮对话处理逻辑来自WebDemo.py def multi_turn_chat(question, chat_historyNone): if chat_history is None or chat_history []: chat_history [{role: system, content: You are a helpful TCM medical assistant...}] chat_history.append({role: user, content: question}) inputs tokenizer.apply_chat_template(chat_history, tokenizeFalse, add_generation_promptTrue) model_inputs tokenizer([inputs], return_tensorspt).to(device) # 生成响应 outputs model.generate(model_inputs.input_ids, max_new_tokens512) generated_ids outputs[:, model_inputs.input_ids.shape[-1]:] response tokenizer.decode(generated_ids[0], skip_special_tokensTrue) return response这种设计使模型能够处理从简单症状咨询到复杂辨证处方的多层次任务实现从知识问答到诊疗推理的能力跃迁。2.3 评估体系构建项目建立了三维度评估体系由五位专业医师从五个维度进行系统评估评估结果显示尽管ZhongJing-TCM模型参数量仅为7B但在中医专业知识维度上表现出色证明了领域专业化训练的有效性。与通用大模型相比专业中医模型在辨证准确性、处方合理性等关键指标上具有明显优势。三、实战应用从入门到专业的三级应用体系3.1 入门级快速部署与体验对于初学者和研究者项目提供了最简化的部署方案# 1. 克隆代码库 git clone https://gitcode.com/gh_mirrors/cm/CMLM-ZhongJing.git cd CMLM-ZhongJing # 2. 启动Web Demo python WebDemo.py通过Gradio构建的Web界面支持单轮和多轮对话用户无需深入了解技术细节即可体验中医AI咨询。Colab环境下的免费GPU推理进一步降低了使用门槛。3.2 进阶级专业辨证应用在实际中医诊疗场景中模型展现出令人印象深刻的能力。以心痛彻背背痛彻心的症状为例GPT-4输出泛泛而谈无完整方剂处方决策欠佳BaiChuan2-13B输出中医常识缺失偏向西医对症处理ZhongJingGPT输出准确识别为胸痹范畴给出丹参饮、血府逐瘀汤等经典方剂这种差异源于模型训练数据的专业性。ZhongJingGPT能够准确识别病机正气亏虚痰浊、瘀血阻滞心脉并给出符合中医理法方药原则的处方建议。3.3 专业级复杂病例诊疗推理在复杂慢性肾病案例中模型表现更为突出。面对46岁慢性肾炎患者蛋白尿隐血血肌酐、尿素氮升高的复杂情况症状自汗头晕腰痛乏力夜寐不安尿黄舌脉舌红苔薄黄脉细数ZhongJingGPT辨证湿热内蕴日久耗伤气阴治法益气养阴清热利湿处方黄芪30g党参20g生地20g山药20g等13味药与国医大师熊继柏的医案对比ZhongJingGPT的辨证思路与处方原则高度吻合体现了模型在复杂辨证中的专业能力。四、生态整合与未来展望4.1 与现有医疗系统的集成CMLM-ZhongJing设计时考虑了与现有医疗信息系统的兼容性。模型可以电子病历辅助自动提取病历中的四诊信息辅助辨证处方合理性检查验证处方配伍禁忌和剂量安全性患者教育材料生成用通俗语言解释中医诊疗原理4.2 扩展开发建议基于现有架构开发者可以进行以下扩展专科化微调针对妇科、儿科、内科等不同专科进行定向训练地域化适配结合不同地域的气候特点和用药习惯中西医结合整合现代医学检查结果与中医辨证4.3 技术路线图项目团队规划了清晰的未来发展路径数据扩展基于内、外、妇、儿、骨等多学科数据构建百万级Instruct数据模型迭代基于LLaMA 2、百川-7B等模型持续优化系列化发展计划发布李时珍、王叔和、皇甫谧、孙思邈、葛洪、岐黄等不同中医流派版本4.4 安全与伦理考量项目团队高度重视医疗AI的安全性问题# 系统提示词设计确保安全边界 system_prompt You are a helpful TCM medical assistant named 仲景中医大语言模型, created by 医哲未来 of Fudan University.所有输出都明确标注仅供学术研究参考不构成任何医疗建议临床诊断和治疗必须由经验丰富的专业医师提供。这种谨慎态度体现了医疗AI开发的责任感。五、中医AI化的时代意义CMLM-ZhongJing项目的价值不仅在于技术突破更在于它开启了一条中医知识传承与创新的新路径。通过将张仲景等古代医家的智慧转化为可计算、可验证的AI系统项目实现了知识系统化将分散的中医经验转化为结构化知识体系诊疗标准化为中医辨证提供相对客观的参考标准教育现代化为中医教学提供智能辅助工具研究数据化为中医临床研究提供大数据分析基础在中医现代化进程中CMLM-ZhongJing代表了一种务实而创新的方向——不是用AI替代中医而是用AI增强中医。正如项目团队所期望的期待我们有朝一日实现可信赖的中医通用人工智能让古老的中医学与新时代科技融合焕发新春。对于开发者而言这个项目提供了医疗领域大模型微调的完整范例对于中医从业者它展示了AI辅助诊疗的可行性对于医学研究者它开辟了中西医结合研究的新方法。在人工智能与传统文化融合的时代背景下CMLM-ZhongJing不仅是一个技术项目更是一次文化传承的数字化实践。项目的开源特性确保了技术的可及性13.5万条专业指令数据的公开为后续研究提供了宝贵资源。随着更多开发者和研究者的加入中医AI化进程将加速推进最终惠及更广泛的患者群体实现让每个人都能享受到优质中医服务的愿景。【免费下载链接】CMLM-ZhongJing首个中医大语言模型——“仲景”。受古代中医学巨匠张仲景深邃智慧启迪专为传统中医领域打造的预训练大语言模型。 The first-ever Traditional Chinese Medicine large language model - CMLM-ZhongJing. Inspired by the profound wisdom of the ancient Chinese medical master Zhang Zhongjing, it is a pre-trained large language model designed specifically for the field of Traditional Chinese Medicine.项目地址: https://gitcode.com/gh_mirrors/cm/CMLM-ZhongJing创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

更多文章