CMLM-ZhongJing：基于专家知识引导的中医大语言模型架构设计与应用实践

发布时间：2026/7/5 16:14:51

CMLM-ZhongJing基于专家知识引导的中医大语言模型架构设计与应用实践【免费下载链接】CMLM-ZhongJing首个中医大语言模型——“仲景”。受古代中医学巨匠张仲景深邃智慧启迪专为传统中医领域打造的预训练大语言模型。 The first-ever Traditional Chinese Medicine large language model - CMLM-ZhongJing. Inspired by the profound wisdom of the ancient Chinese medical master Zhang Zhongjing, it is a pre-trained large language model designed specifically for the field of Traditional Chinese Medicine.项目地址: https://gitcode.com/gh_mirrors/cm/CMLM-ZhongJingCMLM-ZhongJing是首个专门针对传统中医领域设计的预训练大语言模型该项目通过创新的多任务诊疗分解策略和专家知识引导机制实现了在中医专业领域的精准语义理解和临床推理能力。该模型基于Baichuan2-13B-Chat和Qwen1.5-1.8B-Chat等基础架构进行领域微调构建了包含13.5万条高质量指令的专业数据集为中医智能化研究提供了重要的技术基础。核心理念专家知识引导的领域适应方法论传统通用大语言模型在医疗专业领域面临的核心挑战在于幻觉输出和专业知识不准确的问题。CMLM-ZhongJing项目提出了一种基于人类医生参与的多任务诊疗行为分解策略将复杂的中医诊疗过程系统性地解构为15个核心任务模块。这种方法借鉴了人类记忆学习的认知机制通过穿插学习、间隔练习和多样化学习的方式显著提升了模型在中医专业知识上的巩固程度。项目团队构建了涵盖中医古籍内容、方药配伍、证候分析、舌脉象诊断、批判性思维训练等多维度的指令数据集。这些数据不仅包括传统的文本知识还整合了临床实际案例的诊疗流程确保模型能够理解中医辨证论治的完整思维链条。通过专业中医师的全程参与和数据审核保证了指令数据的专业性和准确性为模型的专业化微调提供了高质量的训练基础。技术架构多任务诊疗分解与知识表示机制CMLM-ZhongJing的技术架构核心在于将中医诊疗过程分解为可计算的任务单元每个单元对应特定的诊疗行为模式。系统采用模块化设计思路将复杂的临床推理过程转化为结构化的知识表示和推理流程。上图展示了项目的核心技术架构。左侧的中医处方表作为知识输入源通过人类医生的专业筛选和审核机制确保数据的质量和准确性。中间的核心模块展示了15个诊疗场景任务的分解结构包括患者治疗故事生成、诊断分析、治疗模板制作、舌脉象分析、随访数据管理等关键环节。右侧的输出部分展示了模型基于处方数据生成的多任务诊疗行为分解指令实现了从结构化数据到自然语言描述的转换。这种架构设计的关键优势在于第一通过任务分解降低了单一任务的复杂性使模型能够专注于特定诊疗环节的推理第二多任务间的知识共享机制提高了模型的泛化能力第三人类医生的参与确保了专业知识的准确传递减少了幻觉输出的风险。应用场景中医临床辅助决策与教学研究支持CMLM-ZhongJing在多个中医应用场景中展现出显著的技术优势。在临床辅助决策场景中模型能够基于患者的症状描述提供符合中医辨证论治原则的诊疗建议。与传统通用模型相比该模型在中医专业知识的准确性和逻辑性方面表现突出特别是在复杂证候分析和方剂配伍建议方面展现出接近专业医师的推理能力。在中医教学与研究领域模型可以作为智能化的知识检索和问答系统帮助医学生理解中医经典理论、方剂组成原理和临床应用要点。基于项目提供的WebDemo.py交互界面用户可以方便地进行单轮或多轮对话探索中医知识的深度和广度。模型还能够生成符合中医学术规范的病例分析报告为临床研究和教学提供参考材料。项目的核心源码位于src/目录其中zhongjinggpt_1_b.py包含了模型推理的核心逻辑ZhongJingGPT_1_B.ipynb则提供了Jupyter Notebook形式的演示环境。这种模块化的设计便于研究人员根据实际需求进行功能扩展和定制开发。性能评估多维度对比验证与量化分析为了客观评估CMLM-ZhongJing的技术性能项目团队进行了系统的多维度对比测试。评估涵盖了常规中医症状咨询、复杂诊疗决策推理和西医通用问答三个关键场景对比模型包括GPT-4、BaiChuan2-13B-Chat、Baichuan 2 53B及DeepSeek-V3.2等主流大语言模型。上表展示了由五位专业中医师从客观性、逻辑性、专业性、准确性和完整性五个维度进行的系统评估结果。在参数规模小于10B的模型组中CMLM-ZhongJing7B参数获得了5.6417的平均得分在逻辑性维度达到5.9306分显著优于同规模的其他中医专业模型。特别值得注意的是在中医辨证论治的专业性方面该模型展现出接近超大规模通用模型的表现水平。在具体的临床案例测试中当面对心痛彻背背痛彻心的症状咨询时CMLM-ZhongJing能够准确识别为胸痹证候并提供丹参饮、血府逐瘀汤等经典方剂的合理建议。在复杂的慢性肾炎诊疗案例中模型提出的湿热内蕴日久耗伤气阴辨证思路与国医大师的实际医案高度吻合展现了较强的临床推理能力。实践指南模型部署与集成应用方案CMLM-ZhongJing提供了两种不同规模的模型版本以适应不同的应用需求。ZhongjingGPT1_13B基于Baichuan2-13B-Chat微调适合具备高性能GPU环境的研究机构使用ZhongJing-2-1_8b基于Qwen1.5-1.8B-Chat微调可在单张Tesla T4显卡上实现高效推理更适合资源受限的个人研究者和临床机构。模型部署的完整流程包括以下几个关键步骤环境配置与依赖安装项目基于Python 3.7环境开发核心依赖包括transformers、torch和gradio等深度学习框架。建议使用虚拟环境进行依赖管理确保系统环境的稳定性。模型权重获取与加载模型权重可从Hugging Face平台下载项目提供了完整的模型加载代码示例。研究人员可以根据实际需求选择不同的模型版本并通过简单的配置调整推理参数。本地推理服务部署通过执行python WebDemo.py命令即可启动基于Gradio的Web交互界面该界面支持单轮和多轮对话模式提供了友好的用户交互体验。界面默认运行在本地7860端口可以通过浏览器访问进行模型测试和应用开发。API集成与二次开发项目提供了清晰的模型调用接口便于集成到现有的中医信息系统或研究平台中。开发者可以基于提供的代码模板实现定制化的中医知识问答、病例分析报告生成等高级功能。对于希望进行模型微调的研究者项目还提供了完整的训练数据格式说明和微调脚本参考。基于现有的13.5万条专业指令数据研究人员可以进一步针对特定中医专科领域进行模型优化提升在特定病种诊疗中的表现。未来展望中医智能化研究的技术演进路径CMLM-ZhongJing项目的技术路线图规划了三个主要发展方向。首先基于内、外、妇、儿、骨等多学科临床数据采用多任务诊疗分解策略构建百万级指令数据集进一步提升模型的专科适应能力和临床实用性。其次计划基于LLaMA 2、百川-7B等开源基础模型持续迭代开发李时珍、王叔和、皇甫谧、孙思邈等历代名医版本的中医药大语言模型形成完整的中医名家知识体系。在技术方法层面项目团队将继续探索高效的领域微调策略包括基于中医知识图谱的预训练增强、多模态中医数据融合、以及中医诊疗决策的可解释性研究。这些技术方向的突破将有助于建立更加可信、可靠的中医智能辅助系统。从应用生态角度看CMLM-ZhongJing的开源模式为中医智能化研究提供了重要的技术基础设施。项目鼓励具有中医专业背景的研究者和临床医师参与数据标注和模型评估工作共同推动中医人工智能技术的发展。通过建立开放的协作机制有望形成覆盖中医全科领域的专业数据集和评估标准为中医现代化研究提供坚实的技术支撑。项目的持续发展需要学术界和产业界的共同参与。数据处理与标注是模型训练的关键环节专业中医师的深度参与能够显著提升数据的质量和实用性。期待通过多方协作最终实现可信赖的中医通用人工智能系统让传统医学智慧在现代科技赋能下焕发新的生机与活力。【免费下载链接】CMLM-ZhongJing首个中医大语言模型——“仲景”。受古代中医学巨匠张仲景深邃智慧启迪专为传统中医领域打造的预训练大语言模型。 The first-ever Traditional Chinese Medicine large language model - CMLM-ZhongJing. Inspired by the profound wisdom of the ancient Chinese medical master Zhang Zhongjing, it is a pre-trained large language model designed specifically for the field of Traditional Chinese Medicine.项目地址: https://gitcode.com/gh_mirrors/cm/CMLM-ZhongJing创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

CMLM-ZhongJing：基于专家知识引导的中医大语言模型架构设计与应用实践

相关新闻

5步深度配置VLC Android电视版：打造专业级智能电视媒体中心终极指南

HBCTool：React Native应用安全测试的Hermes字节码逆向工程利器

免费开源虚拟主播工具：如何零基础打造专业级虚拟形象？

Denoising Diffusion GANs核心原理详解：打破千步采样魔咒的创新架构

在CubeMX生成项目中，手动移植FreeRTOS Kernel V11.3.0 LTS，HardFault 启动崩溃问题日志

Word2Bits入门指南：从原理到实践，轻松掌握高效词向量压缩技术

Open Fabric Interfaces (libfabric) 入门指南：从零开始掌握高性能网络编程框架

SAN 模型实战：ImageNet 数据集训练与测试完整流程（附代码）

Readium-js-viewer深度解析：构建企业级EPUB阅读器的实战应用

思源宋体CN：7种字重免费开源字体，中文设计从此无忧

解锁AMD Ryzen处理器深层性能：SMU Debug Tool完全指南

6个月转型AI工程师：实战路径与核心技能

思源宋体CN：7种字重免费开源字体，中文设计从此无忧

解锁AMD Ryzen处理器深层性能：SMU Debug Tool完全指南

6个月转型AI工程师：实战路径与核心技能