在信息爆炸的数字化时代,企业面临海量数据管理、知识检索效率低下、长尾问题响应滞后等痛点。
基于 ChatWiki开源框架 与 DeepSeek大模型 的RAG(检索增强生成)技术,可将静态文档转化为动态智能问答系统,实现知识精准调用与业务场景深度适配。
相较于传统微调方案,RAG技术通过“外部知识检索+模型动态增强”模式,有效解决大模型幻觉问题,降低训练成本,并支持知识库实时更新。
① RAG 技术原理
RAG(Retrieval Augmented Generation)即检索增强生成技术,它将信息检索与文本生成相结合。
RAG 的工作流程可以参考下图来直观地了解~
技术核心流程分为两步 ↓
● 检索(Retrieval):基于用户输入,从外部知识库(如数据库、文档集合、网页等)中,运用向量化表示和向量数据库进行语义匹配,检索出与查询相关的文本片段。
例如:当用户提问 “2025 年华为发布了哪些新产品”,检索模块会从知识库中找出关于 2025 年华为产品发布的相关文档片段。
● 生成(Generation):把用户查询与检索到的内容作为上下文,输入给大语言模型(如DeepSeek、GPT-4、Claude )等。由模型输出最终回答。大语言模型依据这些补充信息,生成更准确、有依据的答案。
② ChatWiKi 与 DeepSeek 简介
● ChatWiKi:这是一款基于大语言模型(LLM)和检索增强生成(RAG)技术构建的开源知识库 AI 问答系统。它提供了开箱即用的数据处理和模型调用能力,支持私有化部署,确保数据安全和隐私。
注:代码免费开源且可商用。通过导入多种格式数据,可以自动进行预处理、向量化等操作,将知识整理成便于模型理解和检索的形式。
● DeepSeek:作为一款性能出色的大语言模型,DeepSeek 在自然语言处理方面表现卓越。它具备强大的语言理解和生成能力,能够根据输入的上下文生成高质量的文本回复。
例如:在 RAG 知识库搭建中,DeepSeek 负责根据检索到的信息生成最终答案,为用户提供准确且有用的回答。
需要先准备一台具有联网功能的linux服务器,还要确保服务器满足最低系统要求↓
● Cpu:最低需要2 Core
● 内存:最低需要4GB
访问官网:https://chatwiki.com
填写邮箱、密码完成注册,激活邮件后登录即可。
企业用户注意:若需本地化部署,可下载开源代码自主搭建,确保数据安全
支持以下三种:
①docker部署;
②离线docker部署;
③免docker部署,完全本地部署,源码安装
● API密钥获取:
登录DeepSeek官网创建应用,获取API Key(注意区分测试版与商用版密钥权限)
● 模型注入系统:
在ChatWiki「系统设置」-「模型管理」中填入API Key,选择DeepSeek-R1-7B或DeepSeek-R1-1.5B版本
注:系统支持全球20多种主流模型,包括:DeepSeek、OpenAI、GPT-4、讯飞星火、Kimi、火山引擎等
支持格式:PDF、DOCX、TXT、HTML、XLSX、OFD(国产版式文档)等
● 操作步骤:
进入ChatWiki“知识库管理”,上传文件并设置分块策略。自动完成文本清洗、QA分割及向量化存储,形成可检索的向量数据库。
● 增强型配置:
①知识图谱构建:
在「高级设置」中启用实体关系识别,自动生成知识网络拓扑
②混合检索策略:
设置向量检索权重70% + 关键词检索权重30%
● 基础设置
命名机器人并关联知识库(支持多知识库并联检索),填写系统提示词。
示例:“你是一名技术支持专家,需基于知识库内容提供准确回答,若信息不足则明确告知”
● 高级功能
① 知识图谱整合:通过实体关系网络增强答案关联性
② 多模态支持:可嵌入图像、表格等结构化数据
● 输出方式:
生成嵌入式代码、API接口或H5链接,无缝接入微信公众号、微信小程序、企业微信、APP、抖音、快手、官网等平台
● 硬件要求:
轻量级模型(如DeepSeek-R1 1.5B)需4GB内存即可运行。
高性能场景建议70B参数模型+GPU加速。
通过可视化拖拽界面与预设模板结合,用户无需编程即可完成对话流程设计、意图识别及应答策略配置,5分钟便可快速生成定制化智能体。
通过友好的界面,结合预制的各类节点和丰富的插件工具,系统支持企业通过可视化拖拽方式,快速编排业务流程。
系统支持直接导入OFD格式的党政机关电子公文,无需进行格式转换,可显著提升文档处理效率和数据安全性,尤其适用于政府、金融、法律等对格式合规性要求高的领域 。
系统支持文本、语音、图片、图表混合输出,结合RAG技术实现动态内容生成,可以满足客服、培训等复杂场景需求。
GraphRAG = 知识图谱 + 检索增强生成RAG。在知识图谱的加持下,ChatWiKi 知识库的性能和应用价值完成进一步提升。
在检索阶段,知识图谱可以为 RAG 提供更丰富的语义信息,帮助检索模块更精准地定位相关知识。
注:与传统的RAG系统相比,GraphRAG能够更有效地处理复杂的查询,提供更准确和相关的回答,特别适用于涉及大量实体和关系的数据集。
支持 AI 对话、问题分类、知识库检索、Http 请求、判断分支等多种节点,可满足多样化的业务需求,能灵活组合以实现复杂的业务流程自动化。
原创文章,作者:小芝麻,如若转载,请注明出处:https://xiaokefu.com.cn/blog/26939.html