AI-SCRM
WeChat Agent
知识库

SOP / FAQ / 案例 PDF 入库即用 —— 所有 Agent 回答都带 chunk-grain 引用,可追溯。

  • PDF / URL / 文本 三路入库;扫描件不能抽文本时进 review queue
  • 静态闸门 + LLM 合规自动审核;通过的入 active,可疑的留 draft 等人工
  • 向量召回(pgvector / SQLite cosine 兜底)+ token 子串混合检索
  • 答案合成 LLM 三模式:direct / opener / reply,四道引用忠实护栏防漂移
销售 Agent · 多轮对话
客户 · 14:02
你们这套方案大概多少钱?
AI 助手 · 14:02
可以参考 SOP-007 的报价框架:按席位 + 触达额度计费,500 人企业起步价 ¥599/月,方便我先安排一次 30 分钟演示对齐需求吗?
引用 SOP-007 · 已过风控
4 道 · 引用忠实护栏

它解决的问题

销售面对客户问”你们怎么处理报价 / 退款 / 集成”时,每个人讲法不一样 —— 老人凭记忆、新人查 wiki、运营写公告……结果客户感到团队不专业。

企业知识库把所有 SOP / FAQ / 案例 / 报价边界统一入库,所有 Agent 出库的话术都从这里取材且带引用,让”销售嘴上说的”和”知识库里写的”严格一致。

入库 · 三种来源

来源怎么用失败兜底
文本控制台 → 新建知识,复制粘贴 SOP 文本标题 + 正文必填,立即生效
PDF 上传控制台 → 导入 PDF,支持 ≤ 10 MiB扫描件 / 无可抽文本 PDF 进 review queue
URL 抓取POST 接口 + URL(如内部 wiki)内容 < 80 字进 review queue

所有入库都自动切片成 chunks,给每个 chunk 算向量;后续出库回答只引用 chunk 级别的事实片段,不是整段抄 PDF

审核 · 三层闸门

[静态闸门]
绝对承诺词 / PII 模式 / internal_pricing 标签

        ▼ flags 但不拒
[LLM 合规自动审核]
decision: approve / manual_review / reject


[决策合成]
LLM approve + 静态零 flag + auto_activate=true → active
否则 → draft(等人工)

LLM 任意故障(disable / no_key / timeout / API error)都退化为 manual_review永不阻塞入库,但状态停在 draft 等运营批准。

出库 · 四道引用忠实护栏

Agent 回答时,答案合成 LLM 负责把”召回的 chunks → 一段流畅文字”:

  1. JSON Schema 合规:模型输出必须能解析。
  2. cited_chunk_ids 子集校验:引用的必须是召回 chunks 的子集,不能”瞎编”。
  3. 非空校验:cited 不能为空(不允许”看起来很对”但无据可查的回答)。
  4. 数字日期价格穿透:回答里出现的数字 / 日期 / 价格必须能在 cited 的 chunk 原文找到子串。

任何一道违反 → 自动降级到模板拼接,永远不会把不可追溯的内容发给客户。

检索 · 向量 + token 双路

模式何时启用召回方式
向量召回配了 AI_SCRM_KNOWLEDGE_EMBEDDING_API_KEYpgvector 或 SQLite Python-cosine;min_score 0.45
token 召回无 embedding 客户端时子串匹配 + 归一化打分;min_score 0.20
降级链向量失败 / 维度漂移 / archived item / 老 NULL embedding自动退到 token 路径

整套机制保证:没向量服务也能跑、有向量服务跑得更好、出问题永远不黑屏

关键能力一览

  • 三种来源入库:text / pdf / url(idempotent on source_ref)
  • 三层审核:static gates + LLM auditor + 人工 activate / archive
  • 四道引用护栏:JSON / 子集 / 非空 / 数字穿透
  • 三模式合成:direct(M11 桥)/ opener(首次触达)/ reply(多轮回复)
  • LRU 缓存:相同 query + chunks + ctx 在 30 分钟内不重复调 LLM;缓存命中仍写 usage
  • 知识缺口:客户问到没覆盖的问题 → 自动落 gaps → 运营补完知识 → 同问题自动重测命中

与其他模块的关系

  • 销售 Agent:调 knowledge.answer() 取首句 / 回复。
  • 群运营:候选话术从知识库出库。
  • 风控审计:知识库审核的静态 / LLM 闸门复用风控规则。
  • 客户卡片:每条 usage 写到客户档案,知道”哪条知识被谁引用了多少次”。

看一眼

控制台 → 企业知识库支持”新建知识 / 导入 PDF / 列表 / 详情 / 审核队列 / 缺口反馈”全流程。

立即开始

免费开始 · 不需要信用卡 付费版首月可退

免费版可永久使用 1 个席位、每月 50 条触达额度、5 万 LLM token; 团队版起价 ¥599/月,年付立享 9 折。