合理 vs 不合理的提问
DeepEvidence 需要完整的问句才能正常工作。一个孤立的医学术语(疾病名、药品名、检验指标)不是问题,系统无法从中推断你真正想要的答案。
| # | 示例输入 | 评级 | 原因 |
|---|---|---|---|
| 01 | 阿司匹林 | ✗ 较差 | 只是一个药品名,根本不是问题。AI 无从判断你想问剂量、适应证、不良反应还是其它。 |
| 02 | 阿司匹林能否与 PD-1 类药物联用? | ✓ 推荐 | 指明了两个药物以及核心问题(联用),系统可据此检索药物相互作用文献。 |
| 03 | 患者在服用阿司匹林,下周要手术,什么时候应该停药? | ✓ 推荐 | 提供了临床场景(术前)与具体用药,并明确目标(停药时机),便于返回基于指南的答案。 |
| 04 | 糖尿病 | ✗ 较差 | 一个疾病名本身并不包含任何问题。是问诊断?治疗?并发症?系统无法猜测。 |
| 05 | 2 型糖尿病合并心力衰竭患者,应优先选择 SGLT-2 抑制剂还是二甲双胍? | ✓ 推荐 | 指明了患者特征(2 型糖尿病 + 心衰)、比较药物以及决策问题(优先级),是标准的临床问题格式。 |
| 06 | 肌钙蛋白 | ✗ 较差 | 一个孤立的检验指标。是问正常范围?升高的临床意义?动态监测?需要写出你真正想问的问题。 |
| 07 | 急性胸痛患者初次肌钙蛋白正常,3 小时复查升高,是否需要立即介入? | ✓ 推荐 | 描述了完整的临床场景与指标动态变化,并提出决策问题,系统可精准匹配 NSTEMI 相关指南。 |
核心原则:名词不是问题,句子才是
每次输入都应包含:谁(患者特征)·什么情况(场景 / 用药 / 检验)·具体问题(你到底想知道什么)。
清晰 vs 模糊的问题
即使是完整的句子,如果缺少关键信息也会过于模糊。一个清晰的问题应包含患者年龄、合并症与具体数值等背景,让系统找到最相关的证据。
✗ 模糊问题(答案会很通用)
❓ 阿司匹林怎么吃?
系统只能给一个通用剂量范围,临床价值有限。
❓ 抗生素怎么选?
❓ 高血压怎么治?
✓ 清晰问题(系统可给出精准、有循证依据的答案)
✅ 65 岁患者,因心血管二级预防服用阿司匹林,推荐剂量是多少?
✅ 65 岁患者,因心血管二级预防服用阿司匹林,合并慢性肾病(eGFR 45 mL/min/1.73m²),剂量是否需要调整?
✅ 社区获得性肺炎,住院患者,PORT III 级,无青霉素过敏史,一线抗菌方案是什么?
PICO 框架 — 构建清晰临床问题的金标准
P
Patient 患者
患者特征:年龄、性别、
合并症、检验数值
I
Intervention 干预
干预:药物、操作、
剂量、疗程
C
Comparison 对照
对照(可选):
另一种药物或不治疗
O
Outcome 结局
结局:生存率、
不良反应、剂量调整
DeepEvidence ≠ 通用 LLM
请不要把 DeepEvidence 当作 ChatGPT、文心一言之类的通用 AI 来用。它们在设计目标、机制和适用场景上有根本差异。
无需角色设定
DeepEvidence 内置了循证医学知识体系,角色设定不会提升也不会影响答案质量,只是徒增冗余。
不联网,不做全网文献检索
系统只在精选的高质量医学文献知识库内检索,刻意避开低质量来源,防止错误信息进入答案。
不会编造文献(无幻觉)
基于 RAG 架构,答案来自真实文献片段,而不是模型的"凭空想象"。
专注医学,不是通用聊天
非医学问题会降低效率,质量也不会比通用大模型更好。
| 维度 | 通用 LLM (如 ChatGPT) | DeepEvidence |
|---|---|---|
| 知识来源 | 训练数据(截止固定) | 实时检索医学文献数据库 |
| 是否需要角色设定 | 有时有用 | ❌ 无效,无需设置 |
| 联网检索 | 部分版本支持 | ❌ 不联网(防幻觉设计) |
| 引用文献 | 可能是编造的 | ✅ 可追溯到真实文献 |
| 临床诊断推理 | 一般,缺乏证据深度 | ✅ 专门优化 |
| 医学知识质控 | 无筛选 | ✅ 仅采用高质量来源 |
| 通用写作 / 聊天 | ✅ 强 | ❌ 非目标 |
DeepEvidence 能做什么?
以下场景都可以直接提问,无需说明自己的身份或背景。
临床诊断与鉴别诊断
输入症状、体征与检验结果,获得系统化的鉴别诊断清单与推理。
例:38 岁女性,关节痛、颊部红斑、ANA 阳性,应考虑哪些鉴别诊断?
药物使用与剂量
适应证、禁忌证、肝肾功能不全的剂量调整,以及最佳给药途径和时机。
例:肾移植患者使用他克莫司,如何根据血药浓度调整剂量?
药物相互作用
联用时的相互作用机制、临床意义与处理建议。
例:华法林与氟康唑联用时,PT/INR 会如何变化?
治疗方案与指南
依据最新指南的一线 / 二线治疗,以及阶梯式策略。
例:HFrEF 患者(EF 35%)的标准药物治疗方案是什么?
医学量表与评分
CHA₂DS₂-VASc、MELD、APACHE、Wells、CURB-65 等评分的解读。
例:房颤患者 CHA₂DS₂-VASc 评分 3 分,是否需要抗凝?
罕见病与遗传病
罕见病的诊断标准、遗传方式、基因检测建议与当前治疗方案。
例:儿童出现发作性共济失调,需要考虑哪些罕见病?
药物不良反应与毒性
常见 / 罕见不良反应、毒性监测与处理流程。
例:免疫检查点抑制剂相关性肺炎如何分级和管理?
检验与检查结果解读
检验指标的临床意义、参考范围、影响因素与后续处理。
例:BNP 明显升高但超声心动图正常,应考虑哪些情况?
医学史与基础机制
疾病机制、病理生理与医学历史背景。
例:Framingham 研究对心血管疾病预防的主要贡献是什么?
进阶技巧:获得更精准的答案
给具体数值,不要用描述性语言
✗ 肾功能不好
✓ eGFR 28 mL/min/1.73m²(CKD 4 期)
列出当前所有用药
✗ 患者在吃几种药
✓ 当前用药:华法林 3 mg/d、地高辛 0.125 mg/d、呋塞米 20 mg/d
明确说出你的决策目标
✗ 关于这个患者……
✓ 我需要决定:现在启动抗凝,还是等复查再说?
把复杂问题拆成追问
当问题包含多个决策点时,先问主问题,拿到答案再追问。
✓ 先问:一线药物是什么?→ 再问:肾功能不全时如何调整剂量?
注明特殊人群状态
妊娠、哺乳、高龄(>80 岁)、儿童、免疫抑制等都会影响推荐方案。
✓ 患者妊娠 28 周,合并甲亢,可以用哪些抗甲状腺药物?
注明地区 / 资源场景(可选)
如果需要中国指南,或基层医院资源受限,请说明。
✓ 在没有 CRRT 的基层医院,如何处理这个患者的急性肾衰?
使用过程中常见的误区
误区 1:把 DeepEvidence 当搜索引擎用
搜索引擎返回链接列表;DeepEvidence 返回的是综合后的循证答案。请用完整问句,不要用关键词搜索。
误区 2:期望它替代临床判断
DeepEvidence 提供的是循证参考;最终的临床决策必须由执业医师结合具体患者做出。系统不承担医疗责任。
误区 3:以为提示词越长越好
不需要大段铺垫,只要包含关键患者信息 + 清晰的问题。两三句话就足以获得高质量答案。
误区 4:用它直接生成面向患者的文案
答案是面向医生的专业医学语言,不适合直接给普通患者。患者宣教材料请用通用 AI 做语言转换。