跳到主要内容

神经符号融合

要解决的问题

LLM 概率生成 擅长语言与启发,但在 严格逻辑、算术证明、规划可行性 上易错。神经符号(Neuro-Symbolic)尝试把 神经网络符号引擎(定理证明、SQL、规则)结合。

融合范式

范式流程示例
符号引导解码语法/类型约束采样JSON schema、SQL grammar
工具调用LLM 生成 → 执行器验证Python REPL、Lean
神经→符号提取NL → 逻辑式 → 求解器数学 word problem
符号→神经反馈错误反传为 CoT 修正CRITIC、自我反思

与 Agent 的关系

现代 Agent = LLM + 工具 可视为 实用神经符号

  • 神经:规划与自然语言接口。
  • 符号:编译器、数据库、单元测试 硬反馈

docs Agent 与 7.1.5 Agent 基准

代表研究方向

  • Logic-LM:LLM 生成一阶逻辑,外部求解。
  • Program-aided:PAL、PoT 用代码作中间表示。
  • 形式验证:Lean/Isabelle 对接(数学证明助手)。

工程实践

  • Structured output:JSON mode、regex、constrained decoding(Outlines、guidance)。
  • Plan-Execute 分离:Planner(LLM)与 Executor(确定性 VM)。
  • 失败回退:符号执行失败 → 提示模型 修订计划

局限与注意点

  • 符号层 覆盖不全 时,模型仍 幻觉 调用不存在 API。
  • 严格系统 脆弱:环境稍变即失败,需鲁棒重试。
  • 「真正理解逻辑」vs「模式匹配工具链」—— 哲学争议 未决。
  • 个人理解:短期落地靠 Agent 工具环,而非端到端可微定理证明(待验证)。

检查清单(自学 / 落地)

步骤动作
1阅读官方 primary source(报告、博客、模型卡)
2固定 prompt 与解码参数,在自有验证集上建基线
3记录延迟、成本、上下文长度与是否启用思考模式
4与相邻章节对照,画出与上下游模块的数据流
5paper-reading 或本大纲相关节做深度笔记

常见误区

误区澄清
公开基准 = 产品表现必须用业务端到端任务回归
长窗口 = 长理解需 Needle + 真实文档任务验证
单次实验可定论固定随机种子、数据版本与评测脚本

延伸练习

外部参考(精选)

类型入口
原始报告见正文 arXiv / 官方博客链接
权重与配置Hugging Face config.json 与 model card
深度领读见上文 :::tiptech-report 索引
工具链附录 D 工具生态
术语附录 B 术语表

相关章节

  • 逻辑推理:6.1.3
  • 代码推理:6.1.2
  • Function Call:docs 相关章节