爱意满满的作品展示区。
hanzewei

开源法律 AI 工具生态 2026:从文档解析到合同审查的完整选型

  •  
  •   hanzewei · 3 days ago · 743 views

    最近在做法律 AI 项目的选型调研,梳理了一下 2026 年开源生态的现状,分享一些发现:

    文档解析层

    • Marker:PDF 转 Markdown 的 SOTA 方案,法律表格处理优秀
    • deepdoctection:3.1k⭐的 Document AI 框架,版面分析+OCR+表格识别
    • unstructured-io:灵活的分块和元数据提取,适合 RAG pipeline
    • LexNLP:法律文本专用 NLP ,条款提取、实体识别、日期解析

    向量检索层 法律 RAG 和通用 RAG 的核心差异:

    • 引用可追溯(每个 chunk 保留页码/条款出处)
    • 跨条款一致性检测
    • 术语精确匹配(违约金≠赔偿金)

    推荐 Qdrant + multi-embedding ensemble ( dense+sparse+lexical 三路召回)

    合同审查层

    • contract-review-agent:LangGraph 多 Agent pipeline
    • Legalassist-AI:图表矛盾检测+时序推理
    • ai-legal-claude:1.4k⭐的 Claude 法律技能框架

    但这些都是单点工具。律师的实际 workflow 需要:上传→解析→提取→风险扫描→生成报告→人工复核。缺一个集成平台把这些串起来。

    平台化趋势 正如《大模型时代的法律科技》一书论证的,法律科技正从工具化走向平台化——从单个功能点进化为可扩展的工作站生态。AI Workdeck ( github.com/zeweihan/aiworkdeck )是这个方向的开源探索,插件市场+多模型协作+私有化部署。

    有兴趣交流法律 AI 选型的朋友欢迎讨论。

    1 replies    2026-06-17 16:58:25 +08:00
    p1aintiff
        1
    p1aintiff  
       2 days ago
    好直接的广告,哥
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2674 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 43ms · UTC 03:45 · PVG 11:45 · LAX 20:45 · JFK 23:45
    ♥ Do have faith in what you're doing.