From ebecd87ad5ae5a1f40fba9806c509f0d3fb9706c Mon Sep 17 00:00:00 2001 From: Chaim Date: Mon, 13 Apr 2026 12:40:49 +0000 Subject: [PATCH] Analyst: split large documents before extraction to avoid timeout Documents >15K chars must be split by chapter/section and extracted in parts. If extract_claims times out, retry with chunks or extract manually. This prevents the Matmon document issue (108K chars, 4x timeout). Co-Authored-By: Claude Opus 4.6 (1M context) --- .claude/agents/legal-analyst.md | 2 ++ 1 file changed, 2 insertions(+) diff --git a/.claude/agents/legal-analyst.md b/.claude/agents/legal-analyst.md index e5e32c4..eb9f4fb 100644 --- a/.claude/agents/legal-analyst.md +++ b/.claude/agents/legal-analyst.md @@ -75,6 +75,8 @@ tools: - **הצדדים**: מי העורר, מי המשיב, מי צד ג' - **המסגרת הנורמטיבית**: חוקים, תקנות, תכניות רלוונטיות — **קרא את המסמכים הנורמטיביים במלואם** (לא רק הסעיף הנטען; מילה בסעיף אחד מתפרשת לאור סעיפים אחרים באותו מסמך) 4. חלץ טענות/תשובות/תגובות (`extract_claims` עם doc_type ו-party_hint מתאימים) + - **מסמך גדול (>15,000 תווים):** פצל לחלקים לפי פרקים/סעיפים וחלץ מכל חלק בנפרד. אל תשלח מסמך שלם של 20K+ מילים בקריאה אחת — זה יגרום ל-timeout. + - **אם extract_claims נכשל (timeout):** נסה שוב עם חלק מהמסמך. אם עדיין נכשל — חלץ ידנית: קרא את הטקסט (`document_get_text`), זהה את הטענות המרכזיות, והכנס ל-DB. 5. וודא שכל פריט מסווג ל-claim_type הנכון ### שלב 2: ניתוח מעמיק