Improve block-zayin: synthesize claims by topic + fix markdown JSON parsing

block_writer: Rewrote block-zayin prompt to require synthesis by topic instead of listing each claim separately. Now produces 3 organized sections (appellants 8, committee 6, permit applicants 3+) instead of 40 scattered paragraphs. Target: 800-1500 words. claims_extractor: Fix markdown code block stripping (same bug as qa_validator had). Enables parsing claims from Claude responses wrapped in ```json blocks. Tested on Hecht: block-zayin from 40 paragraphs/1049 words to 17 organized paragraphs/1039 words. Structure now matches Dafna's original (3 parties, grouped by topic). Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-04-03 12:54:42 +00:00
parent e438740ab4
commit bed9d5c7e9
2 changed files with 14 additions and 6 deletions
--- a/mcp-server/src/legal_mcp/services/block_writer.py
+++ b/mcp-server/src/legal_mcp/services/block_writer.py
@@ -148,16 +148,21 @@ BLOCK_PROMPTS = {

    "block-zayin": """כתוב את בלוק טענות הצדדים (בלוק ז, "תמצית טענות הצדדים") של החלטת ועדת ערר.

-## כללים:
- כל טענה בסעיף נפרד, גוף שלישי ("העורר טוען כי...")
- סדר קבוע: טענות העוררים → עמדת הוועדה המקומית → עמדת מבקשי ההיתר (אם יש)
+## כללים קריטיים:
+- **סנתז טענות דומות** — אל תרשום כל טענה בנפרד. קבץ טענות דומות לנושא אחד. למשל: כל הטענות על הודעות → סעיף אחד, כל הטענות על רכוש משותף → סעיף אחד.
+- גוף שלישי: "העוררים טוענים כי...", "הוועדה המקומית ציינה כי..."
+- **מבנה קבוע עם 3 חלקים:**
+  1. "טענות העוררים" — 8-12 סעיפים מקובצים לפי נושא
+  2. "עמדת הוועדה המקומית" — 5-8 סעיפים
+  3. "עמדת מבקשי ההיתר" (אם יש) — 5-10 סעיפים
 - כותרת: "תמצית טענות הצדדים"
- נאמנות מוחלטת למקור — לא לשנות, לא לקצר ללא ציון
- אין ניתוח, אין מסקנות, אין הערכה
+- נאמנות למקור — לא להמציא טענות, אבל כן לאחד ולסכם טענות חוזרות
+- אין ניתוח, אין מסקנות, אין הערכה ("טענה חלשה/חזקה")
 - רק מכתבי טענות מקוריים (לא השלמות טיעון)
 - מספור רציף
+- **יעד אורך: 800-1500 מילים**

-## טענות שחולצו:
+## טענות שחולצו (קבץ טענות דומות לנושאים):
 {claims_context}

 ## פרטי התיק:
--- a/mcp-server/src/legal_mcp/services/claims_extractor.py
+++ b/mcp-server/src/legal_mcp/services/claims_extractor.py
@@ -105,6 +105,9 @@ async def extract_claims_with_ai(
    )

    raw = message.content[0].text.strip()
+    # Strip markdown code blocks if present
+    raw = re.sub(r"^```(?:json)?\s*", "", raw)
+    raw = re.sub(r"\s*```$", "", raw)
    try:
        # Extract JSON array from response
        json_match = re.search(r"\[.*\]", raw, re.DOTALL)