fix(chunker): תיקון זיהוי כותרות טענות-הצדדים ביחיד/נקבה + שלוש שכבות הגנה #296
Reference in New Issue
Block a user
Delete Branch "worktree-chunker-party-claims-fix"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
סיבת-שורש
הלכה 11 בתיק 8181-21 חולצה מטענות המשיבה — לא מהדיון המשפטי.
למה זה קרה: רג'קס
respondent_claimsב-chunker.pyכיסה רק צורת רבים (המשיבים/המשיבין), ולא יחיד נקבה (המשיבה) ויחיד זכר (המשיב). הכותרת"טענות המשיבה:"לא הוכרה → נבלעה לתוך מקטעrulingהקודם → מאחר ש-rulingנמצא ב-EXTRACTABLE_SECTIONS, תוכן הטענות הוזן לחילוץ הלכות.שינויים
שכבה 1 —
chunker.py: הרחבת SECTION_PATTERNSהמשיבההמשיבתגובת ה...העורר/ת,המערער/תשכבה 2 —
halacha_extractor.py: עיגון חיוביפונקציה
_apply_discussion_anchor()— מסירהrulingchunks שמופיעים לפני ה-legal_analysisהראשון. כותרת "דיון/הכרעה" כגבול חד: כל מה שלפניה לא יגיע לחילוץ, גם אם הרג'קס לא כיסה את הכותרת.שכבה 3 —
halacha_quality.py: FLAG_PARTY_CLAIMדגל
party_claim_language— זיהוי שפת-טענות-צד ב-supporting_quoteבזמן חילוץ. מכוון לנוסחאות ייחוס ספציפיות (לטענת העורר/המשיבה/...,טוענת המשיבה, ...) — לא נוסחאות פסיביות כלליות שגם בתי-המשפט משתמשים בהן.היקף הבעיה שהתגלה
Invariants
בדיקות
test_chunker_section_patterns.py— כיסוי לכל הצורות החדשות ורגרסיה לצורות ישנות🤖 Generated with Claude Code