feat(chunker): דפוסי טענות לפסיקת בית-המשפט — parties_claims #297

Merged
chaim merged 1 commits from worktree-chunker-court-patterns into main 2026-06-17 17:21:05 +00:00
Owner

רקע

אחרי PR #296 נשארו 247 תיקים עם 0 chunks של טענות-צדדים. בדיקת הטקסטים גילתה שפסקי-דין של ביהמ"ש העליון/מנהלי משתמשים בנוסחאות שונות מוועדת הערר:

נוסחה דוגמה
טענות הצדדים הנפוץ ביותר בעליון
טיעוני המערערים/ת צורת פועל במקום "טענות"
טיעוני המשיבים/ה
עמדות הצדדים פחות נפוץ

שינויים

chunker.py

  • סוג חדש parties_claims — מתאים ל-"טענות/טיעוני/עמדות הצדדים" (דו-צדדי, ללא פיצול לצדדים)
  • הוספת טיעוני ל-appellant_claims וגם ל-respondent_claims

halacha_extractor.py

  • parties_claims נוסף ל-NON_REASONING_SECTIONS — לא יוזן לחילוץ הלכות

Invariants

  • G1: תיקון במקור (chunker), לא downstream
  • INV-LRN2: rhetorical-role pre-filter — parties_claims מוחרג כמו שאר סוגי הטענות

בדיקות

398 passed ✓

🤖 Generated with Claude Code

## רקע אחרי PR #296 נשארו 247 תיקים עם 0 chunks של טענות-צדדים. בדיקת הטקסטים גילתה שפסקי-דין של ביהמ"ש העליון/מנהלי משתמשים בנוסחאות שונות מוועדת הערר: | נוסחה | דוגמה | |--------|-------| | `טענות הצדדים` | הנפוץ ביותר בעליון | | `טיעוני המערערים/ת` | צורת פועל במקום "טענות" | | `טיעוני המשיבים/ה` | | | `עמדות הצדדים` | פחות נפוץ | ## שינויים ### `chunker.py` - סוג חדש **`parties_claims`** — מתאים ל-"טענות/טיעוני/עמדות הצדדים" (דו-צדדי, ללא פיצול לצדדים) - הוספת `טיעוני` ל-`appellant_claims` וגם ל-`respondent_claims` ### `halacha_extractor.py` - `parties_claims` נוסף ל-`NON_REASONING_SECTIONS` — לא יוזן לחילוץ הלכות ## Invariants - **G1**: תיקון במקור (chunker), לא downstream - **INV-LRN2**: rhetorical-role pre-filter — parties_claims מוחרג כמו שאר סוגי הטענות ## בדיקות 398 passed ✓ 🤖 Generated with [Claude Code](https://claude.ai/claude-code)
chaim added 1 commit 2026-06-17 17:17:16 +00:00
feat(chunker): הוספת דפוסי טענות לפסיקת בית-המשפט (parties_claims)
All checks were successful
G12 Leak-Guard / leak-guard (pull_request) Successful in 4s
Lint — undefined names / undefined-names (pull_request) Successful in 11s
9618dc895b
פסקי-דין של ביהמ"ש העליון/מנהלי משתמשים בנוסחאות שונות מוועדת הערר:
- "טענות הצדדים" / "טיעוני הצדדים" — סוג חדש parties_claims
- "טיעוני המערערים/ת" — מוסף ל-appellant_claims
- "טיעוני המשיבים/ה" — מוסף ל-respondent_claims

parties_claims הוסף ל-NON_REASONING_SECTIONS בhalacha_extractor
כדי שלא יוזנו לחילוץ הלכות (בדיוק כמו appellant_claims/respondent_claims).

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
chaim merged commit 8d9841a9f3 into main 2026-06-17 17:21:05 +00:00
chaim deleted branch worktree-chunker-court-patterns 2026-06-17 17:21:06 +00:00
Sign in to join this conversation.
No Reviewers
No Label
1 Participants
Notifications
Due Date
No due date set.
Dependencies

No dependencies set.

Reference: ezer-mishpati/legal-ai#297