feat(style-acq T1-T3): קורפוס-דוגמאות של דפנה לכותב (style_exemplars) #80

Merged
chaim merged 1 commits from worktree-style-acquisition-mvp into main 2026-06-06 18:10:32 +00:00
Owner

רקע

ממלא את ערוץ-הדוגמאות (B) של מערכת רכישת-הסגנון: הכותב יאחזר פסקאות-בלוק אמיתיות של דפנה בזמן כתיבה, ממוקדות section+outcome+practice_area — לצד הפרופיל-המופשט (T0). הכרעה הנדסית: טבלה ייעודית במקום זיוף תיקים בשרשרת decision_paragraphs.

T1 — תשתית + backfill

  • SCHEMA_V27style_exemplars (decision_number/source/section/outcome/practice_area + embedding).
  • dbinsert/delete/search_style_exemplars + count_style_exemplars.
  • scripts/backfill_style_exemplars.py — מפצל קורפוס דפנה (style_corpus + internal_committee chair=דפנה) לסעיפים→פסקאות (25-450 מילים), embed (Voyage), שמירה. אידמפוטנטי, --dry-run/--apply.

T2 — אחזור ממוקד

  • search_style_exemplars(section, outcome, practice_area) — section=hard filter, outcome/practice_area=soft. block_writer._build_precedents_context ממפה block→section ומאחזר (ראשי), לצד הנתיב הישן (משלים).

T3 — adapt/contrastive

  • דוגמאות מתויגות "מבנה/קול בלבד — התאם, אל תעתיק תוכן"; פסקה מלאה (1100 תווים).

אימות

  • syntax OK (db, block_writer, backfill).
  • backfill --apply יורץ בנפרד (מקומי, venv + Voyage). migration SCHEMA_V27 רץ אוטומטית ב-get_pool.
  • פריסה: MCP מקומי — restart.

Invariants

INV-LRN5 (טוהר — סגנון בלבד) · G11.

🤖 Generated with Claude Code

## רקע ממלא את **ערוץ-הדוגמאות (B)** של מערכת רכישת-הסגנון: הכותב יאחזר **פסקאות-בלוק אמיתיות של דפנה** בזמן כתיבה, ממוקדות section+outcome+practice_area — לצד הפרופיל-המופשט (T0). הכרעה הנדסית: טבלה ייעודית במקום זיוף תיקים בשרשרת `decision_paragraphs`. ## T1 — תשתית + backfill - **SCHEMA_V27** — `style_exemplars` (decision_number/source/section/outcome/practice_area + embedding). - **db** — `insert/delete/search_style_exemplars` + `count_style_exemplars`. - **`scripts/backfill_style_exemplars.py`** — מפצל קורפוס דפנה (`style_corpus` + `internal_committee` chair=דפנה) לסעיפים→פסקאות (25-450 מילים), embed (Voyage), שמירה. אידמפוטנטי, `--dry-run`/`--apply`. ## T2 — אחזור ממוקד - `search_style_exemplars(section, outcome, practice_area)` — section=hard filter, outcome/practice_area=soft. `block_writer._build_precedents_context` ממפה block→section ומאחזר (ראשי), לצד הנתיב הישן (משלים). ## T3 — adapt/contrastive - דוגמאות מתויגות **"מבנה/קול בלבד — התאם, אל תעתיק תוכן"**; פסקה מלאה (1100 תווים). ## אימות - [x] syntax OK (db, block_writer, backfill). - backfill `--apply` יורץ בנפרד (מקומי, venv + Voyage). migration SCHEMA_V27 רץ אוטומטית ב-get_pool. - פריסה: MCP מקומי — restart. ## Invariants INV-LRN5 (טוהר — סגנון בלבד) · G11. 🤖 Generated with [Claude Code](https://claude.com/claude-code)
chaim added 1 commit 2026-06-06 18:10:21 +00:00
ממלא את ערוץ-הדוגמאות (B) של מערכת רכישת-הסגנון: הכותב מאחזר פסקאות-בלוק
אמיתיות של דפנה בזמן כתיבה, ממוקדות section+outcome+practice_area.

T1 — תשתית + backfill:
- SCHEMA_V27: טבלת style_exemplars (purpose-built — בלי תיקים מזויפים בשרשרת
  decision_paragraphs). decision_number/source/section/outcome/practice_area+embedding.
- db: insert/delete/search_style_exemplars + count_style_exemplars.
- scripts/backfill_style_exemplars.py: מפצל קורפוס דפנה (style_corpus +
  internal_committee) לסעיפים→פסקאות, embed, שמירה. אידמפוטנטי, dry-run/apply.

T2 — אחזור ממוקד:
- search_style_exemplars(section, outcome, practice_area) — section=hard filter,
  outcome/practice_area=soft. block_writer._build_precedents_context ממפה
  block→section ומאחזר (ראשי), לצד הנתיב הישן (משלים).

T3 — contrastive/adapt:
- הדוגמאות מתויגות "מבנה/קול בלבד — התאם, אל תעתיק תוכן"; פסקה מלאה (1100 תווים).

INV-LRN5 (טוהר — סגנון בלבד). G11. הרצת backfill --apply בנפרד.

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
chaim merged commit 424dc7cd18 into main 2026-06-06 18:10:32 +00:00
Sign in to join this conversation.
No Reviewers
No Label
1 Participants
Notifications
Due Date
No due date set.
Dependencies

No dependencies set.

Reference: ezer-mishpati/legal-ai#80