diff --git a/cases b/cases new file mode 120000 index 0000000..ed5c281 --- /dev/null +++ b/cases @@ -0,0 +1 @@ +/home/chaim/legal-ai/data/cases \ No newline at end of file diff --git a/data/benchmark-embeddings.json b/data/benchmark-embeddings.json new file mode 100644 index 0000000..3868142 --- /dev/null +++ b/data/benchmark-embeddings.json @@ -0,0 +1,875 @@ +{ + "voyage-3-large": { + "doc_time": 2.160531520843506, + "query_time": 0.3691830635070801, + "doc_tokens": 29372, + "query_tokens": 110, + "total_tokens": 29482, + "cost_usd": 0.00176892, + "dimensions": 1024, + "queries": [ + { + "query": "מהי הטענה המרכזית של העוררים בנוגע לחניה?", + "top5": [ + { + "score": 0.45552697235020545, + "doc": "תשובת ליבמן", + "chunk": 6, + "preview": "המוצעת. 4. המשיבים הציגו פתרון חניה שקיבל אישור של יועץ התנועה של המועצה המקומית" + }, + { + "score": 0.43466572419373245, + "doc": "תשובת ועדת הראל", + "chunk": 1, + "preview": "יח\"ד תוך מיצוי שטחי הבניה המותרים – מהווה ויתור היזם על** **היחידה השישית.** אלא" + }, + { + "score": 0.4198387036281709, + "doc": "תשובת ליבמן", + "chunk": 5, + "preview": "מכך שכבר תוכנית מי/135א לפני כ-30 שנה אפשרה בניה רוויה במגרשים שטרם החלה הבניה, " + }, + { + "score": 0.39491882241110504, + "doc": "כתב ערר קובר", + "chunk": 4, + "preview": "למה ואיך, ואיפה האישור לבניין הקיים ל-5 יח\"ד מבלי אפילו מקום חניה אחד בתוך המגרש" + }, + { + "score": 0.385910945433884, + "doc": "כתב ערר קובר", + "chunk": 3, + "preview": "בנייה. לשנן את הנקודה החשובה הזאת: לא אושרו 6 יח\"ד למגרש בווקום, אלא בתוך בניה מ" + } + ] + }, + { + "query": "מה עמדת הוועדה המקומית לגבי התכנית?", + "top5": [ + { + "score": 0.4857051185745742, + "doc": "תשובת ליבמן", + "chunk": 6, + "preview": "המוצעת. 4. המשיבים הציגו פתרון חניה שקיבל אישור של יועץ התנועה של המועצה המקומית" + }, + { + "score": 0.4774425600487735, + "doc": "תשובת ועדת הראל", + "chunk": 0, + "preview": "התקבל ב 02.09.25 **בפני ועדת ערר לתכנון ולבניה** **מחוז ירושלים** **העורר:** מרק" + }, + { + "score": 0.46114151010439974, + "doc": "כתב ערר מטמון", + "chunk": 3, + "preview": "לאחר פרסום ההחלטה, קיימו נציגי לשכת התכנון סיור ביישוב עם מהנדסת המועצה המקומית " + }, + { + "score": 0.4580968792031793, + "doc": "כתב ערר מטמון", + "chunk": 2, + "preview": "הנ\"ל לטבלת המגרשים הריקים באזור הרווי ובכך החילו את הוראות תב\"ע 135 א' על מגרשים" + }, + { + "score": 0.4569195468700868, + "doc": "כתב ערר מטמון", + "chunk": 5, + "preview": "\"לא לקחת הגדרה של זה שגם ככה הוציאו אותו בצורה יוצאת דופן... להפוך אותו שוב לעוד" + } + ] + }, + { + "query": "האם יש פגיעה בזכויות הבנייה של השכנים?", + "top5": [ + { + "score": 0.5512569069784039, + "doc": "תשובת ליבמן", + "chunk": 1, + "preview": "קובע כי \"כל מעונין בקרקע, בבנין או בכל פרט תכנוני אחר הרואה את עצמו נפגע על ידי " + }, + { + "score": 0.5189215483366741, + "doc": "תשובת ליבמן", + "chunk": 0, + "preview": "בסייד בפני ועדת הערר לתכנון ובניה מחוז ירושלים מרק קובר ת.ז.21038994 מרחוב אבינד" + }, + { + "score": 0.4809795036642419, + "doc": "כתב ערר קובר", + "chunk": 5, + "preview": "הועדה המחוזית. לכן, אין בנקודה הזאת של התנגדות רלוונטיות אלא אם כן כבוד ועדת הער" + }, + { + "score": 0.47633981918077806, + "doc": "תשובת ועדת הראל", + "chunk": 1, + "preview": "יח\"ד תוך מיצוי שטחי הבניה המותרים – מהווה ויתור היזם על** **היחידה השישית.** אלא" + }, + { + "score": 0.47440112401616313, + "doc": "כתב ערר קובר", + "chunk": 0, + "preview": "ועדת ערר מחוז ירושלים 14. 08. 2025 נתקבל כתב ערר להחלטת הועדה המרחבית הראל לתכנו" + } + ] + }, + { + "query": "מהם התנאים שנקבעו בהיתר הבנייה?", + "top5": [ + { + "score": 0.3968560638750618, + "doc": "כתב ערר קובר", + "chunk": 2, + "preview": "198/09, שהנידון שם היה טרם הבניה, בנושא שגם הגדלת השטח וגם הוספת יחיד היו נחשבים" + }, + { + "score": 0.3870927920319327, + "doc": "תשובת ליבמן", + "chunk": 3, + "preview": "6291/95 בן יקר גת חברה להנדסה ובנין בע\"מ נ' הוועדה המיוחדת לתכנון ולבנייה מודיעי" + }, + { + "score": 0.38607617658065185, + "doc": "כתב ערר קובר", + "chunk": 1, + "preview": "הועדה המקומית לאשר גם תוספת יח\"ד וגם תוספת שטחים, כמבואר ב-62א(א)(8). ועדת הערר " + }, + { + "score": 0.3599807030961722, + "doc": "כתב ערר קובר", + "chunk": 3, + "preview": "בנייה. לשנן את הנקודה החשובה הזאת: לא אושרו 6 יח\"ד למגרש בווקום, אלא בתוך בניה מ" + }, + { + "score": 0.3581832424785113, + "doc": "תשובת ועדת הראל", + "chunk": 1, + "preview": "יח\"ד תוך מיצוי שטחי הבניה המותרים – מהווה ויתור היזם על** **היחידה השישית.** אלא" + } + ] + }, + { + "query": "האם התכנית עומדת בתקן החניה?", + "top5": [ + { + "score": 0.4960205426989887, + "doc": "תשובת ליבמן", + "chunk": 6, + "preview": "המוצעת. 4. המשיבים הציגו פתרון חניה שקיבל אישור של יועץ התנועה של המועצה המקומית" + }, + { + "score": 0.4753790492626444, + "doc": "כתב ערר קובר", + "chunk": 3, + "preview": "בנייה. לשנן את הנקודה החשובה הזאת: לא אושרו 6 יח\"ד למגרש בווקום, אלא בתוך בניה מ" + }, + { + "score": 0.46028934735585875, + "doc": "כתב ערר קובר", + "chunk": 4, + "preview": "למה ואיך, ואיפה האישור לבניין הקיים ל-5 יח\"ד מבלי אפילו מקום חניה אחד בתוך המגרש" + }, + { + "score": 0.4534937167442651, + "doc": "תשובת ליבמן", + "chunk": 5, + "preview": "מכך שכבר תוכנית מי/135א לפני כ-30 שנה אפשרה בניה רוויה במגרשים שטרם החלה הבניה, " + }, + { + "score": 0.4406330213463829, + "doc": "תשובת ועדת הראל", + "chunk": 1, + "preview": "יח\"ד תוך מיצוי שטחי הבניה המותרים – מהווה ויתור היזם על** **היחידה השישית.** אלא" + } + ] + }, + { + "query": "מה טענות המשיבים לגבי הגובה והצפיפות?", + "top5": [ + { + "score": 0.3567138149575136, + "doc": "תשובת ועדת הראל", + "chunk": 1, + "preview": "יח\"ד תוך מיצוי שטחי הבניה המותרים – מהווה ויתור היזם על** **היחידה השישית.** אלא" + }, + { + "score": 0.34847473216035035, + "doc": "כתב ערר קובר", + "chunk": 4, + "preview": "למה ואיך, ואיפה האישור לבניין הקיים ל-5 יח\"ד מבלי אפילו מקום חניה אחד בתוך המגרש" + }, + { + "score": 0.34277808603786425, + "doc": "כתב ערר קובר", + "chunk": 3, + "preview": "בנייה. לשנן את הנקודה החשובה הזאת: לא אושרו 6 יח\"ד למגרש בווקום, אלא בתוך בניה מ" + }, + { + "score": 0.3426631344227079, + "doc": "כתב ערר קובר", + "chunk": 0, + "preview": "ועדת ערר מחוז ירושלים 14. 08. 2025 נתקבל כתב ערר להחלטת הועדה המרחבית הראל לתכנו" + }, + { + "score": 0.33710904804979946, + "doc": "תשובת ליבמן", + "chunk": 0, + "preview": "בסייד בפני ועדת הערר לתכנון ובניה מחוז ירושלים מרק קובר ת.ז.21038994 מרחוב אבינד" + } + ] + }, + { + "query": "האם נערך שימוע כדין לפני מתן ההחלטה?", + "top5": [ + { + "score": 0.43099212823278577, + "doc": "כתב ערר מטמון", + "chunk": 3, + "preview": "לאחר פרסום ההחלטה, קיימו נציגי לשכת התכנון סיור ביישוב עם מהנדסת המועצה המקומית " + }, + { + "score": 0.3981475314512722, + "doc": "כתב ערר מטמון", + "chunk": 4, + "preview": "חוות דעת משפטית, אך זו לא הוצגה, לא נידונה, ולא נמסרה לי. נאמר לי כי תוצג בדיון," + }, + { + "score": 0.39788748681014513, + "doc": "כתב ערר מטמון", + "chunk": 2, + "preview": "הנ\"ל לטבלת המגרשים הריקים באזור הרווי ובכך החילו את הוראות תב\"ע 135 א' על מגרשים" + }, + { + "score": 0.35426242747372305, + "doc": "כתב ערר קובר", + "chunk": 2, + "preview": "198/09, שהנידון שם היה טרם הבניה, בנושא שגם הגדלת השטח וגם הוספת יחיד היו נחשבים" + }, + { + "score": 0.35116758773177176, + "doc": "כתב ערר מטמון", + "chunk": 0, + "preview": "# כתב ערר/תשובה - יצחק מטמון **תאריך:** 22.10.2025 **מגיש:** יצחק מטמון, אבינדב " + } + ] + }, + { + "query": "מהם הנימוקים לאישור התכנית על ידי הוועדה המקומית?", + "top5": [ + { + "score": 0.49844561506479357, + "doc": "תשובת ועדת הראל", + "chunk": 0, + "preview": "התקבל ב 02.09.25 **בפני ועדת ערר לתכנון ולבניה** **מחוז ירושלים** **העורר:** מרק" + }, + { + "score": 0.47658179941180195, + "doc": "כתב ערר קובר", + "chunk": 4, + "preview": "למה ואיך, ואיפה האישור לבניין הקיים ל-5 יח\"ד מבלי אפילו מקום חניה אחד בתוך המגרש" + }, + { + "score": 0.46667693726943843, + "doc": "תשובת ליבמן", + "chunk": 6, + "preview": "המוצעת. 4. המשיבים הציגו פתרון חניה שקיבל אישור של יועץ התנועה של המועצה המקומית" + }, + { + "score": 0.4636495882763162, + "doc": "תשובת ליבמן", + "chunk": 1, + "preview": "קובע כי \"כל מעונין בקרקע, בבנין או בכל פרט תכנוני אחר הרואה את עצמו נפגע על ידי " + }, + { + "score": 0.4618473840057438, + "doc": "כתב ערר מטמון", + "chunk": 3, + "preview": "לאחר פרסום ההחלטה, קיימו נציגי לשכת התכנון סיור ביישוב עם מהנדסת המועצה המקומית " + } + ] + } + ] + }, + "voyage-4-large": { + "doc_time": 0.7145340442657471, + "query_time": 0.43074727058410645, + "doc_tokens": 29372, + "query_tokens": 110, + "total_tokens": 29482, + "cost_usd": 0.00353784, + "dimensions": 1024, + "queries": [ + { + "query": "מהי הטענה המרכזית של העוררים בנוגע לחניה?", + "top5": [ + { + "score": 0.4779343984469138, + "doc": "תשובת ליבמן", + "chunk": 6, + "preview": "המוצעת. 4. המשיבים הציגו פתרון חניה שקיבל אישור של יועץ התנועה של המועצה המקומית" + }, + { + "score": 0.4286969964115333, + "doc": "כתב ערר קובר", + "chunk": 3, + "preview": "בנייה. לשנן את הנקודה החשובה הזאת: לא אושרו 6 יח\"ד למגרש בווקום, אלא בתוך בניה מ" + }, + { + "score": 0.4184225266072276, + "doc": "תשובת ועדת הראל", + "chunk": 1, + "preview": "יח\"ד תוך מיצוי שטחי הבניה המותרים – מהווה ויתור היזם על** **היחידה השישית.** אלא" + }, + { + "score": 0.397857306516823, + "doc": "כתב ערר מטמון", + "chunk": 1, + "preview": "בעיית משאית פינוי האשפה ופתרון בעיית החניות הקיימת – ללא תוספות חריגות בבניינים " + }, + { + "score": 0.3755498784052147, + "doc": "תשובת ליבמן", + "chunk": 5, + "preview": "מכך שכבר תוכנית מי/135א לפני כ-30 שנה אפשרה בניה רוויה במגרשים שטרם החלה הבניה, " + } + ] + }, + { + "query": "מה עמדת הוועדה המקומית לגבי התכנית?", + "top5": [ + { + "score": 0.48101631745565193, + "doc": "כתב ערר מטמון", + "chunk": 3, + "preview": "לאחר פרסום ההחלטה, קיימו נציגי לשכת התכנון סיור ביישוב עם מהנדסת המועצה המקומית " + }, + { + "score": 0.4805317589472102, + "doc": "תשובת ליבמן", + "chunk": 6, + "preview": "המוצעת. 4. המשיבים הציגו פתרון חניה שקיבל אישור של יועץ התנועה של המועצה המקומית" + }, + { + "score": 0.45861226378349235, + "doc": "כתב ערר מטמון", + "chunk": 2, + "preview": "הנ\"ל לטבלת המגרשים הריקים באזור הרווי ובכך החילו את הוראות תב\"ע 135 א' על מגרשים" + }, + { + "score": 0.45105895759375003, + "doc": "כתב ערר מטמון", + "chunk": 5, + "preview": "\"לא לקחת הגדרה של זה שגם ככה הוציאו אותו בצורה יוצאת דופן... להפוך אותו שוב לעוד" + }, + { + "score": 0.4452113301852504, + "doc": "כתב ערר קובר", + "chunk": 4, + "preview": "למה ואיך, ואיפה האישור לבניין הקיים ל-5 יח\"ד מבלי אפילו מקום חניה אחד בתוך המגרש" + } + ] + }, + { + "query": "האם יש פגיעה בזכויות הבנייה של השכנים?", + "top5": [ + { + "score": 0.47788408545232797, + "doc": "תשובת ועדת הראל", + "chunk": 1, + "preview": "יח\"ד תוך מיצוי שטחי הבניה המותרים – מהווה ויתור היזם על** **היחידה השישית.** אלא" + }, + { + "score": 0.4728887051406596, + "doc": "תשובת ליבמן", + "chunk": 1, + "preview": "קובע כי \"כל מעונין בקרקע, בבנין או בכל פרט תכנוני אחר הרואה את עצמו נפגע על ידי " + }, + { + "score": 0.44009307393127606, + "doc": "כתב ערר מטמון", + "chunk": 0, + "preview": "# כתב ערר/תשובה - יצחק מטמון **תאריך:** 22.10.2025 **מגיש:** יצחק מטמון, אבינדב " + }, + { + "score": 0.43846629246720314, + "doc": "תשובת ליבמן", + "chunk": 0, + "preview": "בסייד בפני ועדת הערר לתכנון ובניה מחוז ירושלים מרק קובר ת.ז.21038994 מרחוב אבינד" + }, + { + "score": 0.4296956323972593, + "doc": "כתב ערר קובר", + "chunk": 5, + "preview": "הועדה המחוזית. לכן, אין בנקודה הזאת של התנגדות רלוונטיות אלא אם כן כבוד ועדת הער" + } + ] + }, + { + "query": "מהם התנאים שנקבעו בהיתר הבנייה?", + "top5": [ + { + "score": 0.39798937155509323, + "doc": "כתב ערר קובר", + "chunk": 3, + "preview": "בנייה. לשנן את הנקודה החשובה הזאת: לא אושרו 6 יח\"ד למגרש בווקום, אלא בתוך בניה מ" + }, + { + "score": 0.38511846982082976, + "doc": "כתב ערר קובר", + "chunk": 1, + "preview": "הועדה המקומית לאשר גם תוספת יח\"ד וגם תוספת שטחים, כמבואר ב-62א(א)(8). ועדת הערר " + }, + { + "score": 0.36698249480683875, + "doc": "כתב ערר קובר", + "chunk": 2, + "preview": "198/09, שהנידון שם היה טרם הבניה, בנושא שגם הגדלת השטח וגם הוספת יחיד היו נחשבים" + }, + { + "score": 0.36685990030225546, + "doc": "תשובת ועדת הראל", + "chunk": 1, + "preview": "יח\"ד תוך מיצוי שטחי הבניה המותרים – מהווה ויתור היזם על** **היחידה השישית.** אלא" + }, + { + "score": 0.348382733103959, + "doc": "כתב ערר קובר", + "chunk": 4, + "preview": "למה ואיך, ואיפה האישור לבניין הקיים ל-5 יח\"ד מבלי אפילו מקום חניה אחד בתוך המגרש" + } + ] + }, + { + "query": "האם התכנית עומדת בתקן החניה?", + "top5": [ + { + "score": 0.3948278938663396, + "doc": "כתב ערר קובר", + "chunk": 3, + "preview": "בנייה. לשנן את הנקודה החשובה הזאת: לא אושרו 6 יח\"ד למגרש בווקום, אלא בתוך בניה מ" + }, + { + "score": 0.3567420744746239, + "doc": "תשובת ליבמן", + "chunk": 6, + "preview": "המוצעת. 4. המשיבים הציגו פתרון חניה שקיבל אישור של יועץ התנועה של המועצה המקומית" + }, + { + "score": 0.35597212422075997, + "doc": "כתב ערר קובר", + "chunk": 4, + "preview": "למה ואיך, ואיפה האישור לבניין הקיים ל-5 יח\"ד מבלי אפילו מקום חניה אחד בתוך המגרש" + }, + { + "score": 0.3331851765322283, + "doc": "תשובת ליבמן", + "chunk": 5, + "preview": "מכך שכבר תוכנית מי/135א לפני כ-30 שנה אפשרה בניה רוויה במגרשים שטרם החלה הבניה, " + }, + { + "score": 0.3326197383492352, + "doc": "תשובת ועדת הראל", + "chunk": 1, + "preview": "יח\"ד תוך מיצוי שטחי הבניה המותרים – מהווה ויתור היזם על** **היחידה השישית.** אלא" + } + ] + }, + { + "query": "מה טענות המשיבים לגבי הגובה והצפיפות?", + "top5": [ + { + "score": 0.2799838857019288, + "doc": "כתב ערר מטמון", + "chunk": 4, + "preview": "חוות דעת משפטית, אך זו לא הוצגה, לא נידונה, ולא נמסרה לי. נאמר לי כי תוצג בדיון," + }, + { + "score": 0.27113472764757574, + "doc": "כתב ערר קובר", + "chunk": 3, + "preview": "בנייה. לשנן את הנקודה החשובה הזאת: לא אושרו 6 יח\"ד למגרש בווקום, אלא בתוך בניה מ" + }, + { + "score": 0.2586963050935262, + "doc": "תשובת ליבמן", + "chunk": 0, + "preview": "בסייד בפני ועדת הערר לתכנון ובניה מחוז ירושלים מרק קובר ת.ז.21038994 מרחוב אבינד" + }, + { + "score": 0.25151215229405505, + "doc": "כתב ערר קובר", + "chunk": 0, + "preview": "ועדת ערר מחוז ירושלים 14. 08. 2025 נתקבל כתב ערר להחלטת הועדה המרחבית הראל לתכנו" + }, + { + "score": 0.24453899390595563, + "doc": "תשובת ועדת הראל", + "chunk": 1, + "preview": "יח\"ד תוך מיצוי שטחי הבניה המותרים – מהווה ויתור היזם על** **היחידה השישית.** אלא" + } + ] + }, + { + "query": "האם נערך שימוע כדין לפני מתן ההחלטה?", + "top5": [ + { + "score": 0.3298147856975688, + "doc": "כתב ערר מטמון", + "chunk": 3, + "preview": "לאחר פרסום ההחלטה, קיימו נציגי לשכת התכנון סיור ביישוב עם מהנדסת המועצה המקומית " + }, + { + "score": 0.3081065688212409, + "doc": "כתב ערר מטמון", + "chunk": 6, + "preview": "הנפגע למצות את זכותו להגיש התנגדות מנומקת ולטעון טענותיו בעל פה בפני הוועדה. ---" + }, + { + "score": 0.30535746999969005, + "doc": "כתב ערר מטמון", + "chunk": 4, + "preview": "חוות דעת משפטית, אך זו לא הוצגה, לא נידונה, ולא נמסרה לי. נאמר לי כי תוצג בדיון," + }, + { + "score": 0.3012462701127593, + "doc": "כתב ערר מטמון", + "chunk": 2, + "preview": "הנ\"ל לטבלת המגרשים הריקים באזור הרווי ובכך החילו את הוראות תב\"ע 135 א' על מגרשים" + }, + { + "score": 0.24831415939374535, + "doc": "כתב ערר מטמון", + "chunk": 0, + "preview": "# כתב ערר/תשובה - יצחק מטמון **תאריך:** 22.10.2025 **מגיש:** יצחק מטמון, אבינדב " + } + ] + }, + { + "query": "מהם הנימוקים לאישור התכנית על ידי הוועדה המקומית?", + "top5": [ + { + "score": 0.455701010456977, + "doc": "כתב ערר קובר", + "chunk": 4, + "preview": "למה ואיך, ואיפה האישור לבניין הקיים ל-5 יח\"ד מבלי אפילו מקום חניה אחד בתוך המגרש" + }, + { + "score": 0.4531137805769238, + "doc": "תשובת ועדת הראל", + "chunk": 0, + "preview": "התקבל ב 02.09.25 **בפני ועדת ערר לתכנון ולבניה** **מחוז ירושלים** **העורר:** מרק" + }, + { + "score": 0.44511363045803604, + "doc": "כתב ערר מטמון", + "chunk": 3, + "preview": "לאחר פרסום ההחלטה, קיימו נציגי לשכת התכנון סיור ביישוב עם מהנדסת המועצה המקומית " + }, + { + "score": 0.44510377110669735, + "doc": "כתב ערר מטמון", + "chunk": 5, + "preview": "\"לא לקחת הגדרה של זה שגם ככה הוציאו אותו בצורה יוצאת דופן... להפוך אותו שוב לעוד" + }, + { + "score": 0.43812915786761897, + "doc": "תשובת ליבמן", + "chunk": 6, + "preview": "המוצעת. 4. המשיבים הציגו פתרון חניה שקיבל אישור של יועץ התנועה של המועצה המקומית" + } + ] + } + ] + }, + "voyage-law-2": { + "doc_time": 11.868245124816895, + "query_time": 5.83799147605896, + "doc_tokens": 68508, + "query_tokens": 311, + "total_tokens": 68819, + "cost_usd": 0.00825828, + "dimensions": 1024, + "queries": [ + { + "query": "מהי הטענה המרכזית של העוררים בנוגע לחניה?", + "top5": [ + { + "score": 0.5719472051728132, + "doc": "תשובת ליבמן", + "chunk": 6, + "preview": "המוצעת. 4. המשיבים הציגו פתרון חניה שקיבל אישור של יועץ התנועה של המועצה המקומית" + }, + { + "score": 0.5375637278159117, + "doc": "תשובת ליבמן", + "chunk": 5, + "preview": "מכך שכבר תוכנית מי/135א לפני כ-30 שנה אפשרה בניה רוויה במגרשים שטרם החלה הבניה, " + }, + { + "score": 0.5325632912056516, + "doc": "תשובת ועדת הראל", + "chunk": 1, + "preview": "יח\"ד תוך מיצוי שטחי הבניה המותרים – מהווה ויתור היזם על** **היחידה השישית.** אלא" + }, + { + "score": 0.5258784945367275, + "doc": "כתב ערר קובר", + "chunk": 3, + "preview": "בנייה. לשנן את הנקודה החשובה הזאת: לא אושרו 6 יח\"ד למגרש בווקום, אלא בתוך בניה מ" + }, + { + "score": 0.5211251766446994, + "doc": "כתב ערר מטמון", + "chunk": 6, + "preview": "הנפגע למצות את זכותו להגיש התנגדות מנומקת ולטעון טענותיו בעל פה בפני הוועדה. ---" + } + ] + }, + { + "query": "מה עמדת הוועדה המקומית לגבי התכנית?", + "top5": [ + { + "score": 0.5914304292443499, + "doc": "כתב ערר קובר", + "chunk": 6, + "preview": "שלא היתה לוועדה המקומטת הסמכות לאישור התכנית, הן מפני שאישרו גם הוספת קומה וגם ה" + }, + { + "score": 0.5881555206233365, + "doc": "תשובת ליבמן", + "chunk": 6, + "preview": "המוצעת. 4. המשיבים הציגו פתרון חניה שקיבל אישור של יועץ התנועה של המועצה המקומית" + }, + { + "score": 0.556911108120521, + "doc": "כתב ערר מטמון", + "chunk": 4, + "preview": "חוות דעת משפטית, אך זו לא הוצגה, לא נידונה, ולא נמסרה לי. נאמר לי כי תוצג בדיון," + }, + { + "score": 0.548469587955851, + "doc": "כתב ערר קובר", + "chunk": 4, + "preview": "למה ואיך, ואיפה האישור לבניין הקיים ל-5 יח\"ד מבלי אפילו מקום חניה אחד בתוך המגרש" + }, + { + "score": 0.5478187405419974, + "doc": "כתב ערר מטמון", + "chunk": 6, + "preview": "הנפגע למצות את זכותו להגיש התנגדות מנומקת ולטעון טענותיו בעל פה בפני הוועדה. ---" + } + ] + }, + { + "query": "האם יש פגיעה בזכויות הבנייה של השכנים?", + "top5": [ + { + "score": 0.6490873939447226, + "doc": "כתב ערר קובר", + "chunk": 6, + "preview": "שלא היתה לוועדה המקומטת הסמכות לאישור התכנית, הן מפני שאישרו גם הוספת קומה וגם ה" + }, + { + "score": 0.6340108177311176, + "doc": "תשובת ליבמן", + "chunk": 0, + "preview": "בסייד בפני ועדת הערר לתכנון ובניה מחוז ירושלים מרק קובר ת.ז.21038994 מרחוב אבינד" + }, + { + "score": 0.6281689033296972, + "doc": "כתב ערר קובר", + "chunk": 5, + "preview": "הועדה המחוזית. לכן, אין בנקודה הזאת של התנגדות רלוונטיות אלא אם כן כבוד ועדת הער" + }, + { + "score": 0.6262263506011073, + "doc": "תשובת ליבמן", + "chunk": 3, + "preview": "6291/95 בן יקר גת חברה להנדסה ובנין בע\"מ נ' הוועדה המיוחדת לתכנון ולבנייה מודיעי" + }, + { + "score": 0.6240746179234558, + "doc": "תשובת ליבמן", + "chunk": 1, + "preview": "קובע כי \"כל מעונין בקרקע, בבנין או בכל פרט תכנוני אחר הרואה את עצמו נפגע על ידי " + } + ] + }, + { + "query": "מהם התנאים שנקבעו בהיתר הבנייה?", + "top5": [ + { + "score": 0.5946203725298453, + "doc": "תשובת ליבמן", + "chunk": 5, + "preview": "מכך שכבר תוכנית מי/135א לפני כ-30 שנה אפשרה בניה רוויה במגרשים שטרם החלה הבניה, " + }, + { + "score": 0.5779431381169936, + "doc": "כתב ערר מטמון", + "chunk": 5, + "preview": "\"לא לקחת הגדרה של זה שגם ככה הוציאו אותו בצורה יוצאת דופן... להפוך אותו שוב לעוד" + }, + { + "score": 0.5677818389824565, + "doc": "תשובת ליבמן", + "chunk": 3, + "preview": "6291/95 בן יקר גת חברה להנדסה ובנין בע\"מ נ' הוועדה המיוחדת לתכנון ולבנייה מודיעי" + }, + { + "score": 0.5642985608613257, + "doc": "כתב ערר קובר", + "chunk": 3, + "preview": "בנייה. לשנן את הנקודה החשובה הזאת: לא אושרו 6 יח\"ד למגרש בווקום, אלא בתוך בניה מ" + }, + { + "score": 0.5578101221696489, + "doc": "תשובת ליבמן", + "chunk": 4, + "preview": "העורר לעניין זה. ו. משמעות החלטת הועדה המחוזית משנת 2017. 6. יש לדחות את טענות ה" + } + ] + }, + { + "query": "האם התכנית עומדת בתקן החניה?", + "top5": [ + { + "score": 0.5641352335658906, + "doc": "תשובת ליבמן", + "chunk": 6, + "preview": "המוצעת. 4. המשיבים הציגו פתרון חניה שקיבל אישור של יועץ התנועה של המועצה המקומית" + }, + { + "score": 0.5602931289883211, + "doc": "כתב ערר קובר", + "chunk": 3, + "preview": "בנייה. לשנן את הנקודה החשובה הזאת: לא אושרו 6 יח\"ד למגרש בווקום, אלא בתוך בניה מ" + }, + { + "score": 0.5430750080731945, + "doc": "כתב ערר קובר", + "chunk": 6, + "preview": "שלא היתה לוועדה המקומטת הסמכות לאישור התכנית, הן מפני שאישרו גם הוספת קומה וגם ה" + }, + { + "score": 0.5168002191989363, + "doc": "תשובת ליבמן", + "chunk": 5, + "preview": "מכך שכבר תוכנית מי/135א לפני כ-30 שנה אפשרה בניה רוויה במגרשים שטרם החלה הבניה, " + }, + { + "score": 0.5071732266091118, + "doc": "כתב ערר קובר", + "chunk": 5, + "preview": "הועדה המחוזית. לכן, אין בנקודה הזאת של התנגדות רלוונטיות אלא אם כן כבוד ועדת הער" + } + ] + }, + { + "query": "מה טענות המשיבים לגבי הגובה והצפיפות?", + "top5": [ + { + "score": 0.4992452616493536, + "doc": "כתב ערר מטמון", + "chunk": 6, + "preview": "הנפגע למצות את זכותו להגיש התנגדות מנומקת ולטעון טענותיו בעל פה בפני הוועדה. ---" + }, + { + "score": 0.48726688934334755, + "doc": "תשובת ליבמן", + "chunk": 6, + "preview": "המוצעת. 4. המשיבים הציגו פתרון חניה שקיבל אישור של יועץ התנועה של המועצה המקומית" + }, + { + "score": 0.4319233887691947, + "doc": "תשובת ועדת הראל", + "chunk": 2, + "preview": "בפרסום בין היתר גם בשים לב לעובדה שהעורר עצמו הגיש התנגדות ללמדך שהפרסום היה אפק" + }, + { + "score": 0.4185426925558015, + "doc": "כתב ערר מטמון", + "chunk": 5, + "preview": "\"לא לקחת הגדרה של זה שגם ככה הוציאו אותו בצורה יוצאת דופן... להפוך אותו שוב לעוד" + }, + { + "score": 0.41545788222409435, + "doc": "כתב ערר קובר", + "chunk": 5, + "preview": "הועדה המחוזית. לכן, אין בנקודה הזאת של התנגדות רלוונטיות אלא אם כן כבוד ועדת הער" + } + ] + }, + { + "query": "האם נערך שימוע כדין לפני מתן ההחלטה?", + "top5": [ + { + "score": 0.5928997875758119, + "doc": "כתב ערר מטמון", + "chunk": 6, + "preview": "הנפגע למצות את זכותו להגיש התנגדות מנומקת ולטעון טענותיו בעל פה בפני הוועדה. ---" + }, + { + "score": 0.5835634569931607, + "doc": "כתב ערר קובר", + "chunk": 6, + "preview": "שלא היתה לוועדה המקומטת הסמכות לאישור התכנית, הן מפני שאישרו גם הוספת קומה וגם ה" + }, + { + "score": 0.535693954454408, + "doc": "כתב ערר מטמון", + "chunk": 3, + "preview": "לאחר פרסום ההחלטה, קיימו נציגי לשכת התכנון סיור ביישוב עם מהנדסת המועצה המקומית " + }, + { + "score": 0.5251227344556526, + "doc": "כתב ערר מטמון", + "chunk": 4, + "preview": "חוות דעת משפטית, אך זו לא הוצגה, לא נידונה, ולא נמסרה לי. נאמר לי כי תוצג בדיון," + }, + { + "score": 0.5010639755478099, + "doc": "כתב ערר קובר", + "chunk": 5, + "preview": "הועדה המחוזית. לכן, אין בנקודה הזאת של התנגדות רלוונטיות אלא אם כן כבוד ועדת הער" + } + ] + }, + { + "query": "מהם הנימוקים לאישור התכנית על ידי הוועדה המקומית?", + "top5": [ + { + "score": 0.608219402731344, + "doc": "תשובת ליבמן", + "chunk": 6, + "preview": "המוצעת. 4. המשיבים הציגו פתרון חניה שקיבל אישור של יועץ התנועה של המועצה המקומית" + }, + { + "score": 0.5976481977620994, + "doc": "כתב ערר קובר", + "chunk": 6, + "preview": "שלא היתה לוועדה המקומטת הסמכות לאישור התכנית, הן מפני שאישרו גם הוספת קומה וגם ה" + }, + { + "score": 0.5605295780913448, + "doc": "כתב ערר מטמון", + "chunk": 6, + "preview": "הנפגע למצות את זכותו להגיש התנגדות מנומקת ולטעון טענותיו בעל פה בפני הוועדה. ---" + }, + { + "score": 0.5398353352856547, + "doc": "כתב ערר קובר", + "chunk": 4, + "preview": "למה ואיך, ואיפה האישור לבניין הקיים ל-5 יח\"ד מבלי אפילו מקום חניה אחד בתוך המגרש" + }, + { + "score": 0.5266016738343542, + "doc": "כתב ערר מטמון", + "chunk": 4, + "preview": "חוות דעת משפטית, אך זו לא הוצגה, לא נידונה, ולא נמסרה לי. נאמר לי כי תוצג בדיון," + } + ] + } + ] + } +} \ No newline at end of file diff --git a/data/google-vision-extraction.json b/data/google-vision-extraction.json new file mode 100644 index 0000000..ea6bb91 --- /dev/null +++ b/data/google-vision-extraction.json @@ -0,0 +1,130 @@ +[ + { + "name": "1130-25-החלטה לתיקון פרוטוקול", + "pages": 2, + "chars": 2196, + "words": 380, + "time": 1.7020537853240967, + "skipped": false + }, + { + "name": "1130-25-פרוטוקול ועדת ערר והחלטה", + "pages": 16, + "chars": 32246, + "words": 6189, + "time": 14.324745178222656, + "skipped": false + }, + { + "name": "בקשה להשלמת טיעון ממשיבים 2-3", + "pages": 1, + "chars": 1179, + "words": 191, + "time": 0.8292603492736816, + "skipped": false + }, + { + "name": "בקשת העורר לדחיית השלמת הטיעון במלואה", + "pages": 12, + "chars": 17267, + "words": 3011, + "time": 14.493695497512817, + "skipped": false + }, + { + "name": "החלטת ביניים 1130-25", + "pages": 2, + "chars": 2221, + "words": 389, + "time": 1.4203259944915771, + "skipped": false + }, + { + "name": "החלטת ועדה מקומית לאשר את התכנית", + "pages": 1, + "chars": 4074, + "words": 718, + "time": 0.8931229114532471, + "skipped": false + }, + { + "name": "השלמת טיעון מטעם הוועדה המקומית", + "pages": 3, + "chars": 4658, + "words": 809, + "time": 2.1477737426757812, + "skipped": false + }, + { + "name": "השלמת טיעון מטעם משיבים 2-3", + "pages": 6, + "chars": 6329, + "words": 1080, + "time": 5.7703633308410645, + "skipped": false + }, + { + "name": "כתב תשובה-השלמת טיעון מטעם המשיב יצחק מטמון", + "pages": 25, + "chars": 49197, + "words": 8404, + "time": 25.85392999649048, + "skipped": false + }, + { + "name": "מרק קובר-כתב ערר", + "pages": 8, + "chars": 17355, + "words": 3101, + "time": 0, + "skipped": true + }, + { + "name": "פרוטוקול ועדה מקומית לדיון בתכנית 152-1257682", + "pages": 7, + "chars": 14373, + "words": 2466, + "time": 5.331800699234009, + "skipped": false + }, + { + "name": "תגובת העורר לתשובת ועדת הראל להשלמת הטיעון ערר", + "pages": 4, + "chars": 8165, + "words": 1427, + "time": 3.2448556423187256, + "skipped": false + }, + { + "name": "תשובה לערר מטעם המשיבים", + "pages": 11, + "chars": 17555, + "words": 3072, + "time": 0, + "skipped": true + }, + { + "name": "תשובה מטעם העורר להשלמת טיעון", + "pages": 3, + "chars": 3388, + "words": 615, + "time": 2.0065605640411377, + "skipped": false + }, + { + "name": "תשובת הועדה המרחבית לערר", + "pages": 4, + "chars": 6025, + "words": 1084, + "time": 3.2476346492767334, + "skipped": false + }, + { + "name": "תשובת המשיב-יצחק מטמון", + "pages": 19, + "chars": 42415, + "words": 7380, + "time": 24.800947427749634, + "skipped": false + } +] \ No newline at end of file diff --git a/paperclip-bug-report.md b/paperclip-bug-report.md new file mode 100644 index 0000000..cf451da --- /dev/null +++ b/paperclip-bug-report.md @@ -0,0 +1,65 @@ +# Bug: Skill import from Gitea — wrong raw URL format causes empty SKILL.md + +**File at:** https://github.com/paperclipai/paperclip/issues/new + +## Title +Skill import from Gitea: wrong raw URL format causes empty SKILL.md + +## Body + +### Bug Summary + +When importing skills from a **Gitea** instance (self-hosted), Paperclip fetches the git tree successfully via the `/api/v3/` endpoint (which Gitea supports), but then uses the **wrong raw file URL format** to download `SKILL.md` content, resulting in a 404 and an almost-empty stub being saved. + +### Environment + +- Paperclip server: `@paperclipai/server@2026.403.0` +- Gitea instance: self-hosted Gitea + +### Steps to Reproduce + +1. Host a skill repo on a Gitea instance with a `SKILL.md` (32KB+), `scripts/`, and `references/` directories +2. Import the skill via URL: `https://my-gitea.example.com/org/skill-name.git` +3. Observe that only a stub SKILL.md (~283 bytes) is saved, and subdirectories are missing + +### Root Cause + +In `server/dist/services/github-fetch.js`, the `resolveRawGitHubUrl()` function builds: + +``` +https://{hostname}/raw/{owner}/{repo}/{ref}/{file} +``` + +This format works for **GitHub Enterprise**, but **not for Gitea**. Gitea expects: + +``` +https://{hostname}/{owner}/{repo}/raw/branch/{ref}/{file} +``` + +### Proof + +```bash +# Paperclip's URL format -> 404 +$ curl -s -o /dev/null -w "%{http_code}" "https://my-gitea.example.com/raw/org/skill-repo/main/SKILL.md" +404 + +# Correct Gitea format -> 200 +$ curl -s -o /dev/null -w "%{http_code}" "https://my-gitea.example.com/org/skill-repo/raw/branch/main/SKILL.md" +200 +``` + +### Secondary Issue + +When `SKILL.md` is at the repository root, `path.posix.dirname("SKILL.md")` returns `"."`, causing the inventory filter `entry.startsWith("./")` to miss all sibling directories (`scripts/`, `references/`). This means even if the raw URL worked, subdirectories would still be excluded from the file inventory. + +### Suggested Fix + +1. **Detect Gitea** vs GitHub Enterprise (e.g., check for `/api/v1/` endpoint which is Gitea-specific, vs `/api/v3/`) +2. **Use the correct raw URL format** per platform: + - GitHub/GHE: `https://{hostname}/raw/{owner}/{repo}/{ref}/{file}` + - Gitea: `https://{hostname}/{owner}/{repo}/raw/branch/{ref}/{file}` +3. **Fix root-level SKILL.md inventory**: when `skillDir === "."`, include all files instead of filtering by `entry.startsWith("./")` + +### Workaround + +Manually clone the repo into `~/.paperclip/instances/default/skills/{company_id}/{slug}/` and update the `company_skills` table directly with correct markdown content and file_inventory.