### extract citation no API

In [None]:
import docx
import pandas as pd
import torch
from transformers import BertTokenizer, BertForSequenceClassification
from pathlib import Path

required_parts = [
    "מתחמי ענישה", "אחידות בענישה", "מתחם הענישה", "מתחם ענישה", "דיון",
    "ענישה נהוגה", "הענישה הנוהגת", "ענישה נוהגת", "מתחם העונש", "מתחם עונש",
    "מדיניות הענישה", "והכרעה", "ההרשעה", "מדיניות הענישה הנהוגה"
]
citation_patterns = {
    'ע"פ': r'ע"פ (\d+/\d+)',
    'עפ"ג': r'עפ"ג (\d+/\d+)',
    'ת״פ': r'ת״פ (\d+[-/]\d+[-/]\d+)',
    'עפ״ג': r'עפ״ג (\d+/\d+)',
    'רע״פ': r'רע״פ (\d+/\d+)',
    'תפ"ח': r'תפ"ח\s*(\d+[-/]\d+[-/]\d+)',
}

# Load the trained model and tokenizer
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model_path = "/home/liorkob/best_model.pt"  # Path to your saved model
tokenizer = BertTokenizer.from_pretrained('avichr/heBERT')
model = BertForSequenceClassification.from_pretrained('avichr/heBERT', num_labels=2)
model.load_state_dict(torch.load(model_path, map_location=device))
model.to(device)
model.eval()


def extract_citations(para_text):
    """
    Extracts all citations and their full references from the text.
    Returns a list of tuples: (citation_type, full_citation).
    """
    citations = []

    for citation_type, pattern in citation_patterns.items():
        matches = re.findall(pattern, para_text)  # Find all matches for the pattern
        for match in matches:
            full_citation = f"{citation_type} {match}"  # Construct full citation
            citations.append((citation_type, full_citation))

    return citations  # List of (citation_type, full_citation)

def filter_csv_relevant_parts(csv_data):
    """Extracts the first occurrence of a required part in the CSV and all subsequent rows."""
    start_index = None
    for idx, row in csv_data.iterrows():
        if any(req_part in str(row.get("part", "")) for req_part in required_parts):
            start_index = idx
            break
    return csv_data.iloc[start_index:] if start_index is not None else pd.DataFrame(columns=csv_data.columns)
import re

def process_and_tag(docx_path: str, csv_path: str, output_path: str):
    """Process a .docx document and its corresponding CSV to check citations and tag with predictions."""
    try:
        # Load the document and CSV
        doc = docx.Document(docx_path)
        csv_data = pd.read_csv(csv_path)
        csv_data = filter_csv_relevant_parts(csv_data)

        results = []

        # Iterate through paragraphs
        for i, paragraph in enumerate(doc.paragraphs):
            para_text = paragraph.text.strip()
            if not para_text:
                continue  # Skip empty paragraphs

            found_citations = extract_citations(para_text)

            if not found_citations:
                continue  # No citations found, move to the next paragraph

            for found_citation, full_citation in found_citations:

                is_relevant = False
                matching_part = None

                # Check if the citation is in relevant parts
                for _, row in csv_data.iterrows():
                    part_text = row.get("text", "")
                    if any(req_part in row.get("part", "") for req_part in required_parts) and part_text in para_text:
                        is_relevant = True
                        matching_part = row["part"]
                        break  # Stop searching once a match is found

                if is_relevant:
                    # Tag the paragraph using the model
                    encoding = tokenizer(para_text, truncation=True, padding=True, max_length=128, return_tensors="pt")
                    encoding = {key: val.to(device) for key, val in encoding.items()}
                    with torch.no_grad():
                        output = model(**encoding)
                        prediction = torch.argmax(output.logits, dim=-1).item()

                    # Append only when is_relevant = True
                    results.append({
                        'paragraph_number': i,
                        'paragraph_text': para_text,
                        'citation': full_citation,
                        'part': matching_part,
                        'predicted_label': prediction, 
                    })

                    print(f"Tagged citation: Paragraph {i}, Part: {matching_part}, Prediction: {prediction}")
                    print(f"Text: {para_text}\n")

        # Convert results to a DataFrame
        results_df = pd.DataFrame(results)


        # Save results
        results_df.to_csv(output_path, index=False, encoding='utf-8-sig')
        print(f"Tagged citations saved to: {output_path}")

    except Exception as e:
        print(f"Error processing {docx_path}: {e}")

if __name__ == "__main__":
    for year in [2018,2019,2020]:
        docx_directory = Path(f'/home/liorkob/thesis/lcp/data/docx_{year}')
        csv_directory = Path(f'/home/liorkob/thesis/lcp/data/docx_csv_{year}')
        output_directory = Path(f'/home/liorkob/thesis/lcp/data/tag_citations_csv_{year}')

        output_directory.mkdir(parents=True, exist_ok=True)

        for file_path in docx_directory.glob("*.docx"):
            try:
                new_file_path = file_path.stem
                print(f"Processing {new_file_path}")

                csv_file = csv_directory / f"{new_file_path}.csv"
                if file_path.exists() and csv_file.exists():
                    output_file = output_directory / f"{file_path.stem}.csv"
                    process_and_tag(str(file_path), str(csv_file), str(output_file))

                else:
                    if not file_path.exists():
                        print(f"Document file not found: {file_path}")
                    if not csv_file.exists():
                        print(f"CSV file not found for: {csv_file}")

            except Exception as e:
                print(f"Error processing {file_path.name}: {e}")




### Merge all results to one csv

In [None]:
import pandas as pd
from pathlib import Path
import docx

def merge_results(csv_directory: str, output_csv: str):
    csv_directory = Path(csv_directory)
    all_data = []
    
    # Iterate over CSV files
    for file_path in csv_directory.glob("*.csv"):
        try:
            if file_path.stat().st_size == 0:  # Check if file is empty
                print(f"Skipping empty file: {file_path.name}")
                continue
            
            df = pd.read_csv(file_path)
            if df.empty:  # Check if the file is empty even after reading
                print(f"Skipping empty DataFrame: {file_path.name}")
                continue

            df["source_file"] = file_path.name  # Add filename column
            all_data.append(df)
        except Exception as e:
            print(f"Error reading {file_path.name}: {e}")
    
    if all_data:
        merged_df = pd.concat(all_data, ignore_index=True)
        merged_df.to_csv(output_csv, index=False, encoding='utf-8-sig')
        print(f"Merged CSV saved to: {output_csv}")
    else:
        print("No valid CSV files found.")


if __name__ == "__main__":
    for year in [2018,2019,2020]:
        csv_directory = f"/home/liorkob/thesis/lcp/data/tag_citations_csv_{year}"
        output_csv = f"{csv_directory}/merged_results_{year}.csv"
        
        merge_results(csv_directory, output_csv)


### extract citation WITH API -v1

In [None]:
import os
import gc
import torch
import pandas as pd
import docx
import re
from transformers import AutoTokenizer, BertTokenizer, BertForSequenceClassification
from pathlib import Path
from openai import OpenAI
import os

os.environ["OPENAI_API_KEY"] = "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"  # Replace with actual key

client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))
models = client.models.list()
print([m.id for m in models])
model_info = client.models.retrieve("gpt-4o")
print(model_info)

os.environ["TOKENIZERS_PARALLELISM"] = "false"

# Define required sections and citation patterns
required_parts = [
    "מתחמי ענישה", "אחידות בענישה", "מתחם הענישה", "מתחם ענישה", "דיון",
    "ענישה נהוגה", "הענישה הנוהגת", "ענישה נוהגת", "מתחם העונש", "מתחם עונש",
    "מדיניות הענישה", "והכרעה", "ההרשעה", "מדיניות הענישה הנהוגה"
]
citation_patterns = ['ע"פ', 'ת"פ', 'עפ"ג', 'ע״פ', 'ת״פ', 'עפ״ג']

# Check for CUDA availability
device = "cuda" if torch.cuda.is_available() else "cpu"

# Load the trained BERT model and tokenizer
model_path = "/home/liorkob/best_model.pt"  # Path to your saved model
tokenizer_bert = BertTokenizer.from_pretrained('avichr/heBERT')
model_bert = BertForSequenceClassification.from_pretrained('avichr/heBERT', num_labels=2)
model_bert.load_state_dict(torch.load(model_path, map_location=device))
model_bert.to(device)
model_bert.eval()


def split_preserving_structure(text):
    paragraphs = re.split(r'(?<=\d\.)\s', text)  # Split after numbers followed by a period
    return [para.strip() for para in paragraphs if para.strip()]

def query_gpt(text):
    """
    Queries GPT-4o to extract and segment legal citations.
    """
    prompt = (
        "הטקסט הבא מכיל מספר ציטוטים משפטיים, שהם הפניות להחלטות של בתי משפט והם נכתבים בפורמט הבא: "
        "סוג ההליך (ע\"פ, עפ\"ג, ת\"פ וכו'), מספר התיק, שמות הצדדים, ותאריך ההחלטה בסוגריים. "
        "לדוגמה: ע\"פ 4173/07 פלוני נ' מדינת ישראל (2007).\n\n"

        " **הנחיות קריטיות:**\n"
        " **אין לערוך, לשנות או להשמיט שום חלק מהטקסט המקורי** – כל התוכן חייב להופיע כפי שהוא.\n"
        " **יש לפצל לפסקאות לפי הציטוטים המשפטיים**, כך שכל פסקה תכיל ציטוט עם ההקשר המתאים.\n"
        " **אם מספר ציטוטים מתייחסים לאותו מקרה יש להשאירם יחד באותה פסקה**.\n"
        " **הפסקאות חייבות להופיע בסדר המקורי שלהן** – אין לערבב או להזיז חלקים בטקסט.\n"
        " **אין ליצור פסקאות שאין בהן ציטוט משפטי**.\n\n"

        "### 🔍 דוגמאות לפיצול נכון ושגוי:\n\n"

        "❌ **פיצול שגוי (לא נכון):**\n"
        "1. ע\"פ 1234/20 מדינת ישראל נ' כהן (2020)\n"
        "2. טקסט כללי בלי ציטוט – אין לאפשר זאת.\n\n"

        "✅ **פיצול נכון (כן נכון):**\n"
        "1. ע\"פ 5678/15 לוי נ' מדינת ישראל (2015) - במקרה זה נקבע כי...\n"
        "2. ע\"פ 9876/18 כהן נ' מדינת ישראל (2018) - בנסיבות דומות, הוחלט כי...\n\n"

        "✅ **כאשר כל הציטוטים שייכים לאותו הקשר - יש להשאירם יחד:**\n"
        "1. \"על דרך הכלל, בית משפט זה נדרש לצערי לא אחת לאירועים מעין אלה של פתרון סכסוכים בדרכי אלימות, "
        "ולא תתכן מחלוקת כי יש להטיל עונשים משמעותיים, על פי רוב מאחורי סורג ובריח, כדי לעקור תופעות אלה מהשורש. "
        "אין מקום לסובלנות כלפי יד קלה על ההדק או קת סכין או במקל חובלים. ועל כך נאמר יש מקום שגם בית המשפט יתרום את חלקו "
        "למלחמה נגד האלימות. לעיתים יש תחושה שכל אמרה לא נכונה או התנהגות שבעיני אחר סוטה מן השורה, ולו במקצת, "
        "מהווה הצדקה עבור הפוגע וסביבתו לפגוע באמצעות נשק קר ביחיד ובסביבתו\" "
        "(עוד לעניין זה ראו ע\"פ 4173/07 פלוני נ' מדינת ישראל (2007); ע\"פ 8991/10 מכבי נ' מדינת ישראל (2011); "
        "ע\"פ 7360/13 טאהא נ' מדינת ישראל (2014).)\n\n"

        "⚠️ **חשוב מאוד:**\n"
        "✔ **כל הטקסט חייב להופיע כפי שהוא, ללא שינוי, עריכה או השמטה.**\n"
        "✔ **כל פסקה חייבת להכיל ציטוט משפטי ולשמור על ההקשר המקורי שלה.**\n"
        "✔ **אם יש ציטוטים הקשורים זה לזה, יש להשאירם יחד.**\n"
        "✔ **אין לשנות את סדר הפסקאות ואין ליצור טקסטים חדשים.**\n\n"

        f"Text: {text}\n"
        "Processed Segments:"
    )

    try:
        response = client.chat.completions.create(
            model="gpt-4o",  # Change from "gpt-4o-2024-11-20"
            messages=[
                {"role": "system", "content": "You are an AI trained to extract and structure legal citations."},
                {"role": "user", "content": prompt}
            ]
        )

        processed_text = response.choices[0].message.content

        # Debugging: Print raw GPT response
        print("RAW GPT OUTPUT:\n", processed_text)

        # Improved paragraph splitting while preserving structure
        split_paragraphs = split_preserving_structure(processed_text)

        # Remove duplicates
        split_paragraphs = list(dict.fromkeys(split_paragraphs))

        # Debugging: Print processed paragraphs
        print("PROCESSED PARAGRAPHS:\n", split_paragraphs)

        # Return processed text
        return split_paragraphs if split_paragraphs else [text]

    except Exception as e:
        print(f"🚨 GPT API error: {e}")
        return [text]  # Return original text in case of failure
def filter_csv_relevant_parts(csv_data):
    """
    Extracts the first occurrence of a required part in the CSV and all subsequent rows.
    """
    start_index = None

    # Find the first row containing a required part
    for idx, row in csv_data.iterrows():
        if any(req_part in str(row.get("part", "")) for req_part in required_parts):
            start_index = idx
            break

    # If a match is found, return only relevant rows
    if start_index is not None:
        return csv_data.iloc[start_index:]
    else:
        return pd.DataFrame(columns=csv_data.columns)  # Return an empty DataFrame if no matches found

def enforce_citation_splitting(split_paragraphs):
    """
    Ensures each citation is properly separated, even if GPT fails.
    """
    refined = []
    citation_pattern = re.compile(r'(ע"?פ|עפ"ג|ת"?פ) \d+[-/]?\d{2,5} .*?\[\d{1,2}\.\d{2,4}\]')

    for para in split_paragraphs:
        matches = citation_pattern.findall(para)

        if len(matches) > 1:
            segments = citation_pattern.split(para)
            for i in range(1, len(segments), 2):  
                citation = segments[i].strip()
                context = segments[i + 1].strip() if i + 1 < len(segments) else ""
                refined.append(f"{citation} {context}")
        else:
            refined.append(para.strip())

    return refined

def process_and_tag_with_split(docx_path: str, csv_path: str, output_path: str):
    """
    Process a .docx document and its corresponding CSV, split paragraphs only if they contain 
    multiple citations, ensure they are within relevant parts, and tag with predictions.
    """
    doc = docx.Document(docx_path)
    csv_data = pd.read_csv(csv_path)
    filtered_csv_data = filter_csv_relevant_parts(csv_data)

    results = []
    for i, paragraph in enumerate(doc.paragraphs):
        para_text = paragraph.text.strip()
        if not para_text:
            continue  # Skip empty paragraphs

        # Count the number of citations in the paragraph
        citation_count = sum(para_text.count(pattern) for pattern in citation_patterns)

        is_relevant = False
        matching_part = None

        for _, row in filtered_csv_data.iterrows():
            part_text = row.get("text", "")
            if any(req_part in row.get("part", "") for req_part in required_parts) and part_text in para_text:
                is_relevant = True
                matching_part = row["part"]
                break  # Stop searching once a match is found

        if is_relevant:
            # Tag the paragraph using the model
            encoding = tokenizer_bert(para_text, truncation=True, padding=True, max_length=128, return_tensors="pt")
            encoding = {key: val.to(device) for key, val in encoding.items()}
            with torch.no_grad():
                output = model_bert(**encoding)
                prediction = torch.argmax(output.logits, dim=-1).item()

            # SPLIT ONLY IF TAG IS 1
            if prediction == 1:
                if citation_count > 1:
                    split_paragraphs = query_gpt(para_text)
                    split_paragraphs = enforce_citation_splitting(split_paragraphs)
                    original_paragraph = para_text  # Store the original text
                else:
                    split_paragraphs = [para_text]
                    original_paragraph = None  # Not split, so no original needed
            else:
                split_paragraphs = [para_text]  # Keep as is
                original_paragraph = None  # No need to store original

            for split_text in split_paragraphs:
                # Check if the split paragraph contains a citation
                if not any(pattern in split_text for pattern in citation_patterns):
                    continue  # Skip non-citation paragraphs

                # Save results
                result = {
                    'paragraph_number': i,
                    'original_paragraph': original_paragraph if citation_count > 1 else split_text,  # Store original if split
                    'paragraph_text': split_text,
                    'part': matching_part,
                    'predicted_label': prediction
                }
                results.append(result)


    results_df = pd.DataFrame(results)
    results_df.to_csv(output_path, index=False, encoding='utf-8-sig')
    print(f"Tagged citations saved to: {output_path}")

if __name__ == "__main__":
    docx_directory = Path('/home/liorkob/thesis/lcp/data/docx_2019')
    csv_directory = Path('/home/liorkob/thesis/lcp/data/docx_csv_2019')
    output_directory = Path('/home/liorkob/thesis/lcp/data/tag_citations_csv_2019')

    output_directory.mkdir(parents=True, exist_ok=True)

    for file_path in docx_directory.glob("*.docx"):
        new_file_path = file_path.stem
        print(f"Processing {new_file_path}")

        csv_file = csv_directory / f"{new_file_path}.csv"
        
        if file_path.exists() and csv_file.exists():
            output_file = output_directory / f"{file_path.stem}.csv"
            process_and_tag_with_split(str(file_path), str(csv_file), str(output_file))
        else:
            if not file_path.exists():
                print(f"Document file not found: {file_path}")
            if not csv_file.exists():
                print(f"CSV file not found for: {csv_file}")


### extract citation WITH API -v2

In [1]:
import re
import pandas as pd

# List of legal acronyms (same as yours)
acronyms = [
    "אב", "אבע", "אימוצ", "אמצ", "אפ", "אפח", "את", "אתפ", "באפ", "באש", "בבנ", "בגצ", "בדא", "בדמ",
    "בדמש", "בהנ", "בהע", "בהש", "בידמ", "בידע", "בל", "בלמ", "במ", "בעא", "בעח", "בעמ", "בעק", "בפ",
    "בפמ", "בפת", "בצא", "בצהמ", "בק", "בקמ", "בקשה", "ברמ", "ברע", "ברעפ", "ברש", "בש", "בשא",
    "בשגצ", "בשהת", "בשז", "בשמ", "בשע", "בשפ", "בתת", "גזז", "גמר", "גפ", "דבע", "דח", "דט", "דיונ",
    "דמ", "דמר", "דמש", "דנ", "דנא", "דנגצ", "דנמ", "דנפ", "הד", "הדפ", "הוצלפ", "הט", "הכ", "המ",
    "המד", "הממ", "המע", "המש", "הנ", "הסת", "הע", "העז", "הפ", "הפב", "הפמ", "הצמ", "הש", "השא",
    "השגצ", "השפ", "השר", "הת", "וחק", "וע", "ושמ", "ושק", "ושר", "זי", "חא", "חבר", "חד", "חדא",
    "חדלפ", "חדלת", "חדמ", "חדפ", "חהע", "חי", "חנ", "חסמ", "חעמ", "חעק", "חש", "יוש", "ייתא", "ימא",
    "יס", "כצ", "מ", "מא", "מבכ", "מבס", "מונופולינ", "מזג", "מח", "מחוז", "מחע", "מט", "מטכל", "מי",
    "מיב", "מכ", "ממ", "מס", "מסט", "מעי", "מעת", "מקמ", "מרכז", "מת", "נ", "נב", "נבא", "נמ", "נמב",
    "נעד", "נער", "סבא", "סע", "סעש", "סק", "סקכ", "ע", "עא", "עאח", "עאפ", "עב", "עבאפ", "עבז", "עבח",
    "עבי", "עבל", "עבמצ", "עבעח", "עבפ", "עבר", "עבשהת", "עגר", "עדי", "עדמ", "עהג", "עהס", "עהפ",
    "עו", "עורפ", "עז", "עח", "עחא", "עחדלפ", "עחדפ", "עחדת", "עחהס", "עחע", "עחק", "עחר", "עכב",
    "על", "עלא", "עלבש", "עלח", "עלע", "עמ", "עמא", "עמה", "עמז", "עמח", "עמי", "עמלע", "עממ", "עמנ",
    "עמפ", "עמצ", "עמק", "עמרמ", "עמש", "עמשמ", "עמת", "ענ", "ענא", "ענמ", "ענמא", "ענמש", "ענפ",
    "עסא", "עסק", "עע", "עעא", "עעמ", "עער", "עעתא", "עפ", "עפא", "עפג", "עפהג", "עפמ", "עפמק",
    "עפנ", "עפס", "עפספ", "עפע", "עפר", "עפת", "עצמ", "עק", "עקג", "עקמ", "עקנ", "עקפ", "ער", "ערא",
    "ערגצ", "ערמ", "ערעור", "ערפ", "ערר", "עש", "עשא", "עשמ", "עשר", "עשת", "עשתש", "עת", "עתא",
    "עתמ", "עתפב", "עתצ", "פא", "פה", "פל", "פלא", "פמ", "פמר", "פעמ", "פקח", "פר", "פרק", "פשז",
    "פשר", "פת", "צא", "צבנ", "צה", "צו", "צח", "צמ", "קג", "קפ", "רחדפ", "רמש", "רע", "רעא", "רעב",
    "רעבס", "רעו", "רעמ", "רעס", "רעפ", "רעפא", "רעצ", "רער", "רערצ", "רעש", "רעתא", "רצפ", "רתק",
    "ש", "שבד", "שמ", "שמי", "שנא", "שע", "שעמ", "שק", "שש", "תא", "תאדמ", "תאח", "תאמ", "תאק", "תב",
    "תבכ", "תבע", "תג", "תגא", "תד", "תדא", "תהג", "תהנ", "תהס", "תוב", "תוח", "תח", "תחפ", "תחת",
    "תט", "תי", "תכ", "תלא", "תלב", "תלהמ", "תלפ", "תלתמ", "תמ", "תמהח", "תממ", "תמק", "תמר",
    "תמש", "תנג", "תנז", "תע", "תעא", "תעז", "תפ", "תפב", "תפח", "תפחע", "תפכ", "תפמ", "תפע",
    "תפק", "תצ", "תק", "תקח", "תקמ", "תרמ", "תת", "תתח", "תתע", "תתעא", "תתק"
]

def create_acronym_variants(acronyms):
    acronym_variants = []
    for a in acronyms:
        if len(a) > 1:
            # Case 1: Original acronym with quotes/dots before last letter
            base_acronym = a
            if a.startswith('ב') or a.startswith('ו') or a.startswith('ה'):
                # Also add variant without the prefix letter
                base_acronym = a[1:]
            
            # For each acronym (both with and without prefix)
            for acr in [a, base_acronym]:
                if len(acr) > 1:
                    # Standard quote/dot before last letter
                    quoted = rf"{acr[:-1]}[\"'״]{acr[-1]}"
                    with_dot = rf"{acr[:-1]}\.{acr[-1]}"
                    acronym_variants.append(f"(?:{quoted}|{with_dot})")
                    
                    # Add dot-separated variant
                    dots_between = '\.'.join(list(acr))
                    acronym_variants.append(dots_between)
    
    return '|'.join(acronym_variants)
        
acronym_pattern = create_acronym_variants(acronyms)

# Ensure the numbers follow the correct format
number_pattern = r'''
    (?:
        \d{1,6}[-/]\d{2}[-/]\d{2}  # Format: 31067-11-11
        | \d{1,6}[-/]\d{1,6}         # Format: 895/09
        | \d{1,6}-\d{2}-\d{2}        # Format: 31067-11-11 (hyphenated)
    )
'''
citation_pattern = fr'''
    (?<!\w)                      # Ensure no letter before
    ([א-ת]?)                     # Optional single Hebrew prefix letter (but no isolated matches)
    ({acronym_pattern})           # Captures acronym (short & long)
    \.?                          # Optional dot after acronym
    \s*                          # Optional spaces
    (\((.*?)\))?                  # Optional court location in parentheses
    \s*[-/]?\s*                  # Required space or separator before case number
    ({number_pattern})            # Captures case number formats
    (?!\w)                       # Ensure no letter after
'''.strip()

# Compile regex with verbose flag for readability
citation_regex = re.compile(citation_pattern, re.VERBOSE)


def extract_citations_from_csv(csv_data):
    citations = []
    text_column = csv_data["text"].astype(str)  # Convert to string to avoid NaN issues
    pd.set_option("display.max_colwidth", None)  # Ensure full text is displayed
    # print("\n".join(text_column))  # Print each row as a full text
    # for i, text in enumerate(text_column, 1):
    #     print(f"{i}. {text}")

    matches = text_column.str.extractall(citation_regex)  # Extract structured matches
    # print("Extracted Matches:")
    # print(matches)

    # print("Extracted DataFrame:", matches)  # Debugging step
    
    for _, row in matches.iterrows():
        # Build the citation string, joining all valid elements
        citation = " ".join(map(str, filter(pd.notna, row))).strip()

        # Clean up extra spaces
        citation = re.sub(r"\s{2,}", " ", citation)

        # Optionally remove unwanted prefixes like "ב", "ו", "ר"
        citation = re.sub(r"^\b[בוור]\b\s*", "", citation)

        # Remove invalid extra words (e.g., "על 12")
        if re.match(r"^על \d+$", citation):  
            continue  # Skip invalid cases like "על 12"

        # Fix duplicated court locations, e.g., "(מחוזי מרכז) מחוזי מרכז" → "(מחוזי מרכז)"
        citation = re.sub(r"\((.*?)\)\s+\1", r"(\1)", citation)

        # Add the cleaned citation to the list
        citations.append(citation)
    
    # Return citations as a list, even if some are empty or missing optional groups
    return citations if citations else []




In [None]:
import os
import gc
import torch
import pandas as pd
import docx
import re
from transformers import AutoTokenizer, BertTokenizer, BertForSequenceClassification
from pathlib import Path
from openai import OpenAI
import os
device = "cuda" if torch.cuda.is_available() else "cpu"
os.environ["OPENAI_API_KEY"] = "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"  # Replace with actual key
client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

os.environ["TOKENIZERS_PARALLELISM"] = "false"
os.environ["PYTORCH_CUDA_ALLOC_CONF"] = "expandable_segments:True"

# Define required sections and citation patterns
required_parts = [
    "מתחמי ענישה", "אחידות בענישה", "מתחם הענישה", "מתחם ענישה", "דיון",
    "ענישה נהוגה", "הענישה הנוהגת", "ענישה נוהגת", "מתחם העונש", "מתחם עונש",
    "מדיניות הענישה", "והכרעה", "ההרשעה", "מדיניות הענישה הנהוגה"
]


# Load the trained BERT model and tokenizer
model_path = "/home/liorkob/classifier_relvant_citation_model.pt" 
tokenizer_bert = BertTokenizer.from_pretrained('avichr/heBERT')
model_bert = BertForSequenceClassification.from_pretrained('avichr/heBERT', num_labels=2)
model_bert.load_state_dict(torch.load(model_path, map_location=device))
model_bert.to(device)
model_bert.eval()


def split_preserving_structure(text):
    paragraphs = re.split(r'(?<=\d\.)\s', text)  # Split after numbers followed by a period
    return [para.strip() for para in paragraphs if para.strip()]

def query_gpt(text,citation):
    """
    Queries gpt-4.1-mini to extract and segment legal citations.
    """
    prompt = f"""
    Given the following legal text:

    {text}

    Your task is to extract **only** the part of the text that directly relates to the citation "{citation}".
    
    **Extraction Rules:**
    - **Do not modify any wording.** Keep the original phrasing exactly as it appears in the provided document.
    - **Do not summarize or rephrase.**
    - **Return only the relevant portion**, not the full text.
    - **Handle grouped citations carefully:**
        - If the citation appears in a list following "ראו למשל ..." or similar, include the preceding explanation that applies to all citations.
        - Do not include other citations from the list—return only the text relevant to "{citation}".
    - **Handle case explanations properly:**
        - If the citation is explained in a specific section (e.g., "בע"פ 9373/10 ותד נ' מדינת ישראל..."), extract the **entire explanation** of the case.
        - Do not remove any important context about the court ruling.
    - Do **not** extract only "(רע"פ 2718/04)" without the legal principle it supports.


    Only return the extracted text. Do not include unrelated content or formatting.
    """
    print(f"🧠 Sending to GPT for extraction...")

    try:
        response = client.chat.completions.create(
            model="gpt-4.1-mini", 
            messages=[
                {"role": "system", "content": "You are an AI trained to extract and structure legal citations."},
                {"role": "user", "content": prompt}
            ]
        )

        processed_text = response.choices[0].message.content


        # Debug: Print the extracted response from GPT
        # print("\n===== DEBUG: GPT RESPONSE =====")
        # print(f"Citation: {citation}")
        # print("Prompt Sent to GPT:")
        # print(prompt)
        # print("Extracted Text:")
        # print(processed_text)
        # print("==============================\n")

        return processed_text

    except Exception as e:
        print(f"🚨 GPT API error: {e}")
        return [text]  # Return original text in case of failure
    
def filter_csv_relevant_parts(csv_data):
    """
    Extracts the first occurrence of a required part in the CSV and all subsequent rows.
    """
    start_index = None

    # Find the first row containing a required part
    for idx, row in csv_data.iterrows():
        if any(req_part in str(row.get("part", "")) for req_part in required_parts):
            start_index = idx
            break

    # If a match is found, return only relevant rows
    if start_index is not None:
        return csv_data.iloc[start_index:]
    else:
        print("NO required parts in data")
        print("parts in data:")
        print(csv_data["part"].unique())
        return pd.DataFrame(columns=csv_data.columns)  # Return an empty DataFrame if no matches found



# Function to find all occurrences of a citation in the document
def find_all_occurrences(doc, citation):
    indices = []
    for i, paragraph in enumerate(doc.paragraphs):
        if citation in paragraph.text:
            indices.append(i)  # Store all occurrences of the citation
    return indices

# Function to get relevant context for each occurrence of the citation
def get_context_paragraphs(doc, index, citation):
    context_text = []

    # Search for the closest non-empty previous paragraph
    prev_index = index - 1
    while prev_index >= 0 and not doc.paragraphs[prev_index].text.strip():
        prev_index -= 1  # Move backwards until finding text

    if prev_index >= 0:
        context_text.append(doc.paragraphs[prev_index].text.strip())

    # Get the current paragraph (must exist, but check if empty)
    curr_text = doc.paragraphs[index].text.strip()
    if curr_text:
        context_text.append(curr_text)
    else:
        print(f"⚠️ Warning: Empty paragraph for citation {citation} at index {index}. Skipping occurrence.")
        return None  # Skip this occurrence if the current paragraph is empty

    # Search for the closest non-empty next paragraph
    next_index = index + 1
    while next_index < len(doc.paragraphs) and not doc.paragraphs[next_index].text.strip():
        next_index += 1  # Move forward until finding text

    if next_index < len(doc.paragraphs):
        context_text.append(doc.paragraphs[next_index].text.strip())

    # Ensure we have at least one non-empty paragraph
    if not context_text:
        print(f"⚠️ Warning: No valid text found for citation {citation} at index {index}. Skipping occurrence.")
        return None

    return "\n".join(context_text).strip()


# Function to process and tag document paragraphs
def process_and_tag_with_split(docx_path: str, csv_path: str, output_path: str):
    """
    Process a .docx document and its corresponding CSV, find relevant paragraphs with context, 
    extract relevant text using GPT, tag with BERT, and store results.
    """
    doc = docx.Document(docx_path)
    csv_data = pd.read_csv(csv_path)
    filtered_csv_data = filter_csv_relevant_parts(csv_data)
    if filtered_csv_data.empty:
        print("⚠️ Skipping file — no relevant parts found.")
        return

    citations = extract_citations_from_csv(filtered_csv_data)
    results = []
    if len(citations) > 30:
        return
    print(f"🔍 Found {len(citations)} citations in CSV")

    for citation in citations:
        citation_indices = find_all_occurrences(doc, citation)  # Find all occurrences

        # Collect all contexts where the citation appears
        merged_contexts = []
        for index in citation_indices:
            full_context = get_context_paragraphs(doc, index, citation)
            if full_context:
                merged_contexts.append(full_context)

        # If no valid contexts found, skip this citation
        if not merged_contexts:
            continue  

        # Merge all valid contexts into one, ensuring uniqueness
        final_context = "\n".join(set(merged_contexts)).strip()  # Remove duplicates
        # print(citation)
        # print(final_context)

        # Ask GPT to extract the relevant part
        extracted_text = query_gpt(final_context, citation)

        # Tag the extracted text with BERT
        encoding = tokenizer_bert(extracted_text, truncation=True, padding=True, max_length=128, return_tensors="pt")
        encoding = {key: val.to(device) for key, val in encoding.items()}
        with torch.no_grad():
            output = model_bert(**encoding)
            prediction = torch.argmax(output.logits, dim=-1).item()

        # Store only one result per citation
        result = {
            'citation': citation,
            'context_text': final_context,
            'extracted_text': extracted_text,
            'predicted_label': prediction
        }
        results.append(result)

    # Save to CSV
    results_df = pd.DataFrame(results)
    results_df.to_csv(output_path, index=False, encoding="utf-8")
    print(f"Processed document saved to: {output_path}")

if __name__ == "__main__":
    docx_directory = Path('/home/liorkob/M.Sc/thesis/data/5k/docx/verdict')
    csv_directory = Path('/home/liorkob/M.Sc/thesis/data/5k/verdict_csv')
    output_directory = Path('/home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations')

    output_directory.mkdir(parents=True, exist_ok=True)

    from tqdm import tqdm

    for file_path in tqdm(docx_directory.glob("*.docx"), desc="Processing DOCX files"):
        
        new_file_path = file_path.stem
        print(f"Processing {new_file_path}")

        csv_file = csv_directory / f"{new_file_path}.csv"
        
        if file_path.exists() and csv_file.exists():
            output_file = output_directory / f"{file_path.stem}.csv"
            if output_file.exists():
                continue
            process_and_tag_with_split(str(file_path), str(csv_file), str(output_file))
        else:
            if not file_path.exists():
                print(f"Document file not found: {file_path}")
            if not csv_file.exists():
                print(f"CSV file not found for: {csv_file}")


2025-04-23 12:36:42.184597: E external/local_xla/xla/stream_executor/cuda/cuda_fft.cc:467] Unable to register cuFFT factory: Attempting to register factory for plugin cuFFT when one has already been registered
E0000 00:00:1745401004.000582 3447088 cuda_dnn.cc:8579] Unable to register cuDNN factory: Attempting to register factory for plugin cuDNN when one has already been registered
E0000 00:00:1745401004.441984 3447088 cuda_blas.cc:1407] Unable to register cuBLAS factory: Attempting to register factory for plugin cuBLAS when one has already been registered
W0000 00:00:1745401009.228905 3447088 computation_placer.cc:177] computation placer already registered. Please check linkage and avoid linking the same target more than once.
W0000 00:00:1745401009.228940 3447088 computation_placer.cc:177] computation placer already registered. Please check linkage and avoid linking the same target more than once.
W0000 00:00:1745401009.228943 3447088 computation_placer.cc:177] computation placer alr

Processing ת"פ 114-08
Processing ת"פ 119-08
Processing ת"פ 138-08
Processing ת"פ 157-08
Processing ת"פ (חי') 269∕82
Processing ת"פ (י-ם) 188∕84
Processing ת"פ 312∕94
Processing ת"פ 339∕93
Processing ת"פ 233∕95
Processing ת"פ 23∕96
Processing תפ"ח 499∕95
Processing ת"פ 008035∕97
Processing ת"פ 040353∕99
Processing ת"פ 215∕99
Processing ת"פ (י-ם) 203∕84


Processing DOCX files: 21it [00:01, 17.40it/s]

Processing ת"פ 1060∕00
NO required parts in data
parts in data:
['בתי המשפט' 'בפני:נ' ' המאשימה' 'הנאשם' 'חקיקה שאוזכרה: ' 'גזר-דין'
 '5129371צבי סגל, שופט']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 1152∕00
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'גזר דין' 'הנשק יחולט. ']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ (ירושלים) 1211∕00
NO required parts in data
parts in data:
['גזר- דין' '5129371']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 000180∕03
Processing ת"פ 000249∕03
NO required parts in data
parts in data:
['גזר דין' 'זכות ערעור לבית המשפט העליון בתוך 45 יום מהיום.ו'
 'יפה הכט, שופטת' 'החלטה']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 1045∕01
NO required parts in data
parts in data:
['ג ז ר – ד י ן' 'זכות ערעור לבית המשפט העליון תוך 45 יום.'
 '5129371מרים מזרחי, שופטת']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 001055∕01
NO required parts in data
parts in data:
['ע"י ב"כ עו"ד' '

Processing DOCX files: 34it [00:01, 29.27it/s]

NO required parts in data
parts in data:
['מדינת ישראל' 'אחמד בדרין' 'גזר דין' '5129371\xa0' 'צבי זילברטל, שופט']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 1257∕01
NO required parts in data
parts in data:
['בתי המשפט ' 'לפני:נ' '  נ  ג  ד\xa0' 'הנאשם' 'גזר דין' '5129371\xa0']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 1064∕02
NO required parts in data
parts in data:
['המאשימה:ב' '\tהשופט נתן עמית, אב"ד:ב' '5129371תחיה שפירא, שופטת'
 'קלדנית:ו ד.ל.ס.']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 30891-03-13
NO required parts in data
parts in data:
["לפני כב' השופט י' נועם" 'מדינת ישראל' 'הנאשמים' 'חקיקה שאוזכרה: '
 'גזר-דין בעניינו של נאשם 1'
 'זכות ערעור לבית-המשפט העליון בתוך 45 יום מהיום.' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 33546-03-13
Processing ת"פ 39535-03-13
Processing ת"פ 45208-03-13
NO required parts in data
parts in data:
['08 ספטמבר 2013' 'גזר דין' '<#3#>' '54678313']
⚠️ Skipping file — no re

Processing DOCX files: 52it [00:01, 48.21it/s]

NO required parts in data
parts in data:
['המאשימה ' 'הנאשם ' 'חקיקה שאוזכרה: '
 'חוק זכויות נפגעי עבירה, תשס"א-2001: סע\'  18' '.' 'גזר דין'
 'טיעוני המאשימה לעניין העונש' 'טיעוני הסניגור' 'תסקיר שירות המבחן'
 'הנזקים שנגרמו למתלונן' 'פסיקה' 'הכרעה' 'דניאל פיש , שופט ']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 29375-04-13
Processing תפ"ח 31041-04-13
Processing ת"פ 35007-04-13
Processing תפ"ח 47805-04-13
NO required parts in data
parts in data:
['מדינת ישראל' 'מוחמד שאער' 'אחמד בן חגאזי בזלמית' 'חקיקה שאוזכרה: '
 'גזר דין' 'זכות ערעור לבית המשפט העליון בתוך 45 יום. ' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 27782-05-13
Processing ת"פ 31862-05
Processing ת"פ 31862-05-13
Processing ת"פ 37701-05-13
Processing ת"פ 44826-05-13
Processing ת"פ 1970-06-13
Processing ת"פ 9162-06-13
Processing ת"פ 15237-06-13
Processing ת"פ 15376-06-13
Processing ת"פ 18799-06-13
NO required parts in data
parts in data:
['הנאשם' 'גזר דין (נאשם 2ׂׂ)' '<#3#>' '5467831

Processing DOCX files: 65it [00:02, 37.73it/s]

Processing ת"פ 33509-06-13
NO required parts in data
parts in data:
['גזר דין' '<#4#>' 'ורדה מרוז 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 44812-06-13
Processing ת"פ 44877-06-13
Processing ת"פ 11775-07-13
NO required parts in data
parts in data:
['מדינת ישראל' 'הנאשמים' 'חקיקה שאוזכרה: ' 'גזר-דין – בעניינו של נאשם 2'
 '54678313 ' 'נוסח מסמך זה כפוף לשינויי ניסוח ועריכה']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 18402-08-13
Processing ת"פ 18508-08-13
NO required parts in data
parts in data:
[' 18531-08-13' 'הנאשמים' 'מטעם המאשימה - עו"ד אביטל שרוני'
 'חקיקה שאוזכרה: ' 'החלטה' '<#4#>' '<#5#>' '5129371'
 'יפעת שיטרית 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 23475-08-13
Processing תפ"ח 26481-08-13
Processing תפ"ח 30145-08-13
Processing תפ"ח 35298-08-13
NO required parts in data
parts in data:
['בית המשפט המחוזי בבאר שבע' 'חקיקה שאוזכרה: '
 "תקנות ההגנה (שעת-חירום), 1945: סע'  85(א)"
 'זכות ערעור תוך 45 יום לבית המש

Processing DOCX files: 86it [00:02, 53.23it/s]

Processing ת"פ 40272-09-13
Processing ת"פ 3622-10-13
Processing ת"פ 3670-10-13
Processing ת"פ 14308-10-13
Processing ת"פ 28139-10-13
Processing ת"פ 53169-10-13
NO required parts in data
parts in data:
['בית המשפט המחוזי בירושלים' 'המאשימה' 'חקיקה שאוזכרה: ' 'גזר דין'
 '5129371' 'אמנון כהן 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 54150-10-13
Processing ת"פ 57914-10-13
Processing ת"פ 60307-10-13
Processing ת"פ 62790-10-13
Processing תפ"ח 63535-10-13
Processing ת"פ 5388-11-13
Processing ת"פ 8725-11-13
Processing ת"פ 39183-11-13
Processing ת"פ 39234-11-13
Processing ת"פ 45971-11-13
Processing ת"פ 1390-12-13
NO required parts in data
parts in data:
['נוכחים:' 'גזר דין' '<#2#>' 'ב"כ הנאשם:' 'ב"כ המאשימה:' 'החלטה' '<#4#>'
 '54678313' 'אליהו ביתן 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 3531-12-13


Processing DOCX files: 94it [00:02, 55.55it/s]

Processing ת"פ 6192-12-13
Processing תפ"ח 2811-02-14
Processing ת"פ 3451-02-14
Processing ת"פ 8718-02-14
Processing ת"פ 8748-02-14
Processing ת"פ 23537-02-14
Processing ת"פ 26521-02-14
Processing ת"פ 51828-02-14
Processing ת"פ 55664-02-14
Processing ת"פ 56601-02-14
Processing ת"פ 6604-03-14
NO required parts in data
parts in data:
['המאשימה' 'הנאשם' "פקודת התעבורה [נוסח חדש]: סע'  67" 'גזר דין (נאשם 2)'
 'צבי גורפינקל , שופט בכיר ' 'צבי גורפינקל 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 17809-03-14
Processing ת"פ 17891-03-14
Processing ת"פ 20722-03-14
Processing ת"פ 23513-03-14


Processing DOCX files: 119it [00:03, 63.11it/s]

Processing ת"פ 26563-03-14
Processing ת"פ 30974-03-14
Processing ת"פ 45417-03-14
Processing ת"פ 48488-03-14
Processing ת"פ 8336-04-14
Processing ת"פ 12519-04-14
Processing ת"פ 17707-04-14
Processing ת"פ 40011-04-14
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' '.' 'כללי' 'האישומים' 'אישום ראשון' 'אישום שני '
 'אישום שלישי ' 'אישום רביעי ' 'אישום חמישי ' 'אישום שישי ' 'אישום שביעי '
 'אישום שמיני ' 'אישום בת.פ. 23752-04-14 – נאשם 4 בלבד' 'הנאשמים' 'נאשם 1'
 'נאשם 2' 'נאשם 3' 'נאשם 4' 'טיעוני הצדדים לעונש' 'שיקולי הענישה'
 'גזירת עונשם של הנאשמים' 'זכות ערעור לבית המשפט העליון בתוך 45 יום. '
 'אריה רומנוב, שופט']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 47667-04-14
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'תקנות התעבורה, תשכ"א-1961 - לא מרובדות: סע\'  303(ב)'
 '.' 'הכרעת דין' 'גזר דין' '\tעל הנאשם 1: ' 'על הנאשם 2: ' '<#6#>'
 'שאהר אטרש , שופט ' 'שאהר אטרש 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 1847-05-14
P

Processing DOCX files: 150it [00:03, 90.80it/s]

NO required parts in data
parts in data:
['נוכחים:' 'גזר דין (נאשמים 9, 10, 14 ו – 19)' '<#4#>' 'אברהם טל 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 13142-02-15
Processing ת"פ 24181-02-15
Processing ת"פ 28662-02-15
Processing ת"פ 42458-02-15
NO required parts in data
parts in data:
['גזר דין' 'לפיכך, הנני מטיל  בזה על הנאשם עונש כדלהלן:' '<#3#>'
 'יואל עדן , שופט ' 'יואל עדן 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 51145-02-15
Processing ת"פ 52000-02-15
Processing ת"פ 52009-02-15
Processing ת"פ 52101-02-15
Processing ת"פ 21009-03-15
Processing ת"פ 29243-03-15
Processing ת"פ 29911-03-15
Processing ת"פ 57965-03-15
Processing ת"פ 1756-04-15
Processing ת"פ 8290-04-15
Processing ת"פ 13785-04-15
Processing ת"פ 14476-04-15
Processing ת"פ 24163-04-15
Processing ת"פ 38135-04-15
Processing ת"פ 46577-04-15
Processing ת"פ 53797-04-15
NO required parts in data
parts in data:
['הנאשם:' 'גזר דין' 'לפיכך, הנני מטיל  בזה על הנאשם עונש כדלהלן:' '<#

Processing DOCX files: 161it [00:03, 71.53it/s]

Processing ת"פ 52626-07-15
Processing ת"פ 57474-07-15
Processing ת"פ 8192-08-15
Processing ת"פ 13153-08-15
NO required parts in data
parts in data:
['בית המשפט המחוזי בחיפה' 'מאשימה' 'חקיקה שאוזכרה: ' 'גזר דין'
 'טיעוני המאשימה לעניין העונש' 'טיעוני ב"כ הנאשם לעונש'
 'תסקיר שירות המבחן' 'זכות ערעור תוך 45 ימים. ' 'דניאל פיש 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 34916-08-15
NO required parts in data
parts in data:
['נוכחים:' 'חקיקה שאוזכרה: ' 'גזר דין' '<#5#>' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 39998-08-15
Processing ת"פ 40390-08-15
Processing ת"פ 41886-08-15
Processing ת"פ 44579-08-15
Processing ת"פ 53084-08-15
NO required parts in data
parts in data:
['בית המשפט המחוזי בחיפה' '  -' 'נגד' 'חקיקה שאוזכרה: ' 'גזר דין'
 '5129371']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 54962-08-15


Processing DOCX files: 170it [00:03, 59.06it/s]

Processing ת"פ 12325-09-15
Processing תפ"ח 21279-09-15
NO required parts in data
parts in data:
["בפני הרכב כב' השופטים:" '\nמדינת ישראל' 'סלים שוויש' 'חקיקה שאוזכרה: '
 'גזר דין' 'תמצית הכרעת הדין' 'ההליך' 'עיקרי הכרעת הדין'
 'הטיעונים לעונש והמחלוקת' 'הכרעה' '\tסעיף 45(ב) לחוק העונשין קובע:'
 '\tובהמשך:' 'עבירות ההצתה ושיבוש ההליכים' 'הפיצויים' '\t       [...]'
 'סוף דבר' 'זכות ערעור לבית המשפט העליון תוך 45 יום. '
 '54678313הרכב 54678313']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 24510-09-15
NO required parts in data
parts in data:
['מדינת ישראל' 'ראג\'י גורבאן, ת"ז xxxxxxxxxx' 'חקיקה שאוזכרה: ' 'גזר דין'
 'הטיעונים לעונש' 'הכרעה' '\tסעיף 45(ב) לחוק העונשין קובע:' '\tובהמשך:'
 'עבירות בנשק' 'עבירת שיבוש מהלכי משפט' 'הפעלת המאסר המותנה' 'הפיצויים '
 '\tסעיף 77 לחוק העונשין מורה:' '\t    [...]' 'סוף דבר' '5129371'
 'הרכב 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 24514-09-15
NO required parts in data
parts in data:
['בית המשפט המחוזי בתל א

Processing DOCX files: 215it [00:04, 101.88it/s]

Processing ת"פ 64689-11-15
Processing ת"פ 65677-11-15
Processing ת"פ 9785-12-15
Processing תפ"ח 18488-12-15
Processing ת"פ 23253-12-15
Processing ת"פ 35695-12-15
NO required parts in data
parts in data:
['ת"פ 35695-12-15 מדינת ישראל נ\' חג\'אזי' 'חקיקה שאוזכרה: ' 'מבוא:'
 'טיעוני המאשימה: ' 'טיעוני ב"כ הנאשם:' 'גזירת הדין:'
 '54678313זכות ערעור לבית המשפט העליון, תוך 45 ימים.'
 'אספרנצה אלון 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 39071-12-15
Processing ת"פ 39193-12-15
Processing ת"פ 39950-12-15
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'החלטה' 'הכרעת דין מתוקנת' 'גזר דין' '<#4#>'
 'ירון לוי , שופט ' 'ירון לוי 54678313']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 46412-12-15
Processing ת"פ 53715-12-15
Processing תפ"ח 53763-12-15
Processing ת"פ 57218-12-15
Processing ת"פ 189-01-16
Processing ת"פ 741-01-16
Processing ת"פ 3686-01-16
Processing ת"פ 3772-01-16
Processing ת"פ 31498-01-16
Processing ת"פ 47917-01-16
Processing ת"

Processing DOCX files: 253it [00:04, 127.01it/s]

NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'בית המשפט המחוזי בתל אביב - יפו' 'לפני ' 'מדינת ישראל'
 'משה נאמן' 'ג ז ר – ד י ן ' 'זכות ערעור תוך 45 יום לבית המשפט העליון'
 "ג'ורג' קרא , שופט, סגן נשיא "]
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 9968-05-16
Processing ת"פ 9983-05-16
Processing ת"פ 16543-05-16
Processing ת"פ 19384-05-16
Processing ת"פ 20367-05-16
Processing ת"פ 25902-05-16
Processing ת"פ 26087-05-16
Processing תפ"ח 26101-05-16
Processing ת"פ 33009-05-16
Processing ת"פ 37191-05-16
Processing ת"פ 39341-05-16
Processing ת"פ 39986-05-16
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'גזר דין' '<#4#>' 'ליאורה ברודי 54678313']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 41965-05-16
Processing ת"פ 808-06-16
Processing ת"פ 3244-06-16
NO required parts in data
parts in data:
['בית המשפט המחוזי בבאר שבע' 'חקיקה שאוזכרה: ' 'כללי'
 '54678313   \t\t\t\t\t     ']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 5

Processing DOCX files: 268it [00:04, 101.57it/s]

NO required parts in data
parts in data:
['בית המשפט המחוזי בירושלים' "מאזן ג'אבר (עציר)" 'חקיקה שאוזכרה: '
 'האישומים' 'טיעוני הצדדים' 'ראיות לעונש' '\tמתחם יחיד או ריבוי מתחמים'
 'שיקולים בקביעת המתחם' 'העונשים המתאימים לנאשמים במקרה זה ' 'נאשם 1:'
 'נאשם 2:' 'נאשם 3 :' 'נאשם 4: ' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 15943-12-16
Processing ת"פ 50986-12-16
Processing ת"פ 63147-12-16
NO required parts in data
parts in data:
['המאשימה' 'פלוני' 'חוק העונשין, תשל"ז-1977: סע\'  448'
 'גזר דין בעניינו של נאשם 1 ' 'תסקיר שירות מבחן לנוער' 'ף '
 'טיעוני הצדדים לעונש' 'הכרעת דין משלימה' 'גזר דין'
 'זכות ערעור לבית המשפט העליון בתוך 45 יום מהיום.' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 64990-12-16
Processing ת"פ 10627-01-17
NO required parts in data
parts in data:
['בית המשפט המחוזי בבאר שבע' 'חקיקה שאוזכרה: ' 'גזר דין' 'אישום ראשון'
 'אישום שני' 'אישום שלישי' '5129371' 'אליהו ביתן 54678313']
⚠️ Skipping file — no relevant parts 

Processing DOCX files: 300it [00:05, 58.12it/s] 

Processing ת"פ 57618-05-17
Processing ת"פ 57628-05-17
Processing ת"פ 64941-05-17
Processing ת"פ 17856-06-17
Processing ת"פ 20613-06-17
NO required parts in data
parts in data:
['בית המשפט המחוזי בבאר שבע' 'חקיקה שאוזכרה: ' 'גזר דין' '\tאישום ראשון'
 'אישום שני' '54678313' 'אליהו ביתן 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 31034-06-17
Processing ת"פ 35512-06-17
Processing ת"פ 41276-06-17
Processing ת"פ 51716-06-17
Processing ת"פ 52219-06-17
Processing ת"פ 55670-06-17
Processing ת"פ 520-07-17
Processing ת"פ 4807-07-17
NO required parts in data
parts in data:
['בית המשפט המחוזי בבאר שבע' 'חקיקה שאוזכרה: ' 'גזר דין'
 '54678313זכות ערעור תוך 45 יום.' 'אליהו ביתן 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 45713-07-17
Processing ת"פ 50809-07-17
Processing ת"פ 53772-07-17
NO required parts in data
parts in data:
['בית המשפט המחוזי בבאר שבע' 'גזר דין' 'כוונת אופטית.' 'שתי מקדחות. '
 '54678313' 'אליהו ביתן 54678313']
⚠️ Skipping file — no

Processing DOCX files: 312it [00:06, 45.92it/s]

Processing ת"פ 30972-09-17
Processing ת"פ 32803-12-17
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'גזר דין' 'אישום ראשון - ' 'אישום שני- ' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 32889-12-17
Processing ת"פ 13154-01-18
Processing ת"פ 16520-01-18
Processing תפ"ח 27442-01-18
NO required parts in data
parts in data:
['בית המשפט המחוזי בתל אביב - יפו' 'מדינת ישראל' 'הנאשם' 'כתבי עת:'
 'ספרות:' 'חקיקה שאוזכרה: '
 'פקודת בתי הסוהר [נוסח חדש], תשל"ב-1971: סע\'  19ה' 'כללי'
 'כתב האישום המתוקן ' 'אישום 15 – עבירות מס: ' 'הליכי הגישור והכרעת הדין '
 'גזר הדין בעניינם של הנאשמים האחרים '
 'על הנאשמים 2-22 נגזרו העונשים, כדלקמן:' 'ראיות לעונש'
 'מטעם המאשימה הוגשו המסמכים כדלקמן:' 'עדים לעונש:'
 'מטעם ההגנה הוגשו המסמכים הבאים:' 'עיקר טענות הצדדים לעונש'
 'כללי- מהות ההסדר' 'מתחמי הענישה' 'בחינת ההסכמות בין הצדדים וקביעת העונש'
 'הודיה ונטילת אחריות בעקבות הליכי הגישור' 'האינטרס הציבורי'
 'חיסכון במשאבים ציבוריים' 'קשיים ראייתיים' 'חלוף הזמן ומשמעותו'

Processing DOCX files: 348it [00:06, 64.57it/s]

Processing ת"פ 41228-03-18
Processing ת"פ 50551-03-18
Processing ת"פ 52225-03-18
Processing ת"פ 52790-03-18
Processing ת"פ 53496-03-18
Processing ת"פ 56177-03-18
Processing ת"פ 7942-05-18
Processing ת"פ 10524-05-18
Processing ת"פ 32659-05-18
Processing ת"פ 41522-05-18
Processing ת"פ 42697-05-18
NO required parts in data
parts in data:
['בית המשפט המחוזי בחיפה' 'חקיקה שאוזכרה: ' 'גזר דין' '5129371'
 'אמיר טובי 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 56073-05-18
Processing ת"פ 63018-05-18
Processing ת"פ 69643-05-18
Processing ת"פ 11814-06-18
Processing תפ"ח 34198-06-18
Processing ת"פ 34526-06-18
Processing ת"פ 36728-06-18
Processing תפ"ח 46590-06-18
Processing ת"פ 47284-06-18
Processing ת"פ 3742-07-18
Processing ת"פ 13301-07-18
Processing ת"פ 21906-07-18
Processing ת"פ 21971-07-18
Processing ת"פ 23532-07-18
NO required parts in data
parts in data:
['בירושלים' 'נוכחים:-' 'חקיקה שאוזכרה: ' 'גזר דין' '54678313'
 'אלכסנדר רון 54678313']
⚠️ Skipping file — no rel

Processing DOCX files: 374it [00:06, 71.80it/s]

Processing ת"פ 60648-07-18
Processing ת"פ 60792-07-18
Processing ת"פ 8864-08-18
Processing תפ"ח 42980-08-18
Processing תפ"ח 15153-09-18
Processing ת"פ 15905-09-18
Processing ת"פ 34938-09-18
Processing ת"פ 39800-09-18
Processing ת"פ 1118-10-18
Processing ת"פ 8310-10-18
Processing ת"פ 23872-02-19
Processing תפ"ח 24704-02-19
Processing ת"פ 27330-02-19
Processing ת"פ 61759-02-19
Processing תפ"ח 15217-03-19
Processing ת"פ 15627-03-19
Processing ת"פ 27929-03-19
Processing ת"פ 38340-03-19
Processing ת"פ 57474-03-19
Processing ת"פ 57498-03-19
Processing ת"פ 1316-04-19
Processing ת"פ 1641-04-19
Processing תפ"ח 2642-04-19
Processing ת"פ 7735-04-19
Processing ת"פ 14488-04-19
Processing ת"פ 22030-04-19
Processing ת"פ 27294-04-19
Processing תפ"ח 31343-04-19
NO required parts in data
parts in data:
['בית המשפט המחוזי בתל אביב - יפו' 'הנאשמים ' 'חקיקה שאוזכרה: '
 'חוק מאבק בארגוני פשיעה, תשס"ג-2003: סע\'  3(ג)' 'גזר דין –בעניין נאשם 4'
 'גזירת הדין:' '54678313']
⚠️ Skipping file — no relevant parts f

Processing DOCX files: 400it [00:06, 95.50it/s]

Processing ת"פ 56374-05-19
Processing ת"פ 56488-05-19
Processing ת"פ 23015-06-19
Processing תפ"ח 34802-06-19
Processing ת"פ 52390-06-19
Processing ת"פ 4411-07-19
Processing ת"פ 8008-07-19
Processing ת"פ 11104-07-19
Processing ת"פ 14115-07-19
Processing ת"פ 34507-07-19
Processing ת"פ 50481-07-19
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'גזר דין' 'הנאשם הביע צער על מעשיו.'
 'הנאשם הודה במיוחס לו וחסך זמן שיפוט יקר.'
 '5129371א.\t34 חודשי מאסר בפועל בניכוי ימי מעצרו  .'
 'פיצוי למתלונן בסך 10,000 ₪.' 'אליהו ביתן 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 54607-07-19
Processing ת"פ 5221-11-19
Processing ת"פ 15772-11-19
Processing ת"פ 39941-11-19
Processing ת"פ 40898-11-19
Processing ת"פ 41052-11-19
Processing ת"פ 57729-11-19
Processing ת"פ 58505-11-19
Processing ת"פ 58524-11-19
Processing ת"פ 68008-11-19
Processing ת"פ 15423-12-19
Processing ת"פ 19272-12-19
Processing ת"פ 23648-12-19
Processing ת"פ 23749-12-19
Processing ת"פ 32339-12-19
Process

Processing DOCX files: 416it [00:06, 105.94it/s]

Processing תפ"ח 48783-12-19
Processing ת"פ 61299-12-19
NO required parts in data
parts in data:
["בפני כבוד השופט סארי ג'יוסי" 'נגד' 'חקיקה שאוזכרה: ' '.' 'גזר דין'
 '5129371 ']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 68368-12-19
Processing ת"פ 4676-01-20
Processing ת"פ 4133-01-20
Processing ת"פ 4664-01-20
Processing ת"פ 17935-01-20
Processing ת"פ 54764-01-20


Processing DOCX files: 440it [00:07, 82.81it/s] 

Processing ת"פ 58511-01-20
Processing ת"פ 58701-01-20
Processing ת"פ 62688-01-20
Processing תפ"ח 5511-02-20
Processing ת"פ 13270-02-20
Processing ת"פ 15744-02-20
Processing ת"פ 16370-02-20
Processing ת"פ 52256-03-20
Processing ת"פ 52515-03-20
Processing ת"פ 7626-04-20
Processing ת"פ 12376-04-20
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' '.' 'גזר דין'
 '(1)  הפגיעה של העונש בנאשם, לרבות בשל גילו".' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 14593-04-20
Processing ת"פ 21696-04-20
NO required parts in data
parts in data:
['nothing' '5129371' 'חקיקה שאוזכרה: ' "פקודת התעבורה [נוסח חדש]: סע'  67"
 '\nגזר דין' 'חנא סבאג 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 24896-04-20
Processing ת"פ 38687-04-20
Processing ת"פ 7597-05-20
Processing ת"פ 10686-05-20
Processing ת"פ 12791-05-20
Processing ת"פ 17277-05-20
Processing ת"פ 33131-05-20
Processing ת"פ 34579-05-20
Processing ת"פ 44381-05-20
Processing ת"פ 51473-05-20
Processin

Processing DOCX files: 459it [00:07, 88.33it/s]

NO required parts in data
parts in data:
['בית המשפט המחוזי בחיפה' 'הנאשם' 'חקיקה שאוזכרה: ' 'גזר-דין' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 61158-05-20
Processing ת"פ 62447-05-20
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'גזר דין' '<#9#>' 'אליהו ביתן 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 66319-05-20
Processing ת"פ 66430-05-20
Processing ת"פ 66542-05-20
Processing ת"פ 962-06-20
Processing ת"פ 10300-06-20
Processing ת"פ 10740-06-20
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' '.' 'האישום' 'הראיות לעונש' 'טענות הצדדים'
 'הערכים המוגנים והענישה בעבירות אלו' 'הענישה' '<#5#>' '5129371']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 10896-06-20
Processing ת"פ 11042-06-20
Processing ת"פ 12035-06-20
Processing ת"פ 14479-06-20
Processing ת"פ 30391-06-20
Processing ת"פ 48905-12-20
Processing ת"פ 52077-12-20
Processing ת"פ 57272-12-20
Processing ת"פ 1802-01-21
Processing ת"פ 2312-01-21
P

Processing DOCX files: 479it [00:08, 50.31it/s]

Processing ת"פ 54455-01-21
Processing ת"פ 4325-02-21
Processing ת"פ 6153-02-21
Processing ת"פ 7109-02-21
Processing ת"פ 12411-02-21
Processing תפ"ח 15815-02-21
Processing ת"פ 22526-02-21
Processing ת"פ 27625-02-21
Processing ת"פ 28332-02-21
Processing ת"פ 30327-02-21
Processing ת"פ 41600-02-21
Processing ת"פ 46379-02-21
Processing ת"פ 46546-02-21
Processing ת"פ 46604-02-21
Processing ת"פ 7053-03-21
Processing ת"פ 7089-03-21
NO required parts in data
parts in data:
['בית המשפט המחוזי בירושלים' 'עלי מחיסן' 'חקיקה שאוזכרה: '
 'גזר דין   בעניין הנאשם 1' '5129371' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 7196-03-21
Processing ת"פ 10139-03-21


Processing DOCX files: 497it [00:08, 55.12it/s]

Processing ת"פ 11739-03-21
Processing ת"פ 22029-03-21
Processing ת"פ 22094-03-21
NO required parts in data
parts in data:
['גזר דין' '<#7#>' 'אליהו ביתן 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 25639-03-21
Processing ת"פ 28744-03-21
Processing ת"פ 13177-04-21
Processing ת"פ 16161-04-21
Processing ת"פ 29566-04-21
Processing ת"פ 31822-04-21
Processing ת"פ 31842-04-21
Processing ת"פ 63328-04-21
Processing ת"פ 63360-04-21
Processing תפ"ח 63773-04-21
Processing ת"פ 4531-05-21
Processing ת"פ 7279-05-21
Processing ת"פ 30706-05-21
Processing ת"פ 43271-05-21
Processing ת"פ 54337-05-21
Processing ת"פ 57283-05-21
Processing ת"פ 64119-05-21
Processing ת"פ 1178-06-21
Processing ת"פ 14284-06-21
Processing ת"פ 23542-06-21
Processing ת"פ 24361-06-21
Processing תפ"ח 25853-06-21
Processing ת"פ 28246-06-21
Processing ת"פ 30684-06-21
Processing ת"פ 40118-06-21


Processing DOCX files: 530it [00:08, 85.39it/s]

NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'גזר דין' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 40250-06-21
Processing ת"פ 42581-06-21
Processing ת"פ 43085-06-21
Processing ת"פ 44351-06-21
Processing תפ"ח 55524-06-21
Processing ת"פ 1715-07-21
Processing ת"פ 2009-07-21
Processing ת"פ 3045-07-21
NO required parts in data
parts in data:
['בית המשפט המחוזי בירושלים' 'חקיקה שאוזכרה: ' 'גזר דין' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 45994-08-21
Processing ת"פ 51296-08-21
Processing ת"פ 51607-08-21
Processing ת"פ 58773-08-21
Processing ת"פ 65070-08-21
Processing ת"פ 6574-09-21
Processing ת"פ 15135-09-21
Processing ת"פ 15710-09-21
Processing ת"פ 26549-09-21
Processing ת"פ 32882-09-21
Processing ת"פ 34694-09-21
Processing ת"פ 34737-09-21
Processing ת"פ 38368-09-21


Processing DOCX files: 558it [00:09, 95.69it/s]

Processing ת"פ 12466-10-21
Processing ת"פ 18039-10-21
Processing ת"פ 18557-10-21
Processing ת"פ 59067-10-21
Processing ת"פ 71333-10-21
Processing ת"פ 1136-11-21
Processing ת"פ 8542-11-21
Processing ת"פ 10552-11-21
Processing ת"פ 10650-11-21
Processing תפ"ח 10713-11-21
Processing ת"פ 12615-11-21
Processing ת"פ 14411-11-21
Processing ת"פ 17137-11-21
Processing ת"פ 17776-11-21
Processing ת"פ 17856-11-21
Processing תפ"ח 17865-11-21
Processing ת"פ 26210-11-21
Processing ת"פ 26567-11-21
Processing ת"פ 41830-12-21
Processing ת"פ 45456-12-21
Processing ת"פ 51471-12-21
NO required parts in data
parts in data:
['בית המשפט המחוזי בירושלים' 'חקיקה שאוזכרה: ' 'רקע' 'תסקירי שירות המבחן'
 'ראיות לעונש' 'טיעוני הצדדים לעונש' 'ריבוי עבירות' 'מתחמי העונש ההולם'
 'העונש המתאים' 'סוף דבר'
 '54678313\tזכות ערעור לבית המשפט העליון בתוך 45 ימים מהיום.' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 51971-12-21
Processing ת"פ 54202-12-21
Processing ת"פ 58027-12-21
Processing ת"פ 60429-

Processing DOCX files: 569it [00:09, 72.14it/s]

Processing ת"פ 67356-12-21
Processing ת"פ 1631-01-22
Processing ת"פ 4031-01-22
NO required parts in data
parts in data:
['בית המשפט המחוזי בתל אביב - יפו' 'מדינת ישראל' 'רן יחזקאל (עציר)'
 'רונן ירמיהו (עציר)' 'דניאל ארונבייב (עציר)' 'חקיקה שאוזכרה: ' 'כללי'
 'הסדר הטיעון' 'ראיות לעונש' 'טיעוני הצדדים' 'גזירת הדין' 'נאשם 1'
 'נאשם 2' 'נאשם 3 ' 'זכות ערעור 45 יום מהיום.' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 13253-01-22
Processing ת"פ 16521-01-22
Processing תפ"ח 17033-01-22


Processing DOCX files: 578it [00:09, 47.25it/s]

Processing ת"פ 31216-01-22
Processing ת"פ 31228-01-22
Processing ת"פ 32198-01-22
NO required parts in data
parts in data:
['בית המשפט המחוזי בחיפה' '(בעניינו של הנאשם 2)' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 36202-01-22
Processing ת"פ 36287-01-22
Processing ת"פ 42106-01-22
Processing ת"פ 44620-01-22
Processing ת"פ 48176-01-22
Processing ת"פ 49203-01-22
Processing ת"פ 51506-01-22
Processing ת"פ 59796-01-22
Processing ת"פ 64303-01-22
Processing ת"פ 6875-02-22
Processing ת"פ 6961-02-22
Processing ת"פ 6968-02-22


Processing DOCX files: 587it [00:09, 48.73it/s]

Processing ת"פ 16753-02-22
Processing ת"פ 22971-02-22
Processing ת"פ 43581-03-22
NO required parts in data
parts in data:
['בית המשפט המחוזי בחיפה' 'חקיקה שאוזכרה: ' 'גזר דין'
 'תמצית העובדות המפורטות בכתב האישום המתוקן;' 'טיעוני המאשימה'
 'טיעוני ההגנה' 'דברי הנאשם' nan 'חומרת העבירות והערכים החברתיים שנפגעו'
 'הנסיבות שאינן קשורות בביצוע העבירה' 'מדיניות בתי המשפט לגבי הסדרי טיעון'
 'סוף דבר' '54678313זכות ערעור תוך 45 יום מהיום.' 'דיאנה סלע 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 46930-03-22


Processing DOCX files: 608it [00:10, 56.53it/s]

Processing ת"פ 52188-03-22
Processing ת"פ 52355-03-22
Processing ת"פ 52964-03-22
Processing ת"פ 53669-03-22
Processing ת"פ 60484-03-22
Processing ת"פ 60765-03-22
Processing ת"פ 66385-03-22
Processing ת"פ 1294-04-22
Processing ת"פ 1390-04-22
Processing ת"פ 15802-04-22
Processing ת"פ 26478-04-22
Processing ת"פ 28787-04-22
Processing ת"פ 28845-04-22
Processing ת"פ 28991-04-22
Processing ת"פ 54444-04-22
Processing ת"פ 54514-04-22
Processing ת"פ 12028-05-22
Processing ת"פ 12401-05-22
Processing ת"פ 27544-05-22
Processing ת"פ 32410-05-22
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'גזר דין' '<#3#>' 'אליהו ביתן 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 36111-05-22
Processing ת"פ 38609-05-22
Processing ת"פ 38883-05-22
Processing ת"פ 41754-05-22
Processing ת"פ 42197-05-22
Processing ת"פ 45025-05-22


Processing DOCX files: 615it [00:10, 57.94it/s]

Processing ת"פ 46638-05-22
Processing ת"פ 48621-05-22
Processing ת"פ 56860-05-22
Processing ת"פ 57020-05-22
Processing ת"פ 10374-07-22
Processing ת"פ 12606-07-22


Processing DOCX files: 634it [00:10, 54.79it/s]

Processing ת"פ 14976-07-22
Processing ת"פ 21924-07-22
Processing ת"פ 22913-07-22
Processing ת"פ 28796-07-22
Processing ת"פ 30966-07-22
Processing ת"פ 43742-07-22
Processing ת"פ 46737-07-22
Processing ת"פ 46916-07-22
Processing ת"פ 58626-07-22
NO required parts in data
parts in data:
['בית המשפט המחוזי בירושלים' 'חקיקה שאוזכרה: ' 'רקע'
 'טיעוני הצדדים וראיות לעונש' 'מתחמי העונש ההולם' 'קביעת העונש בתוך המתחם'
 'הכרעה' '54678313' 'אוהד גורדון 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 58770-07-22
Processing ת"פ 58774-07-22
Processing ת"פ 61841-07-22
Processing ת"פ 62279-07-22
Processing ת"פ 4764-08-22
NO required parts in data
parts in data:
['בית המשפט המחוזי בירושלים' 'חקיקה שאוזכרה: ' 'רקע  ']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 12743-08-22
Processing ת"פ 32320-08-22
Processing ת"פ 44169-08-22
Processing ת"פ 63305-08-22


Processing DOCX files: 665it [00:11, 81.39it/s]

Processing ת"פ 14767-09-22
Processing ת"פ 16760-09-22
Processing ת"פ 16779-09-22
Processing ת"פ 24257-09-22
Processing ת"פ 50301-09-22
Processing ת"פ 50474-09-22
Processing ת"פ 50626-09-22
Processing ת"פ 52782-09-22
Processing ת"פ 52789-09-22
Processing ת"פ 52848-09-22
Processing ת"פ 53339-09-22
Processing ת"פ 53377-09-22
Processing ת"פ 24758-11-22
Processing ת"פ 27986-11-22
Processing ת"פ 53954-11-22
Processing ת"פ 4734-12-22
Processing ת"פ 7311-12-22
Processing ת"פ 13312-12-22
Processing ת"פ 13995-12-22
Processing תפ"ח 20615-12-22
Processing ת"פ 20733-12-22
Processing ת"פ 23071-12-22
Processing ת"פ 23328-12-22
Processing ת"פ 38886-12-22
Processing ת"פ 45226-12-22
Processing ת"פ 49734-12-22
Processing ת"פ 50477-12-22
Processing ת"פ 3537-01-23
Processing ת"פ 11167-01-23
Processing ת"פ 26702-01-23
Processing ת"פ 31821-01-23
Processing ת"פ 34669-01-23
Processing ת"פ 54202-01-23
Processing ת"פ 69261-01-23
Processing ת"פ 72283-01-23
Processing ת"פ 73275-01-23
Processing ת"פ 76750-01-23
Pro

Processing DOCX files: 691it [00:11, 103.46it/s]

Processing תפ"ח 6462-02-23
Processing ת"פ 14375-02-23
Processing ת"פ 70373-03-23
Processing ת"פ 70392-03-23
Processing ת"פ 70404-03-23
Processing ת"פ 70450-03-23
Processing ת"פ 72164-03-23
Processing ת"פ 811-04-23
Processing ת"פ 8444-04-23
Processing ת"פ 8639-04-23
Processing ת"פ 10838-04-23
Processing ת"פ 12158-04-23
Processing ת"פ 24634-04-23
Processing ת"פ 35434-04-23
Processing ת"פ 37966-04-23
Processing ת"פ 51199-04-23
Processing ת"פ 51209-04-23
Processing ת"פ 16190-05-23
Processing ת"פ 18210-05-23
Processing ת"פ 22405-05-23
Processing ת"פ 24670-05-23
Processing ת"פ 29305-05-23
Processing ת"פ 32277-05-23


Processing DOCX files: 703it [00:11, 103.70it/s]

NO required parts in data
parts in data:
['בית המשפט המחוזי בחיפה' 'חקיקה שאוזכרה: ' 'כללי' 'עובדות כתב האישום'
 'ראיות המאשימה לעונש' 'עיקר טיעוני המאשימה לעונש' 'ראיות הנאשם לעונש'
 'עיקר טיעוני הנאשם לעונש' 'העונש המוסכם ' 'המאסר המותנה'
 'זכות ערעור לבית המשפט העליון בתוך 45 יום מהיום.' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 39808-05-23
Processing ת"פ 61660-05-23
NO required parts in data
parts in data:
['בית המשפט המחוזי בירושלים' 'תאאר בקיראת ' 'קיקה שאוזכרה: ' 'גזר דין'
 'הכרעת הדין והעבירות שבהן הורשע הנאשם'
 '(1)\tעובדות כתב האישום המתוקן בהליך העיקרי (ת"פ 61660-05-23)'
 '(2)\tעובדות כתב האישום המתוקן בת"פ (מחוזי ירושלים) 51712-07-23'
 '(3)\tעובדות כתב האישום המתוקן בת"פ (שלום ירושלים) 41797-03-23'
 '- עניינם של הנאשמים בת"פ (מחוזי ירושלים) 51712-07-23'
 '\t- תסקיר שירות המבחן בעניין הנאשם' '\t- תסקיר נפגע עבירה'
 '\t- הראיות לעונש ' '\t- טענות המאשימה' '\t- טענות ההגנה'
 '\t- דברי הנאשם ודברי אביו' '- מספר מתחמי הענישה'
 '\t- הערכים החברתיים שנ

Processing DOCX files: 714it [00:11, 66.61it/s] 

Processing ת"פ 8188-06-23
Processing ת"פ 9873-06-23
Processing ת"פ 18912-06-23
Processing ת"פ 24350-06-23
Processing ת"פ 64581-08-23
Processing ת"פ 67387-08-23
Processing ת"פ 32775-09-23
Processing ת"פ 35295-09-23
Processing ת"פ 37722-09-23
NO required parts in data
parts in data:
['בית המשפט המחוזי בירושלים' 'מדינת ישראל' 'אשרף נמרי (עציר)'
 'חקיקה שאוזכרה: ' 'הרקע:' 'תמצית עובדות כתב האישום המתוקן:'
 'תסקירי שירות המבחן:' 'התסקיר בעניינו של נאשם 1:'
 'התסקיר בעניינו של נאשם 2:' 'הראיות לעונש:' 'טיעוני המאשימה לעונש:'
 'טעוני ההגנה לעונש:' 'מתחמי העונש ההולמים למעשי העבירה:'
 'העונשים המתאימים לנאשמים:' 'התוצאה:' 'נאשם 1:' 'נאשם 2:' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 38355-09-23


Processing DOCX files: 746it [00:11, 94.59it/s]

NO required parts in data
parts in data:
['בית המשפט המחוזי בירושלים' 'מדינת ישראל' 'טארק אדריס' 'שאדי רגבי'
 'ארכאן קוואסמה' 'עלאא גתית' 'ראאד חמדאן' 'צאלח אלדין עבד אלגואד'
 'אחמד מהלוויס' 'מחמד רגבי' 'חקיקה שאוזכרה: ' 'הרקע:'
 'תמצית עובדות כתבי האישום המתוקנים:' 'תסקירי שירות המבחן:'
 'התסקיר בעניינו של אחמד:' 'התסקיר בעניינו של מחמד:' 'ראיות המאשימה:'
 'ראיות שאדי:' 'ראיות אחמד:' 'ראיות מחמד:' 'טיעוני המאשימה: '
 'טיעוני שאדי:' 'טיעוני אחמד:' 'טיעוני מחמד:'
 'העובדות שישמשו תשתית לגזר הדין:' 'מתחמי העונש ההולמים למעשי העבירה:'
 '\tכפי שנפסק: ' '\tוכן:' 'העונשים המתאימים לנאשמים:' 'התוצאה:' 'שאדי:'
 'אחמד:' 'מחמד:' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 46939-09-23
Processing ת"פ 48069-09-23
Processing ת"פ 48522-09-23
Processing ת"פ 50068-09-23
Processing ת"פ 51912-09-23
NO required parts in data
parts in data:
['בית המשפט המחוזי בתל אביב -יפו' 'מדינת ישראל' 'הנאשמים'
 'חקיקה שאוזכרה: ' 'כללי והסכמות הצדדים' 'עובדות כתב האישום המתוקן'
 'ראיות לעונש' 

Processing DOCX files: 771it [00:12, 86.38it/s]

NO required parts in data
parts in data:
['בית משפט השלום קרית גת' 'נגד' 'חקיקה שאוזכרה: ' 'גזר דין' '5129371'
 'ב"כ הנאשם:' 'ב"כ המאשימה:' 'המשך גזר הדין' 'טלי חיימוביץ, שופטת  ']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 003206∕02
NO required parts in data
parts in data:
['מדינת ישראל' "ג'אבר מעאד (בן סלאח)" 'חקיקה שאוזכרה: ' 'גזר דין'
 '5129371' 'צבי זילברטל, שופט' 'החלטה']
⚠️ Skipping file — no relevant parts found.
Processing ת.פ 4354∕02
NO required parts in data
parts in data:
['בתי המשפט' '21/11/2002' 'הנאשם' 'גזר דין' 'שקלתי לנאשם לחומרא:ו  '
 'שקלתי לנאשם לקולא:ו ' '5129371\xa0']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 003665∕99
NO required parts in data
parts in data:
['מדינת ישראל' "גזר דין בעניינו של הנאשם מס' 1" '5129371סגן נשיא']
⚠️ Skipping file — no relevant parts found.
Processing ת.פ 001055∕01
NO required parts in data
parts in data:
['גזר דין' 'הסם יושמד.' '5129371' 'אבי זמיר, שופט']
⚠️ Skipping file — no relevant parts found.
Proc

Processing DOCX files: 782it [00:12, 78.72it/s]

NO required parts in data
parts in data:
['ב"כ המאשימה – עו"ד עדי קרן' 'חקיקה שאוזכרה: ' 'גזר דין'
 'זכות ערעור תוך 45 יום מהיום.' 'טלי חיימוביץ 54678313-120/06'
 'טלי חיימוביץ, שופטת  ']
⚠️ Skipping file — no relevant parts found.
Processing ת.פ 000288∕08
NO required parts in data
parts in data:
['ב"כ המאשימה –   עו"ד מיטל פרי' 'גזר דין' '54678313'
 'טלי חיימוביץ 54678313-288/08']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 2298∕08
NO required parts in data
parts in data:
['גזר- דין' '54678313' 'נוסח מסמך זה כפוף לשינויי ניסוח ועריכה']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 1075∕04
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'גזר דין לנאשמים 1 ו-2' '54678313 '
 'אלכסנדר רון 54678313-1075/04']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 1495-04
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' "פקודת התעבורה [נוסח חדש]: סע'  10 א'" 'גזר דין'
 '\tעבירות אלו בוצעו בתאריכים 20-21/04/2004.  '
 '\tהנאשם אמר כי הוא מ

Processing DOCX files: 792it [00:12, 74.63it/s]

NO required parts in data
parts in data:
['נוכחים:' 'גזר דין' '<#4#>' 'החלטה' '<#6#>' 'חנא סבאג, סגן נשיא']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 7434-05-10
NO required parts in data
parts in data:
['בית משפט השלום בפתח תקווה'
 'ב"כ המאשימה , מתמחה, מר גיל ויינשטיין – פמת"א' 'גזר דין' 'עברו נקי.'
 'וכך נקבע:' 'נקבע כך: ' 'נקבע כך:' '<#2#>' '5129371'
 'ליה לבאון, סגנית נשיאה']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 11038-05-10
NO required parts in data
parts in data:
['גזר דין' '5129371' 'ד"ר עמי קובו, שופט']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 26356-05-10
NO required parts in data
parts in data:
['נוכחים:' 'גזר דין' '<#4#>' 'ליה לבאון, סגנית נשיאה']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 44187-05-10
NO required parts in data
parts in data:
['גזר דין' '<#4#>' 'החלטה' '<#6#>' 'וויליאם חאמד, שופט']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 44512-05-10
NO required parts in data
parts in dat

Processing DOCX files: 812it [00:12, 81.93it/s]

Processing ת"פ 17135-07-10
NO required parts in data
parts in data:
['גזר דין' '<#4#>' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 21162-07-10
Processing ת"פ 26360-09-10
NO required parts in data
parts in data:
['גזר דין' '<#6#>' '5129371' 'ד"ר עמי קובו, שופט']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 32233-09-10
NO required parts in data
parts in data:
['בית משפט השלום בכפר סבא' 'בעניין:' 'נגד' 'גזר דין' '54678313'
 '54678313הודעה זכות ערעור לבית-המשפט המחוזי תוך 45 יום.']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 14525-10-10
NO required parts in data
parts in data:
['גזר דין' 'ניתן בזאת צו לחילוט המוצגים בכפוף לזכות הערעור.' '<#5#>'
 'יעל לוי']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 18793-10-10
NO required parts in data
parts in data:
['בית משפט השלום ברמלה' 'בפני ' 'בעניין:' 'נגד' 'חקיקה שאוזכרה: '
 'ג ז ר – ד י ן' '5129371']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 21861-10-10
NO req

Processing DOCX files: 835it [00:13, 75.82it/s]

Processing ת"פ 57124-10-10
NO required parts in data
parts in data:
['גזר דין' 'עותק יועבר לממונה על עבודות השרות.' '<#3#>' '5129371'
 "ג'ורג אמוראי, שופט"]
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 12753-11-10
NO required parts in data
parts in data:
['בית משפט השלום בכפר סבא' 'בעניין:' 'נגד' 'גזר דין' '5129371']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 21931-11-10
NO required parts in data
parts in data:
['גזר דין' '<#3#>' 'החלטה' 'יפעת שיטרית 54678313' 'יפעת שיטרית, שופטת']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 22022-11-10
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'גזר דין' 'הנאשם צירף שני תיקים נוספים: ' '<#4#>'
 'החלטה' 'ערבות עצמית בסך 50,000 ₪;' 'הפקדה כספית בסך 2,000 ₪' '<#6#>'
 '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 25852-11-10
Processing ת"פ 41501-11-10
NO required parts in data
parts in data:
['מדינת ישראל' 'אייסר אגאברה' 'חקיקה שאוזכרה: ' 'גזר דין' '5129371'
 'ארז יקואל

Processing DOCX files: 844it [00:13, 71.68it/s]

NO required parts in data
parts in data:
['בית משפט השלום ברמלה' 'ע"י בא כוחו עו"ד אדנקו סבחת ' 'חקיקה שאוזכרה: '
 'כתב אישום ' 'טענות הצדדים' 'רכיב המאסר בעונש' 'רכיב הקנס בעונש'
 'סוף דבר' '5129371' '54678313' 'נוסח מסמך זה כפוף לשינויי ניסוח ועריכה']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 28754-04-11
NO required parts in data
parts in data:
['גזר דין (לגבי נאשם 1)' '<#6#>' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 19967-05
NO required parts in data
parts in data:
['בית משפט השלום ברמלה' 'בפני ' 'בעניין:' 'נגד' 'גזר דין' '5129371']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 24791-05-11
NO required parts in data
parts in data:
['בית משפט השלום בירושלים' 'בפני ' 'נוכחים:' 'גזר דין' '5129371']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 26344-05-11
NO required parts in data
parts in data:
['בית משפט השלום בכפר סבא' 'בפני ' 'בעניין:' 'נגד' 'חקיקה שאוזכרה: '
 'גזר דין' 'הודעה זכות ערעור לבית-המשפט המחוזי בתוך 

Processing DOCX files: 869it [00:13, 78.16it/s]

Processing ת"פ 35629-09-11
Processing ת"פ 35694-09-11
NO required parts in data
parts in data:
['בית משפט השלום ברמלה' 'בפני ' 'בעניין:' 'ג ז ר – ד י ן' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 50819-09-11
Processing ת"פ 50846-09-11
Processing ת"פ 51228-09-11
Processing ת"פ 18763-10-11
NO required parts in data
parts in data:
['בית משפט השלום בכפר סבא' 'בעניין:' 'נגד' 'גזר דין' '5129371'
 'הודעה זכות ערעור לבית-המשפט המחוזי בתוך 45 יום.']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 26406-10-11
NO required parts in data
parts in data:
['גזר דין' '<#3#>' '5129371' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 29187-02-12
Processing ת"פ 44750-02-12
NO required parts in data
parts in data:
['גזר דין' '54678313' 'יעקב בכר, שופט']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 1509-03-12
Processing ת"פ 13936-03-12
NO required parts in data
parts in data:
['13942-03-12' 'המאשימה  ' 'הנאשם ' 'גזר דין' 'הליך קליטה

Processing DOCX files: 886it [00:13, 84.82it/s]

NO required parts in data
parts in data:
['בית משפט השלום בתל אביב - יפו' 'פרקליטות מחוז תל אביב  פלילי'
 'חקיקה שאוזכרה: ' '.' 'ג ז ר   ד י ן'
 'המזכירות תשלח העתק החלטה לשירות המבחן, בתודה.' '5129371' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 14950-04-12
Processing ת"פ 28190-05-12
Processing ת"פ 32299-05-12
Processing ת"פ 45449-05-12
Processing ת"פ 48759-06-12
NO required parts in data
parts in data:
[' 48788-06-12' 'גזר-דין' '<#2#>' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 2761-07-12
Processing ת"פ 20509-07-12
NO required parts in data
parts in data:
[' 20515-07-12' 'הנאשמים' 'ב"כ המאשימה: עו"ד איתי שמואלי ועו"ד חן כהן'
 "(בעניינו של נאשם מס' 1)" '<#3#>' "(בעניינו של נאשם מס' 2)" '<#6#>'
 '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 20674-07-12
NO required parts in data
parts in data:
['15 ינואר 2015' 'הנאשמים' 'חקיקה שאוזכרה: ' 'גזר דין' '<#3#>' '54678313']
⚠️ Skipping file — no relevant parts foun

Processing DOCX files: 914it [00:14, 94.44it/s]

Processing ת"פ 2782-10-12
Processing ת"פ 3020-10-12
Processing ת"פ 48347-12-12
Processing ת"פ 51686-12-12
Processing ת"פ 53938-12-12
Processing ת"פ 535-12
Processing ת"פ 12034-01-13
Processing ת"פ 24322-01-13
Processing ת"פ 27542-01-13
NO required parts in data
parts in data:
['בית משפט השלום ברמלה' 'בעניין:' 'חקיקה שאוזכרה: ' 'ג ז ר – ד י ן'
 'המזכירות תעביר העתק גזר הדין לשירות המבחן ' '5467831354678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 29454-01-13
Processing ת"פ 34987-01-13
Processing ת"פ 58960-01-13
Processing ת"פ 8588-02-13
Processing ת"פ 11906-02-13
NO required parts in data
parts in data:
['בית משפט השלום בכפר סבא' 'בפני ' 'נגד' 'נוכחים:' 'חקיקה שאוזכרה: '
 '(בעניינם של נאשמים 1 ו-3)' 'הכרעה' 'נאשם 1' 'נאשם 3'
 'נאוה בכור 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 14754-02-13
Processing ת"פ 22329-02-13
Processing ת"פ 25300-02-13
Processing ת"פ 31982-02-13
Processing ת"פ 34966-02-13
NO required parts in data
parts in data:
['ב

Processing DOCX files: 965it [00:14, 167.66it/s]

NO required parts in data
parts in data:
['בית משפט השלום בפתח תקווה' 'גזר דין' '5129371' 'עינת רון 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 2884-04-13
Processing ת"פ 5142-04-13
Processing ת"פ 19835-04-13
Processing ת"פ 11011-09-14
NO required parts in data
parts in data:
['הנאשם' 'גזר דין (ביחס לנאשם 1)'
 'המזכירות תשלח העתק גזר הדין לממונה על עבודות השירות.' 'יואב עטר , שופט '
 'יואב עטר 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 16047-09-14
Processing ת"פ 17918-09-14
Processing ת"פ 35179-09-14
Processing ת"פ 53860-09-14
Processing ת"פ 5787-10-14
Processing ת"פ 26182-10-14
Processing ת"פ 51301-10-14
NO required parts in data
parts in data:
['18 אוקטובר 2015' 'גזר דין' '<#3#>' 'שמואל מלמד 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 1795-11-14
Processing ת"פ 8987-11-14
Processing ת"פ 19620-11-14
Processing ת"פ 27128-11-14
Processing ת"פ 53692-11-14
Processing ת"פ 21111-12-14
Processing ת"פ 25823-12-14
Pro

Processing DOCX files: 1019it [00:14, 180.63it/s]

NO required parts in data
parts in data:
['בית משפט השלום בראשון לציון' 'חקיקה שאוזכרה: ' 'גזר דין'
 'הנאשם השיב לבית העסק את מרבית המוצרים שהגיעו לידיו.'
 'התביעה הציגה אסופת פסיקה על מנת לתמוך בטיעוניה. '
 'ב"כ הנאשם התנגד לבקשה זו.'
 'שני תסקירי שירות מבחן הוגשו בעניינו של הנאשם. '
 'מדובר במעשים שיש בהם מסוכנות לפרט ולציבור.'
 'יש בהצטברותם של כל המעשים האלה כדי משנה חומרא.' 'זכות ערעור כחוק. '
 '54678313   \t\t\t\t\t     ']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 1516-10-16
Processing ת"פ 15567-10-16
Processing ת"פ 23384-10-16
Processing ת"פ 16-10
Processing ת"פ 31377-10-16
NO required parts in data
parts in data:
['בית משפט השלום בירושלים' 'גזר דין משלים   הנאשם 2' '54678313'
 'איתן כהן 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 7544-11-16
Processing ת"פ 19417-11-16
Processing ת"פ 19702-11-16
Processing ת"פ 49772-11-16
Processing ת"פ 50630-11-16
Processing ת"פ 6321-12-16
Processing ת"פ 12618-12-16
Processing ת"פ 15076-12-16
Processing

Processing DOCX files: 1067it [00:14, 181.87it/s]

Processing ת"פ 37298-08-17
Processing ת"פ 39340-08-17
Processing ת"פ 39792-08-17
NO required parts in data
parts in data:
['בית משפט השלום ברמלה' 'חקיקה שאוזכרה: ' 'גזר דין' '5129371' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 41967-08-17
Processing ת"פ 47445-08-17
Processing ת"פ 54703-08-17
Processing ת"פ 56603-08-17
Processing ת"פ 17948-09-17
Processing ת"פ 56792-09-17
Processing ת"פ 63470-09-17
Processing ת"פ 7870-10-17
NO required parts in data
parts in data:
['בית משפט השלום ברמלה' 'חקיקה שאוזכרה: ' 'גזר דין' '5129371']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 10556-10-17
NO required parts in data
parts in data:
['החלטה' 'גזר דין' 'לאור כל האמור אני דן את הנאשם לעונשים הבאים:' '<#6#>'
 'מרדכי כדורי 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 32264-10-17
Processing תפ"ק 58432-10-17
Processing ת"פ 3011-11-17
Processing ת"פ 19859-11-17
Processing ת"פ 53539-11-17
Processing ת"פ 61348-11-17
Processing ת"פ 12681-12-

Processing DOCX files: 1113it [00:14, 234.86it/s]

NO required parts in data
parts in data:
['בית משפט השלום ברמלה' 'נגד' 'ג ז ר  ד י ן' '5129371']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 47346-03-19
Processing ת"פ 47813-03-19
Processing ת"פ 60226-03-19
Processing ת"פ 26247-04-19
Processing ת"פ 51245-04-19
Processing ת"פ 51803-04-19
Processing ת"פ 17245-05-19
Processing ת"פ 17916-05-19
Processing ת"פ 30216-05-19
Processing ת"פ 63057-05-19
NO required parts in data
parts in data:
['בית משפט השלום ברמלה' 'חקיקה שאוזכרה: ' 'ג ז ר  ד י ן' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 3282-06-19
Processing ת"פ 13478-06-19
Processing תפ"ק 62837-11-19
Processing ת"פ 66887-11-19
Processing ת"פ 67580-11-19
Processing ת"פ 21333-12-19
Processing ת"פ 65378-12-19
Processing ת"פ 65577-12-19
Processing ת"פ 24420-01-20
Processing ת"פ 34448-01-20
Processing ת"פ 8254-02-20
Processing ת"פ 29352-02-20
Processing ת"פ 35543-02-20
Processing ת"פ 38293-02-20
Processing ת"פ 52091-02-20
Processing ת"פ 9154-03-20
NO re

Processing DOCX files: 1140it [00:15, 242.79it/s]

Processing ת"פ 16638-07-21
Processing ת"פ 17701-07-21
Processing ת"פ 40686-07-21
Processing ת"פ 41041-07-21
Processing ת"פ 17536-08-21
Processing ת"פ 61820-08-21
Processing ת"פ 3256-09-21
Processing ת"פ 17337-09-21
Processing ת"פ 26547-09-21
Processing ת"פ 27874-09-21
Processing ת"פ 1064-10-21
Processing ת"פ 19908-10-21
Processing ת"פ 33605-10-21
Processing ת"פ 53239-10-21
Processing ת"פ 55444-10-21
Processing ת"פ 16129-03-22
Processing ת"פ 22526-03-22
Processing ת"פ 28715-03-22
Processing ת"פ 41216-03-22
NO required parts in data
parts in data:
['nothing' 'ת"פ 41216-03-22 מדינת ישראל נ\' עאבד(עציר) ' 'חקיקה שאוזכרה: '
 'גזר דין' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 41599-03-22
Processing ת"פ 47870-03-22
Processing ת"פ 62924-03-22
Processing ת"פ 67855-03-22
Processing ת"פ 1363-04-22
Processing ת"פ 33025-04-22
Processing ת"פ 35396-04-22
Processing ת"פ 36391-04-22


Processing DOCX files: 1187it [00:15, 166.80it/s]

NO required parts in data
parts in data:
['ת"פ 36391-04-22 מדינת ישראל נ\' פלוני' 'מאשימה' 'נאשם'
 'ב"כ המאשימה: עו"ד אופיר לונטל' 'חקיקה שאוזכרה: '
 'גזר דין   עותק מותר בפרסום' 'תסקירי שירות המבחן' 'ב"כ המאשימה: '
 'ב"כ הנאשם: ' 'ע"פ 9306/20 מארון נ\' מדינת ישראל ' '<#16#>' ' ב"כ הנאשם:'
 'החלטה' '<#12#>' 'ליזי פרוינד, שופטת, סגנית הנשיאה' '54678313' '5129371']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 27405-05-22
Processing ת"פ 35711-05-22
Processing ת"פ 41375-05-22
Processing ת"פ 1818-06-22
Processing ת"פ 3197-06-22
Processing ת"פ 3986-06-22
Processing ת"פ 10171-06-22
Processing ת"פ 30433-06-22
Processing ת"פ 30867-06-22
Processing ת"פ 32024-06-22
Processing ת"פ 33128-06-22
Processing ת"פ 60153-06-22
Processing ת"פ 66150-06-22
Processing ת"פ 66741-06-22
Processing ת"פ 10251-07-22
Processing ת"פ 28334-07-22
Processing ת"פ 62301-07-22
Processing ת"פ 9989-08-22
Processing ת"פ 6999-09-22
Processing ת"פ 18228-09-22
Processing ת"פ 14802-02-23
Processing ת"פ 38423-03-23
P

Processing DOCX files: 1221it [00:15, 104.07it/s]

Processing ת"פ 42118-11-23
Processing ת"פ 51663-11-23
Processing ת"פ 52126-11-23
Processing ת"פ 66110-11-23
Processing ת"פ 60257-12-23
Processing ת"פ 65646-12-23
Processing ת"פ 23533-01-24
Processing ת"פ 63953-01-24
Processing תפ"ח 1067∕01
NO required parts in data
parts in data:
['המאשימה:' 'למאשימה -  הפרקליט יוסי קורצברג (פמת"א).' 'חקיקה שאוזכרה: '
 '\tהשופטת מרים סוקולוב:' 'תסקיר שירות המבחן.'
 '\tוהבדיקה הפסיכיאטרית בבית-החולים "אברבנאל" - ת/4.'
 'ראיות התביעה לעונש.' 'ראיות ההגנה לעונש.' 'טיעוני באי-כוח הצדדים.'
 'לעניין הנסיבות לחומרה.' 'לעניין הנסיבות לקולא.'
 'כאשר מומחה ניזון מתשתית בלתי-אמינה ובלתי-רלוונטית אין לחוות-דעתו ערך."'
 'סיכום.' 'תחיה שפירא, שופטת' 'קלדנית: ד.ל.ס.']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 1119∕02
NO required parts in data
parts in data:
['המאשימה:' 'למאשימה -  הפרקליט אמנון זוסמן (פמ"מ).\xa0'
 '\tהשופט נתן עמית, אב"ד:' '\tנאשם 2.נ' 'נאשם 3.ו' '\tובהמשך: '
 'תחיה שפירא, שופטת' 'קלדנית: ד.ל.ס.']
⚠️ Skipping file — no relevant part

Processing DOCX files: 1234it [00:16, 83.88it/s] 

NO required parts in data
parts in data:
['מדינת ישראל' 'שחר דביר זליגר' 'הנאשם' "פקודת מניעת טרור: סע'  1, 3" '.'
 'עיקר ממצאי הכרעת-הדין' '5129371' 'ההליך המשפטי'
 'ארגון הטרור ופעילותו הרצחנית' 'הנאשם ' 'טיעוני המאשימה'
 'טיעוני הסניגוריה  ' 'שיקולי הענישה' 'סוף דבר'
 'זכות ערעור לבית-המשפט העליון תוך 45 יום מהיום.נ' "י' נועם, שופט"]
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 000223∕03
NO required parts in data
parts in data:
['תי המשפט ' 'לפני:' 'נ  ג  ד' 'הנאשם' 'חקיקה שאוזכרה: ' 'גזר דין'
 '5129371']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 000228∕03
NO required parts in data
parts in data:
['גזר דין' '5129371העובדות' 'תסקירי שירות המבחן למבוגרים' 'טיעונים לעונש'
 'לגופו של ענין' 'זכות ערעור לבית המשפט העליון תוך 45 יום.ו'
 'יפה הכט, סגנית נשיא']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 000231∕03
NO required parts in data
parts in data:
['בתי המשפט' 'לפני:' 'נ  ג  ד' 'הנאשם' 'גזר דין' '5129371']
⚠️ Skipping file — no relevant pa

Processing DOCX files: 1254it [00:16, 77.81it/s]

NO required parts in data
parts in data:
['בתי המשפט ' 'לפני:' 'מדינת ישראל ' "פרג' בן מחמוד שרבאתי " 'גזר דין'
 'זכות ערעור לבית-המשפט העליון בתוך 45 יום מהיום.ו' 'יעקב צבן, שופט']
⚠️ Skipping file — no relevant parts found.
Processing ת.פ 000478∕04
Processing ת"פ 2903∕04
NO required parts in data
parts in data:
['בתי המשפט ' 'חקיקה שאוזכרה: ' 'גזר דין' '5129371'
 'אמסטרדם יהודית 54678313-2903/04']
⚠️ Skipping file — no relevant parts found.
Processing ת.פ 40065∕04
Processing ת"פ 949∕05
Processing ת.פ 988∕05
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'גזר דין' '\tואלה המעשים:' '5129371' '54678313'
 'יעקב צבן 54678313-988/05' 'יעקב צבן, שופט']
⚠️ Skipping file — no relevant parts found.
Processing ת.פ 001023∕05
NO required parts in data
parts in data:
['מדינת ישראל' 'עבד אל קדר קרי' 'חקיקה שאוזכרה: ' 'גזר-דין' '54678313'
 '5129371' 'כנפי-שטייניץ, שופטת']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 1029∕05
Processing תפ"ח 1064∕05
Processing תפ"ח 1145∕05


Processing DOCX files: 1263it [00:16, 62.13it/s]

NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'מדינת ישראל' 'גזר - דין' 'על הנאשם 1:' 'על הנאשם 2:'
 '5129371' 'מרים סוקולוב 54678313-1030/07' "מ' סוקולוב, שופטת"]
⚠️ Skipping file — no relevant parts found.
Processing ת.פ 3089∕07
NO required parts in data
parts in data:
['מדינת ישראל ' 'דיב בן מוחמד שקיראת, ת.ז. xxxxxxxxx'
 "מתורגמנית בית המשפט הגב' איה עבסי" 'חקיקה שאוזכרה: ' 'גזר דין' '5129371'
 'נאוה בן-אור, שופטת']
⚠️ Skipping file — no relevant parts found.
Processing ת.פ 3110∕07
NO required parts in data
parts in data:
['מדינת ישראל' "ג'מאל אבו זיאדה, ת.ז. xxxxxxxxx" 'חקיקה שאוזכרה: '
 'גזר דין' 'עו"ד צמל:' 'ב"כ המאשימה:' 'החלטה' '5129371'
 'נאוה בן-אור, שופטת']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 3122∕07
NO required parts in data
parts in data:
['מדינת ישראל' 'נתנאל ליבוביץ ת"ז xxxxxxxxxx(משוחרר)'
 'באמצעות הסניגוריה הציבורית' 'הנאשמים' 'חקיקה שאוזכרה: ' 'גזר דין'
 'נאשם 1:' 'נאשם 2:' 'נאשם 3:' '54678313' 'אורית אפעל-גבאי, שופטת']
⚠️ Skippin

Processing DOCX files: 1283it [00:16, 75.00it/s]

NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'ג ז ר  -  ד י ן' '5129371' 'משה סובל, שופט']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ (תל- אביב- יפו) 264∕96
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'השופטת סביונה רוטלוי' '54678313'
 'סביונה רוטלוי 54678313-264/96']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 327∕98
NO required parts in data
parts in data:
['גזר- דין' '54678313' 'יהודית צור 54678313-327/98']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 8042∕98
NO required parts in data
parts in data:
['גזר- דין' 'רות אבידע 54678313-8042/98' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 163∕99
NO required parts in data
parts in data:
["ש' גלעד" 'נ  ג  ד' 'דראושה' 'השופט צבי סגל' '5129371'
 'צבי סגל 54678313-163/99']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 40202∕99
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'עובדות:' 'נפסק:' 'גזר- דין' 'העובדות:' 'הסד

Processing DOCX files: 1303it [00:17, 81.79it/s]

NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'גזר דין' 'נאשם 1:' 'נאשם 2:' 'המסגרת הנורמטיבית'
 '"הרשעה בעבירות אחדות' '"...' '...' 'מן הכלל אל הפרט' 'נאשם 2'
 'פיצוי למשפחת המנוח' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 1057-07
Processing תפ"ח 1072-07
NO required parts in data
parts in data:
['בפני: כב\' ס. הנשיא השופטת ר. יפה-כ"ץ,אב"ד'
 "תקנות ההגנה (שעת-חירום), 1945: סע'  85(1)(א)"
 'הנשיא השופטת ר. יפה-כ"ץ, אב"ד:' 'זכות ערעור תוך 45 יום לביהמ"ש העליון.'
 'יורם צלקובניק, שופט' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 1094-07
NO required parts in data
parts in data:
['בפני כב\' השופטת רות אבידע – אב"ד ' 'גזר דין' '<#4#>' '5129371'
 '54678313 ']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 1095-07
Processing תפ"ח 1142-07
NO required parts in data
parts in data:
['לפני:' 'ע"י ב"כ עו"ד לאה צמל ' 'חקיקה שאוזכרה: ' "כב' השופט א. ואגו:"
 '54678313']
⚠️ Skipping file — no relevant parts found.
Proce

Processing DOCX files: 1320it [00:17, 75.25it/s]

NO required parts in data
parts in data:
['בית המשפט המחוזי בתל אביב - יפו' 'חקיקה שאוזכרה: ' 'גזר – דין'
 '\tביחס לאישום הראשון ' '   \tביחס לאישום השלישי' 'ביחס לאישום החמישי '
 'ביחס לאישום השני ' 'השופטת שרה דותן, אב"ד:' '\tסוף דבר' '54678313'
 'דותן 54678313-1065/08']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 1066-08
Processing תפ"ח 1069-08
NO required parts in data
parts in data:
['בית המשפט המחוזי בבאר שבע' 'חקיקה שאוזכרה: ' 'גזר דין' '19/3/08.'
 'ברוך אזולאי 54678313-1069/08']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 1072-08
NO required parts in data
parts in data:
['בפני: כב\' ס. הנשיא השופטת ר. יפה-כ"ץ, אב"ד'
 "תקנות ההגנה (שעת-חירום), 1945: סע'  85(1)(א)"
 'זכות ערעור תוך 45 יום לביהמ"ש העליון. ' 'יורם צלקובניק, שופט']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 1074-08
Processing תפ"ח 1076-08
NO required parts in data
parts in data:
['בית המשפט המחוזי בבאר שבע' 'נוכחים:   ב"כ המאשימה עו"ד'
 "תקנות ההגנה (שעת-חירום), 1945:

Processing DOCX files: 1338it [00:17, 81.75it/s]

NO required parts in data
parts in data:
['בפני: כב\' ס. הנשיא השופטת ר. יפה-כ"ץ, אב"ד' 'חקיקה שאוזכרה: '
 'זכות ערעור תוך 45 יום לביהמ"ש העליון.' 'יורם צלקובניק, שופט' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 1164-08
NO required parts in data
parts in data:
['בית המשפט המחוזי בבאר שבע' 'גזר דין' '5129371' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 1165-08
Processing תפ"ח 1168-08
Processing תפ"ח 1169-08
NO required parts in data
parts in data:
['בית המשפט המחוזי בבאר שבע' 'הנאשם' 'חקיקה שאוזכרה: ' 'גזר דין'
 'ברוך אזולאי 54678313']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 1171∕08
NO required parts in data
parts in data:
['בפני :' "תקנות ההגנה (שעת-חירום), 1945: סע'  85(1)(א)" 'ג ז ר – ד י ן'
 'זכות ערעור תוך 45 יום לביהמ"ש העליון.' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 1187-08
NO required parts in data
parts in data:
['בית המשפט המחוזי בבאר שבע' 'ג ז' 'הנשיא רויטל יפה-כ"ץ, א

Processing DOCX files: 1347it [00:17, 70.28it/s]

NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'גזר דין'
 'והודעה זכות ערעור לבית המשפט העליון תוך 45 ימים.' '<#4#>' 'החלטה'
 '<#8#>' '5129371' 'עדי שיטרית']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 4904-01-09
NO required parts in data
parts in data:
['בית המשפט המחוזי בחיפה' 'חקיקה שאוזכרה: ' 'גזר דין' '54678313 ']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 5678-01-09
Processing ת"פ 5739-01-09
NO required parts in data
parts in data:
['המאשימה' 'הנאשם' 'ג ז ר   ד י ן' 'טיעוני הצדדים' 'שיקולי ענישה'
 'גזירת הדין' '<#3#>' '5129371' 'חני הורוביץ , שופטת']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 8689-01-09
NO required parts in data
parts in data:
['לפני: כב\' השופט זכריה כספי, סג"נ' 'הרשעת הנאשם'
 'פרטי התסקיר והנסיבות האישיות' 'טיעוני הצדדים' 'שיקולי הענישה' 'הענישה'
 '5129371' '5467831354678313' 'סגן נשיא']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 12131-01-09
Processing ת"פ 18316-01-09
Processing ת"פ 184

Processing DOCX files: 1366it [00:18, 73.01it/s]

NO required parts in data
parts in data:
['נוכחים: ' 'גזר דין' 'לחומרא שקלתי לנאשם:' 'לקולא שקלתי לנאשם:' '<#8#>'
 '5129371' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 33-03-09
Processing ת"פ 9579-03-09
Processing ת"פ 16318-03-09
NO required parts in data
parts in data:
['החלטה' '<#4#>' 'הכרעת דין' '<#6#>' '<#8#>' 'חקיקה שאוזכרה: ' 'גזר דין'
 '<#10#>' '5129371' 'שושנה שטמר, שופטת']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 4000-04-09
NO required parts in data
parts in data:
['בית המשפט המחוזי בחיפה' 'חקיקה שאוזכרה: ' 'גזר דין'
 'האישום הראשון (מתייחס לנאשמים 1 ו- 3): '
 'אישום שני (מתייחס לנאשמים 2 ו- 3):' 'האישום השלישי (מתייחס לנאשם 3):'
 'זכות ערעור לבית המשפט העליון בתוך 45 יום מהיום.' 'רניאל, שופט'
 'אתי עטיאס']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 4320-04-09
Processing תפ"ח 13612-04-09
Processing ת"פ 15377-05-09
NO required parts in data
parts in data:
['בית המשפט המחוזי בחיפה' 'מדינת ישראל' 'נגד' 'כתב האישום : 

Processing DOCX files: 1387it [00:18, 103.85it/s]

NO required parts in data
parts in data:
['בית המשפט המחוזי בחיפה' 'מדינת ישראל' 'נגד' 'חקיקה שאוזכרה: ' 'גזר דין'
 '5129371' 'חני הורוביץ 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 32995-11-09
Processing ת"פ 36897-11-09
Processing ת"פ 65-12-09
NO required parts in data
parts in data:
['מדינת ישראל' 'שלומי בשרן' '<#6#>' 'חקיקה שאוזכרה: ' 'מעשי הנאשם והרשעתו'
 'הנסיבות האישיות והתסקיר' 'טיעוני הצדדים' 'שיקולי הענישה' 'הענישה'
 'זכריה כספי 54678313' 'סגן נשיא']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 20604-12-09
NO required parts in data
parts in data:
['הנאשמים' '2 יוסף עלו - נדון' 'גזר דין לנאשם 1' '5129371' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 24376-12-09
Processing תפ"ח 28761-12-09
NO required parts in data
parts in data:
['המאשימה' 'הנאשם' 'הנאשם בעצמו' 'חקיקה שאוזכרה: ' 'גזר דין'
 'מנחם פינקלשטיין 54678313' 'אב"ד']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 112-09
NO required parts in da

Processing DOCX files: 1410it [00:18, 93.42it/s] 

NO required parts in data
parts in data:
['בית המשפט המחוזי בירושלים' '25 מאי 2011' 'גזר-דין' 'על נאשם 2:'
 'על נאשם 1:' '<#3#>' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 1010-09
NO required parts in data
parts in data:
["כב' השופט יורם צלקובניק " '\nמדינת ישראל '
 "תקנות ההגנה (שעת-חירום), 1945: סע'  85(1)(א)" 'גזר דין'
 'יורם צלקובניק, שופט' '5129371']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 1017-09
Processing תפ"ח 1025-09
Processing תפ"ח 1067-09
Processing תפ"ח 1082-09
NO required parts in data
parts in data:
['בית המשפט המחוזי בבאר שבע' 'חקיקה שאוזכרה: ' 'גזר דין' '54678313'
 'אבידע 54678313']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 1102∕09
NO required parts in data
parts in data:
['בפני :' 'חקיקה שאוזכרה: '
 "פקודת התעבורה [נוסח חדש]: סע'  התוספת הראשונה, 67"
 'הנשיא, השופטת ר. יפה-כ"ץ, אב"ד:' 'זכות ערעור תוך 45 יום לביהמ"ש העליון.'
 'יורם צלקובניק, שופט' '54678313']
⚠️ Skipping file — no relevant parts found.
P

Processing DOCX files: 1420it [00:18, 87.60it/s]

['מדינת ישראל' 'חקיקה שאוזכרה: ' 'גזר דין'
 'כתב-האישום והכרעת-הדין בקצירת האומר' 'טיעוני המאשימה לעונש'
 'טיעוני הסניגור לעונש' 'דברי הנאשם' 'הבקשה לתסקיר שירות-המבחן'
 'שיקולי הענישה ורמתהּ' '...' 'מן הכלל אל הפרט'
 'ניתנה והודעה היום, כ"ו בחשוון התשע"ב, 23/11/2011, במעמד הנוכחים.'
 'החלטה' '<#13#>' '5129371' 'דפנה אבניאלי, שופטת']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 8105-09
Processing ת"פ 8108-09
NO required parts in data
parts in data:
['חאלד אבו זאיד (עציר)' 'חקיקה שאוזכרה: ' 'גזר דין' '5129371'
 'יעל רז-לוי, שופטת']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 8132-09
NO required parts in data
parts in data:
['נוכחים:' 'חקיקה שאוזכרה: ' 'גזר - דין' 'צילה צפת 54678313-8132/09'
 'צילה צפת, שופטת']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 8184-09
NO required parts in data
parts in data:
['גזר דין' 'מרדכי לוי 54678313' 'מרדכי לוי, שופט']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 8185-09
NO required parts in data


Processing DOCX files: 1442it [00:18, 94.47it/s]

Processing ת"פ 4596-01-10
Processing תפ"ח 6027-01-10
NO required parts in data
parts in data:
['12 ספטמבר 2011' 'מדינת ישראל' 'מוחמד לחאם' 'חקיקה שאוזכרה: ' 'גזר דין'
 'זכות ערעור לבית המשפט העליון תוך 45 יום.' 'שרון-נתנאל, שופטת']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 11644-01-10
NO required parts in data
parts in data:
['גזר דין' '5129371' 'רניאל, שופט' 'לאה ']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 19728-01-10
Processing ת"פ 8243-02-10
Processing ת"פ 12001-02-10
Processing ת"פ 12237-02-10
Processing ת"פ 19988-02-10
Processing תפ"ח 22918-02-10
Processing ת"פ 31970-02-10
NO required parts in data
parts in data:
['שי כלידיאן ת.ז xxxxxxxxxx' 'חקיקה שאוזכרה: ' 'העבירות בהן הורשע הנאשם:'
 'תסקיר המבחן והטיעון לעונש:' 'שיקולי בית המשפט לעניין הענישה:'
 'סיכום הענישה וגזר הדין:' '5129371' "ר' שפירא, שופט"]
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 32066-02-10
NO required parts in data
parts in data:
['בית המשפט המחוזי בחיפה' 'מדינת

Processing DOCX files: 1465it [00:19, 96.53it/s]

NO required parts in data
parts in data:
['גזר דין' 'צבי גורפינקל 54678313' 'צבי גורפינקל, שופט']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 43646-03-10
Processing ת"פ 44824-03-10
NO required parts in data
parts in data:
['בית המשפט המחוזי בירושלים' '15 מרץ 2011' 'נ    ג    ד' 'הנאשם'
 'חקיקה שאוזכרה: ' 'גזר דין' '5129371' ' 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 47016-03-10
Processing ת"פ 47072-03-10
NO required parts in data
parts in data:
['nothing' 'מדינת ישראל' 'איימן בן מחמוד חניף ת"ז xxxxxxxxx'
 "הנאשםן מס' 2" "בעניינו של הנאשם מס' 2" '5129371' ' 54678313-/']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 48433-03-10
Processing ת"פ 26833-04-10
NO required parts in data
parts in data:
['בית המשפט המחוזי בירושלים' 'גזר דין' '5129371']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 29585-04-10
NO required parts in data
parts in data:
['המאשימה' 'פתח דבר' 'מעשי הנאשם והרשעתו' 'עמדות הצדדים והטיעונים'
 'שיקולי הענ

Processing DOCX files: 1486it [00:19, 89.82it/s]

NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'חוק כרטיסי חיוב, תשמ"ו-1986: סע\'  16(א), 17'
 'גזר דין' 'הנאשם 2 - ' 'הנאשם 1' 'הנאשם 2' 'אישום ראשון' 'אישום שני '
 'אישום שלישי' 'אישום רביעי' 'ריבוי עבירות' 'אישום שני'
 'ועתה לגזירת העונש' 'הבריחה ממשמורת' '______________________     '
 '____________________' 'סוף דבר' 'שרה דותן 54678313']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 33467-05-10
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'גזר דין' 'כתב האישום המתוקן'
 'האישום, הם היו מסוכסכים ביניהם (להלן: "הסכסוך").' 'הראיות לעונש:'
 '\tכמו כן, הוגשו מסמכים רפואיים של סאמר (ע/3 ו-ע/4).' 'טיעוני הצדדים:'
 ' השימוש בנשק חם כדרך לפתור סכסוכים במשפחה; ' 'שקלנו לחומרא לנאשם:'
 'לקולא שקלנו לנאשם:' 'ההכרעה'
 'לפיכך אנו גוזרים על הנאשם את העונשים הבאים:' '<#4#>' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 36292-05-10
Processing ת"פ 36301-05-10
NO required parts in data
parts in data:
['המאשימה' 'הנאשם ' 'נוכחים:' 'גזר 

Processing DOCX files: 1496it [00:19, 92.35it/s]

NO required parts in data
parts in data:
['נוכחים: ' 'הקדמה:' 'עובדות כתב האישום המתוקן:' 'טיעוני המאשימה לעונש: '
 'טיעוני הנאשם לעונש:' 'דברי הנאשם:' 'תסקיר שירות המבחן:' 'גזר הדין:'
 '<#5#>' 'תאופיק כתילי, סגן נשיא']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 41997-06-10
Processing ת"פ 3805-07-10
NO required parts in data
parts in data:
['גזר דין' '<#5#>' 'תאופיק כתילי, סגן נשיא']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 5187-07-10
Processing ת"פ 9144-07-10
NO required parts in data
parts in data:
['בית המשפט המחוזי בחיפה' 'כתבי עת:' 'חקיקה שאוזכרה: ' 'גזר דין' '5129371'
 "ר' שפירא, שופט"]
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 21770-07-10
Processing תפ"ח 25253-07-10
Processing ת"פ 34813-07-10
NO required parts in data
parts in data:
['גזר דין' '<#5#>' 'תאופיק כתילי, סגן נשיא']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 52268-07-10
Processing ת"פ 52727-07-10
Processing תפ"ח 8∕10
NO required parts in data
parts in 

Processing DOCX files: 1521it [00:19, 96.84it/s]

NO required parts in data
parts in data:
['מדינת ישראל ' "מאזן ג'באלי" 'ניהאד ורדה' 'מוחמד בשארה' 'ראני בשארה'
 'חקיקה שאוזכרה: ' 'מעשי הנאשמים והרשעתם' 'טיעוני הצדדים'
 'עברם הפלילי של הנאשמים' 'הנאשמים בדברם האחרון' 'הפעלת המאסר על-תנאי '
 'שיקולי הענישה' 'על נאשם 1:' 'על נאשם 2:' 'על נאשם 3:' 'על נאשם 4:'
 '5129371' 'סגן נשיא']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 38672-08-10
Processing תפ"ח 38855-08-10
Processing תפ"ח 38865-08-10
Processing תפ"ח 44190-08-10
Processing תפ"ח 47738-08-10
NO required parts in data
parts in data:
['47752-08-10' 'חקיקה שאוזכרה: ' '4 שנות מאסר בפועל. ' '<#4#>' 'החלטה'
 '<#6#>' '5129371' '5467831354678313 ']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 3481-09-10
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'גזר – דין'
 '\tסה"כ 45 חודשי מאסר בפועל, ומניינם מיום מעצרו 22.8.10.' '5129371'
 "קלרה רג'יניאנו, שופטת"]
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 4574-09-10
NO required parts in dat

Processing DOCX files: 1542it [00:19, 93.96it/s]

NO required parts in data
parts in data:
['מדינת ישראל' 'עבד הנא גרבאן (עציר)' 'הרשעת הנאשם'
 'התסקירים והנסיבות האישיות' 'טיעוני הצדדים' 'שיקולי הענישה' 'הענישה'
 '<#4#>' '5129371' 'סגן נשיא']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 21394-11-10
Processing ת"פ 24644-11-10
NO required parts in data
parts in data:
['נוכחים:' 'גזר דין' '54678313' 'רות לורך, שופטת']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 24733-11-10
NO required parts in data
parts in data:
['מדינת ישראל' 'יוסף סלמאן' 'האישום' 'התסקיר' 'טיעוני הצדדים'
 'שיקולי הענישה' 'הענישה' '<#4#>' '5129371' 'סגן נשיא']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 28097-11-10
Processing ת"פ 54232-11-10
NO required parts in data
parts in data:
['בית המשפט המחוזי בחיפה'
 'וולא רובין (ג\'מאל) חלאילה, ת"ז xxxxxxxxxx(עציר)' 'חקיקה שאוזכרה: '
 'גזר דין' '5129371']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 59033-11-10
Processing ת"פ 582-12-10
NO required parts in data
parts i

Processing DOCX files: 1553it [00:20, 96.63it/s]

NO required parts in data
parts in data:
['בית המשפט המחוזי בנצרת' 'חקיקה שאוזכרה: ' 'הקדמה:' 'העובדות:'
 'תסקיר שירות המבחן, לנאשם 1:' 'תסקיר שירות המבחן, לנאשם 2:'
 'טיעוני המאשימה לעונש: ' 'טיעוני הנאשם 1 לעונש:' 'טיעוני הנאשם 2 לעונש:'
 'דברי הנאשמים:' 'גזירת הדין:' 'לגבי הנאשם 2:' '<#6#>'
 'תאופיק כתילי, סגן נשיא']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 41-10
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'הקדמה:' 'העובדות:' 'תסקיר שירות המבחן:'
 'טיעוני המאשימה לעונש: ' 'טיעוני הנאשם לעונש:' 'דברי הנאשם:'
 'גזירת הדין:' '<#6#>' 'תאופיק כתילי, סגן נשיא']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 104-10
NO required parts in data
parts in data:
['בית המשפט המחוזי בירושלים' 'בעניין:  מדינת ישראל' 'גזר דין' '5129371'
 'רפי כרמל, שופט']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 308-10
NO required parts in data
parts in data:
['בית המשפט המחוזי בירושלים' '05 יולי 2010' 'חקיקה שאוזכרה: ' 'גזר דין'
 'נאשם 1:' 'נאשם 2:' '<

Processing DOCX files: 1574it [00:20, 79.26it/s]

NO required parts in data
parts in data:
['מדינת ישראל' 'הנאשם ' 'גזר-דין' 'יורם נועם, שופט']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 43307-01-11
NO required parts in data
parts in data:
['מדינת ישראל' 'מרדכי בוחבוט (עציר)' 'חקיקה שאוזכרה: ' 'גזר-דין'
 'הפרקליטות תמציא למתלונן עותק מגזר-הדין. ' '5129371' 'יורם נועם, שופט']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 53082-01-11
Processing ת"פ 3087-02-11
Processing ת"פ 9152-02-11
Processing ת"פ 17318-02-11
Processing תפ"ח 21643-02-11
Processing ת"פ 21906-02-11
Processing ת"פ 21954-02-11
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'גזר דין' '<#4#>' 'גיליה רביד, שופטת']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 21958-02-11
Processing ת"פ 23194-02-11
NO required parts in data
parts in data:
['במסמך זה הושמטו פרוטוקולים' 'גזר דין' '<#4#>' 'החלטה' '<#8#>'
 'אברהם אברהם, סגן נשיא']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 24617-02-11
NO required parts in dat

Processing DOCX files: 1589it [00:20, 94.07it/s]

NO required parts in data
parts in data:
['בית המשפט המחוזי בתל אביב - יפו' 'מדינת ישראל' 'חמזי מטר' 'גזר דין'
 '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 6138-03-11
NO required parts in data
parts in data:
['נוכחים: בשם המאשימה: עו"ד מורן רייצ\'ס' '\tהנאשם הובא באמצעות הליווי '
 'גזר דין' '<#6#>' '5129371' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 16308-03-11
NO required parts in data
parts in data:
['מדינת ישראל' 'אסלאם עודה (עציר)' 'אחמד גול (עציר)' 'גזר-דין' 'נאשם 1 – '
 'נאשם 2 – ' '5129371' 'יורם נועם, שופט']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 21163-03-11
Processing ת"פ 29800-03-11
Processing ת"פ 32694-03-11
NO required parts in data
parts in data:
['גזר דין (נאשם 15)' '<#3#>' 'צבי גורפינקל, שופט']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 33435-03-11
NO required parts in data
parts in data:
['גזר דין' '<#7#>' 'גיליה רביד, שופטת']
⚠️ Skipping file — no relevant parts found.
Processin

Processing DOCX files: 1608it [00:21, 52.30it/s]

Processing ת"פ 50951-03-11
Processing תפ"ח 57031-03-11
NO required parts in data
parts in data:
['בית המשפט המחוזי בחיפה' 'חקיקה שאוזכרה: ' 'גזר דין' 'רניאל, שופט'
 'אתי עטיאס']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 4986-04-11
NO required parts in data
parts in data:
['בפני: כב\' ס. הנשיא השופטת ר. יפה-כ"ץ, אב"ד' "פקודת מניעת טרור: סע'  2"
 '.' 'הנשיא רויטל יפה-כ"ץ, אב"ד:' 'האישום הראשון:' 'האישום השני:'
 'האישום השלישי:' 'האישום הרביעי:' 'האישום החמישי:'
 '(ב)\tעל אף האמור בסעיף קטן (א) –'
 'זכות ערעור תוך 45 יום לביהמ"ש העליון. ' 'יורם צלקובניק, שופט']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 7550-04-11
NO required parts in data
parts in data:
['בית המשפט המחוזי בחיפה' 'נגד' 'חקיקה שאוזכרה: ' 'גזר-דין' '5129371']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 10161-04-11
NO required parts in data
parts in data:
['מדינת ישראל' 'מוחמד אדואיאת (במעצר)' 'גזר-דין' '5129371'
 'יורם נועם, שופט']
⚠️ Skipping file — no relevant parts found.


Processing DOCX files: 1628it [00:21, 63.89it/s]

NO required parts in data
parts in data:
['בית המשפט המחוזי בירושלים' 'חקיקה שאוזכרה: ' 'גזר דין' '5129371']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 34179-05-11
NO required parts in data
parts in data:
['בית המשפט המחוזי בחיפה' 'מדינת ישראל ' 'נגד' 'גזר דין' '5129371']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 34337-05-11
Processing תפ"ח 34398-05-11
Processing תפ"ח 40489-05-11
NO required parts in data
parts in data:
['נוכחים: בשם המאשימה: עו"ד אורית קורין ' 'ספרות:' 'חקיקה שאוזכרה: '
 'גזר דין' 'תסקיר נפגע  עבירה ' 'טיעוני המאשימה' 'טיעוני הנאשמים  '
 'שיקולי ענישה ' 'על  נאשם 1 ' 'על נאשם 2' '<#6#>' '5129371'
 'שאהר אטרש, שופט']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 41778-05-11
NO required parts in data
parts in data:
['בפני :' 'חקיקה שאוזכרה: ' 'השופט א. ואגו:' 'יורם צלקובניק, שופט'
 '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 45599-05-11
NO required parts in data
parts in data:
['המאשימה' 'בא כוח 

Processing DOCX files: 1660it [00:21, 93.47it/s]

NO required parts in data
parts in data:
['נוכחים:' 'גזר דין' '<#3#>' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 33734-07-11
Processing ת"פ 39983-07-11
NO required parts in data
parts in data:
['גזר דין' 'אשר קולה 54678313' 'אשר קולה, שופט']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 42847-07-11
Processing ת"פ 49299-07-11
Processing ת"פ 49544-07-11
NO required parts in data
parts in data:
['הנאשם' 'חקיקה שאוזכרה: ' 'גזר-דין' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 51829-07-11
Processing ת"פ 22085-08-11
NO required parts in data
parts in data:
['בית המשפט המחוזי בחיפה' 'מדינת ישראל' 'חקיקה שאוזכרה: ' 'גזר דין'
 'זכות ערעור תוך 45 יום מהיום.' '5129371']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 24991-08-11
Processing ת"פ 31215-08-11
Processing ת"פ 32917-08-11
Processing ת"פ 35722-08-11
Processing ת"פ 32597-09-11
NO required parts in data
parts in data:
['בית המשפט המחוזי מרכז' 'מדינת ישראל' 'מיכאל

Processing DOCX files: 1692it [00:21, 116.99it/s]

NO required parts in data
parts in data:
['בית המשפט המחוזי בתל אביב - יפו' 'בעניין:' 'נגד' 'גזר דין' '54678313'
 '5129371']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 12251-11-11
NO required parts in data
parts in data:
['05 נובמבר 2012' 'הנאשמים ' 'גזר דין' '<#3#>' '5467831354678313']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 18482-11-11
Processing ת"פ 24007-11-11
NO required parts in data
parts in data:
['בית המשפט המחוזי בחיפה' 'חקיקה שאוזכרה: ' 'העבירות בהן הורשע הנאשם'
 'הטיעון לעונש' 'שיקולי בית המשפט לעניין הענישה' 'סיכום הענישה וגזר הדין'
 '54678313' "ר' שפירא, שופט"]
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 48367-11-11
Processing תפ"ח 5799-12
Processing ת"פ 6421-12-11
Processing ת"פ 14149-12-11
Processing ת"פ 16487-12-11
NO required parts in data
parts in data:
['בית המשפט המחוזי בחיפה' 'גזר דין' '5129371']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 30100-12-11
Processing ת"פ 30145-12-11
NO required parts in 

Processing DOCX files: 1716it [00:21, 142.55it/s]

Processing ת"פ 13401-03-12
Processing ת"פ 25842-03-12
Processing ת"פ 29129-03-12
Processing ת"פ 35709-03-12
Processing ת"פ 44598-03-12
NO required parts in data
parts in data:
['בית המשפט המחוזי בחיפה' 'חוק העונשין, תשל"ז-1977: סע\'  144(ב)'
 'גזר דין' '1\tגיליון הרשעות קודמות של הנאשם:'
 '\t2.2\tחוות דעת מומחה נשק: ' '3\tעדות אמו של הנאשם:'
 '1\tטיעוני ב"כ המאשימה לעונש:' '2\tטיעוני ב"כ הנאשם:' '54678313'
 'צילה קינן 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 11170-04-12
NO required parts in data
parts in data:
['nothing' 'מדינת ישראל' 'אודי בן מאיר עמר' 'ניסן בן שמעון דדון'
 'חקיקה שאוזכרה: ' 'גזר דין' '5129371' '54678313\t']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 11179-04-12
Processing תפ"ח 14480-04-12
Processing ת"פ 14606-04-12
Processing ת"פ 30672-04-12
Processing ת"פ 31872-04-12
Processing ת"פ 31972-04
Processing ת"פ 31972-04-12
Processing ת"פ 33577-04-12
Processing ת"פ 342-05-12
NO required parts in data
parts in data:
['בית המשפט ה

Processing DOCX files: 1747it [00:22, 121.89it/s]

NO required parts in data
parts in data:
['בית המשפט המחוזי בחיפה' 'בפני ' 'חקיקה שאוזכרה: ' 'פתח דבר:'
 'טענות הצדדים לעונש:' 'גזירת הדין:' '5129371' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 8450-07-12
Processing ת"פ 18907-07
Processing תפ"ח 42731-07-12
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' '.' 'גזר דין' 'ובהתייחס לנאשם:' 'יוסף אלרון 54678313']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 42885-07-12
Processing ת"פ 46079-07-12
NO required parts in data
parts in data:
['הנאשם' 'גזר דין' 'תאופיק כתילי 54678313' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 54104-07-12
Processing ת"פ 8641-08-12
Processing ת"פ 13706-08-12
NO required parts in data
parts in data:
['בפני ' 'מאשימה ' 'נאשם ' 'גזר דין' 'צבי גורפינקל 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 21113-08-12
Processing ת"פ 21128-09-12
NO required parts in data
parts in data:
['הנאשמים' 'חקיקה שאוזכרה: ' 'גזר דין' 

Processing DOCX files: 1771it [00:23, 46.58it/s] 

Processing ת"פ 41805-11-12
Processing תפ"ח 25581-12-12
Processing תפ"ח 32740-12-12
Processing תפ"ח 39974-12-12
Processing ת"פ 5000-12
NO required parts in data
parts in data:
['בית המשפט המחוזי בחיפה' 'בפני ' 'הנאשם'
 'חוק העונשין, תשל"ז-1977: סע\'  144(ב)' '\tמבוא:'
 '\tעובדות כתב האישום המתוקן:' '\tהסדר הטיעון:' '\tתסקיר שירות המבחן:'
 '\tטענות המאשימה:' 'טענות ב"כ הנאשם:' 'גזירת הדין:'
 'כמאל סעב 54678313-5000/12']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 5007-12
Processing ת"פ 5013-12
Processing ת"פ 7860-01-13
Processing ת"פ 11953-01-13
Processing ת"פ 19697-01-13
Processing ת"פ 35259-01-13
NO required parts in data
parts in data:
["מוסטפה ח'דר" 'חקיקה שאוזכרה: ' 'גזר דין (נאשמים 1, 3)'
 'זכות ערעור לבית המשפט העליון בתוך 45 יום. ' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 51122-01-13
Processing ת"פ 59967-01-13
Processing ת"פ 530-02-13
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'גזר דין' 'הנאשם 1: ' 'הנאשם 2:' '<#4#>' 

Processing DOCX files: 1798it [00:23, 69.20it/s]

NO required parts in data
parts in data:
['גזר דין' 'יעקב צבן 54678313' 'יעקב צבן, שופט']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 28360-02-13
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' "פקודת התעבורה [נוסח חדש]: סע'  10(א)" 'גזר דין'
 '5129371']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 35702-02-13
Processing ת"פ 45550-02-13
Processing תפ"ח 49989-02-13
Processing תפ"ח 55800-02-13
NO required parts in data
parts in data:
['בית המשפט המחוזי בחיפה' 'הנאשם' 'חקיקה שאוזכרה: ' 'גזר דין'
 'הודעה זכות הערעור תוך 45 יום לבית המשפט העליון.' 'פיש, שופט' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 8858-03-13
NO required parts in data
parts in data:
['מדינת ישראל' 'אהרן יעקב ריכטר' 'דוד אברהם שם טוב' 'חקיקה שאוזכרה: '
 'גזר-דין בעניינם של נאשמים 2 ו-3' 'נאשם 2 – ' 'נאשם 3 – '
 'זכות ערעור לבית-המשפט העליון בתוך 45 יום מהיום.' '54678313'
 'נוסח מסמך זה כפוף לשינויי ניסוח ועריכה']
⚠️ Skipping file — no relevant parts foun

Processing DOCX files: 1824it [00:23, 81.19it/s]

NO required parts in data
parts in data:
['בית המשפט המחוזי בתל אביב - יפו' 'בפני ' 'בעניין:' 'נגד'
 'חקיקה שאוזכרה: ' 'המסגרת העובדתית והסדר הטיעון' 'הראיות לעונש '
 'טיעוני הצדדים ' 'דבר הנאשמים ' 'ד י ו ן'
 'האירוע השני – עבירת השוד בנסיבות מחמירות  '
 'האירוע השלישי – החזקת מכשירי פריצה וקשירת קשר לפשע'
 'אירוע רביעי - עבירות החזקת הנשק' 'סיכום ביניים – מתחמי הענישה השונים'
 'הנאשמים 1 ו-2 ' 'הנאשם 3' 'מדרג הענישה' 'הנאשם 1 ' 'הנאשם 2' 'חילוט'
 '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 34514-06-14
Processing ת"פ 43990-06-14
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'גזר דין'
 '\tזכות ערעור לבית המשפט העליון בתוך 45 ימים. ' '54678313'
 'אריה רומנוב 54678313']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 793-07-14
Processing תפ"ח 866-07-14
NO required parts in data
parts in data:
["בפני הרכב כב' השופטים:" 'חקיקה שאוזכרה: '
 'חוק סדר הדין הפלילי [נוסח משולב], תשמ"ב-1982' '.' 'מבוא' 'ראיות לעונש'
 'תמצית טענות הצדדים' 'לעניי

Processing DOCX files: 1835it [00:24, 51.75it/s]

Processing ת"פ 16446-10-14
Processing ת"פ 16506-10-14
Processing ת"פ 18510-10-14
Processing ת"פ 26524-10-14
Processing ת"פ 31218-10-14
Processing ת"פ 41611-10-14
NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'גזר דין' '5129371' 'רות לורך 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 51094-10-14
NO required parts in data
parts in data:
['בית המשפט המחוזי בירושלים' 'בפני ' 'בעניין:' 'נגד' 'חקיקה שאוזכרה: '
 'גזר דין' 'כתב האישום והתשובה לכתב האישום' 'תסקיר שירות המבחן'
 'ראיות לעונש' 'טעונות הצדדים' 'הכרעה' '5129371' 'שירלי רנר 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 7498-11-14
🔍 Found 13 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1835it [00:40, 51.75it/s]

🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1840it [01:20,  1.63s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 7498-11-14.csv
Processing ת"פ 9693-11-14
🔍 Found 13 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1841it [01:42,  2.43s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 9693-11-14.csv
Processing ת"פ 12154-11-14
🔍 Found 9 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1842it [02:03,  3.40s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 12154-11-14.csv
Processing ת"פ 21296-11-14
🔍 Found 7 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1843it [02:34,  5.33s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 21296-11-14.csv
Processing ת"פ 37083-11-14
🔍 Found 21 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1844it [03:52, 11.99s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 37083-11-14.csv
Processing ת"פ 40256-11-14


Processing DOCX files: 1845it [03:52, 10.63s/it]

NO required parts in data
parts in data:
["בפני כב' השופט הבכיר אמנון כהן" 'מדינת ישראל' 'נגד' 'חקיקה שאוזכרה: '
 'גזר דין לנאשם 3' 'זכות ערעור לבית המשפט העליון תוך 45 יום.'
 'אמנון כהן 54678313']
⚠️ Skipping file — no relevant parts found.
Processing תפ"ח 43709-11-14
🔍 Found 10 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1845it [04:10, 10.63s/it]

🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1846it [04:21, 13.27s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/תפ"ח 43709-11-14.csv
Processing ת"פ 45597-11-14
🔍 Found 8 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1847it [04:40, 14.12s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 45597-11-14.csv
Processing ת"פ 58148-11-14
🔍 Found 6 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1848it [04:59, 15.12s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 58148-11-14.csv
Processing ת"פ 60637-11-14
🔍 Found 24 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extract

Processing DOCX files: 1849it [06:52, 36.26s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 60637-11-14.csv
Processing ת"פ 6904-12-14
🔍 Found 14 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1850it [07:30, 36.73s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 6904-12-14.csv
Processing ת"פ 12154-12-14
🔍 Found 9 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1851it [08:00, 35.11s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 12154-12-14.csv
Processing ת"פ 23786-12-14


Processing DOCX files: 1852it [08:00, 25.89s/it]

NO required parts in data
parts in data:
['17 נובמבר 2015' 'נוכחים:' 'חקיקה שאוזכרה: ' 'גזר דין' '<#4#>'
 'רות לורך 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 40492-12-14
🔍 Found 7 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1852it [08:20, 25.89s/it]

🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1853it [08:41, 29.77s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 40492-12-14.csv
Processing ת"פ 56232-12-14


Processing DOCX files: 1854it [08:42, 21.89s/it]

NO required parts in data
parts in data:
['חוק העונשין, תשל"ז-1977: סע\'  25, 144(א)רישא, 144(ב)' '.'
 'גזר דין לנאשמים 1 ו - 3' '\tאישום ראשון- לנאשם 1 בלבד' 'אישום שני\t\t'
 'הנאשם 1 ' 'הנאשם 3' '<#4#>' 'אליהו ביתן 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 57787-12-14
NO required parts in data
parts in data:
[' 57612-12-14' 'הנאשמים' 'גזר דין – נאשם 4'
 'מזכירות ביהמ"ש תעביר העתק החלטה זו לממונה לעבודות השירות.' '<#6#>'
 'דוד רוזן , שופט ' '54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 3728-01-15
🔍 Found 10 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1854it [09:00, 21.89s/it]

🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1856it [09:23, 21.21s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 3728-01-15.csv
Processing ת"פ 7317-01-15
🔍 Found 11 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1857it [09:56, 24.05s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 7317-01-15.csv
Processing תפ"ח 16193-01-15
🔍 Found 16 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1858it [10:57, 33.43s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/תפ"ח 16193-01-15.csv
Processing ת"פ 17919-01-15
🔍 Found 23 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1859it [11:49, 38.63s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 17919-01-15.csv
Processing ת"פ 18013-01-15
🔍 Found 12 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1860it [12:21, 36.70s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 18013-01-15.csv
Processing ת"פ 27277-01-15
🔍 Found 22 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1861it [13:18, 42.42s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 27277-01-15.csv
Processing ת"פ 33508-01-15
🔍 Found 5 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1862it [13:42, 37.17s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 33508-01-15.csv
Processing ת"פ 34344-01-15
🔍 Found 11 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1863it [14:06, 33.42s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 34344-01-15.csv
Processing תפ"ח 29738-05-15


Processing DOCX files: 1864it [14:07, 23.85s/it]

NO required parts in data
parts in data:
['מדינת ישראל' 'הנאשמים' 'חקיקה שאוזכרה: ' 'גזר דין'
 'העובדות בהן הודו הנאשמים' 'טיעוני הצדדים' 'הכרעה' 'גזירת דינו של אייל'
 'גזירת דינו של אחמד' 'סוף דבר' 'על אייל הייב:' 'על אחמד חסארמה:'
 'הרכב 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 30191-05-15
Processing ת"פ 36381-05-15
🔍 Found 10 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1864it [14:20, 23.85s/it]

🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1866it [14:34, 19.14s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 36381-05-15.csv
Processing ת"פ 43844-05-15
🔍 Found 6 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1867it [14:54, 19.24s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 43844-05-15.csv
Processing ת"פ 45095-05-15


Processing DOCX files: 1868it [14:54, 14.31s/it]

NO required parts in data
parts in data:
['nothing' 'מדינת ישראל' 'יליד שנת 1984' 'חקיקה שאוזכרה: ' 'גזר דין'
 'יצחק כהן 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 45597-05-15
🔍 Found 16 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1868it [15:10, 14.31s/it]

🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1869it [15:54, 26.66s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 45597-05-15.csv
Processing ת"פ 57220-05-15
🔍 Found 7 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1870it [16:19, 26.17s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 57220-05-15.csv
Processing ת"פ 7165-06-15
🔍 Found 9 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1871it [16:57, 29.42s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 7165-06-15.csv
Processing ת"פ 10549-06-15
🔍 Found 11 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1872it [17:28, 29.99s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 10549-06-15.csv
Processing ת"פ 12109-06-15
🔍 Found 18 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1873it [18:22, 36.94s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 12109-06-15.csv
Processing ת"פ 21801-06-15


Processing DOCX files: 1874it [18:22, 26.16s/it]

NO required parts in data
parts in data:
['חקיקה שאוזכרה: ' 'בעניינו של נאשם 1' '.\t' '₪₪' 'רפי כרמל 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 23851-06-15
🔍 Found 16 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1874it [18:40, 26.16s/it]

🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1875it [19:18, 35.04s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 23851-06-15.csv
Processing ת"פ 54526-06-15
🔍 Found 7 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1877it [19:47, 23.24s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 54526-06-15.csv
Processing ת"פ 14991-07-15
🔍 Found 0 citations in CSV
Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 14991-07-15.csv
Processing ת"פ 32685-07-15
🔍 Found 15 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1877it [20:00, 23.24s/it]

🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1878it [20:33, 30.17s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 32685-07-15.csv
Processing ת"פ 12406-11-15
🔍 Found 23 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1879it [21:31, 38.53s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 12406-11-15.csv
Processing ת"פ 12493-11-15
🔍 Found 6 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1880it [21:44, 30.63s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 12493-11-15.csv
Processing ת"פ 12761-11-15


Processing DOCX files: 1881it [21:44, 21.54s/it]

NO required parts in data
parts in data:
["בפני כב' השופט הבכיר אמנון כהן" 'מדינת ישראל' 'אשר אושר וקנין (עציר)'
 'חקיקה שאוזכרה: ' 'גזר דין' '5129371' 'אמנון כהן 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 13864-11-15
🔍 Found 15 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1882it [22:26, 27.59s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 13864-11-15.csv
Processing ת"פ 19424-11-15
🔍 Found 16 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1883it [23:18, 35.04s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 19424-11-15.csv
Processing ת"פ 20811-11-15
🔍 Found 27 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extract

Processing DOCX files: 1885it [24:26, 31.37s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 20811-11-15.csv
Processing ת"פ 27584-11-15
🔍 Found 0 citations in CSV
Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 27584-11-15.csv
Processing ת"פ 27685-11-15


Processing DOCX files: 1886it [24:26, 22.00s/it]

NO required parts in data
parts in data:
['בית המשפט המחוזי בחיפה' '6.16' 'מדינת ישראל' 'הנאשם' 'חקיקה שאוזכרה: '
 'פתח דבר:' 'עובדות כתב האישום המתוקן:' 'הסדר הטיעון:'
 'תסקיר שירות המבחן:' 'ראיות לעונש:' 'טיעוני המאשימה:' 'טענות ב"כ הנאשם:'
 'דברי הנאשם:' 'גזירת הדין:' 'סיכומו של דבר:' '54678313\t'
 'כמאל סעב 54678313']
⚠️ Skipping file — no relevant parts found.
Processing ת"פ 31334-11-15
🔍 Found 13 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1887it [25:23, 32.60s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 31334-11-15.csv
Processing ת"פ 32819-11-15
🔍 Found 13 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


Processing DOCX files: 1888it [25:57, 32.96s/it]

Processed document saved to: /home/liorkob/M.Sc/thesis/data/5k/gpt/verdict_tagged_citations/ת"פ 32819-11-15.csv
Processing ת"פ 40922-11-15


Processing DOCX files: 1889it [25:57, 23.14s/it]

Processing ת"פ 41326-11-15
🔍 Found 23 citations in CSV
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...
🧠 Sending to GPT for extraction...


### Print results

### get URLS from docx

In [None]:
from docx import Document
import pandas as pd
import re
import os
from docx import Document
import pandas as pd
import re
import os
from docx.oxml.ns import qn
from docx.opc.constants import RELATIONSHIP_TYPE as RT
from bs4 import BeautifulSoup

def normalize_case_name(case_name):
    """Normalize case names by removing extra spaces and fixing slashes."""
    return re.sub(r'\s+', ' ', case_name.replace('∕', '/')).strip()


def normalize_citation(citation):
    """Normalize citation by removing prefixes and standardizing format."""
    if not citation:
        return None
    # Standardize quotes
    citation = citation.replace('״', '"').replace('״', '"').replace('״', '"')
    # Remove extra spaces
    citation = re.sub(r'\s+', ' ', citation).strip()
    # Remove common prefixes, including רע"פ
    citation = re.sub(r'^(ע"?פ|ת"?פ|עפ"?ג|רע"?פ)\s+', '', citation)
    return citation


def extract_citations(text):
    """Extracts legal citations from a single text string."""
    matches = citation_regex.findall(text)
    citations = []
    for match in matches:
        citation = " ".join(filter(None, match)).strip()
        citation = re.sub(r"\s{2,}", " ", citation)
        citation = re.sub(r"^\b[בוור]\b\s*", "", citation)
        citation = re.sub(r"\((.*?)\)\s+\1", r"(\1)", citation)
        if not re.match(r"^על \d+$", citation):
            citations.append(citation)
    return citations[0] if citations else None


def getLinkedText(soup):
    links = []
    for tag in soup.find_all("hyperlink"):
        try:
            links.append({"id": tag["r:id"], "text": tag.text})
        except KeyError:
            pass

    for tag in soup.find_all("instrText"):
        if "HYPERLINK" in tag.text:
            parts = tag.text.split('"')
            if len(parts) > 1:  # Ensure the URL exists before accessing index 1
                url = parts[1]
            else:
                print(f"⚠️ Warning: No valid URL found in HYPERLINK tag: {tag.text}")
                url = None  # Assign None if URL is missing

            temp = tag.parent.next_sibling
            text = ""

            while temp is not None:
                maybe_text = temp.find("t")
                if maybe_text is not None and maybe_text.text.strip() != "":
                    text += maybe_text.text.strip()
                maybe_end = temp.find("fldChar[w:fldCharType]")
                if maybe_end is not None and maybe_end["w:fldCharType"] == "end":
                    break
                temp = temp.next_sibling

            links.append({"id": None, "href": url, "text": text})
    return links
def getURLs(soup, links):
    for link in links:
        if "href" not in link:
            for rel in soup.find_all("Relationship"):
                if rel["Id"] == link["id"]:
                    link["href"] = rel["Target"]
    return links

import zipfile

def extract_hyperlinks(docx_path):
    """
    Extracts hyperlinks from a .docx file and returns a dictionary 
    where the linked text is mapped to its corresponding URL.
    """
    # Open the .docx file as a zip archive
    try:
        archive = zipfile.ZipFile(docx_path, "r")
    except zipfile.BadZipFile:
        print(f"❌ Error: Cannot open {docx_path} (Bad ZIP format)")
        return {}

    # Extract main document XML
    try:
        file_data = archive.read("word/document.xml")
        doc_soup = BeautifulSoup(file_data, "xml")
        linked_text = getLinkedText(doc_soup)
    except KeyError:
        print(f"⚠️ Warning: No document.xml found in {docx_path}")
        return {}

    # Extract hyperlink relationships from _rels/document.xml.rels
    try:
        url_data = archive.read("word/_rels/document.xml.rels")
        url_soup = BeautifulSoup(url_data, "xml")
        links_with_urls = getURLs(url_soup, linked_text)
    except KeyError:
        print(f"⚠️ Warning: No _rels/document.xml.rels found in {docx_path}")
        links_with_urls = linked_text

    # Extract footnotes (if available)
    try:
        footnote_data = archive.read("word/footnotes.xml")
        footnote_soup = BeautifulSoup(footnote_data, "xml")
        footnote_links = getLinkedText(footnote_soup)

        footnote_url_data = archive.read("word/_rels/footnotes.xml.rels")
        footnote_url_soup = BeautifulSoup(footnote_url_data, "xml")
        footnote_links_with_urls = getURLs(footnote_url_soup, footnote_links)

        # Merge footnote links
        links_with_urls += footnote_links_with_urls
    except KeyError:
        pass  # No footnotes found, continue

    # Convert extracted links to a dictionary: {linked_text: URL}
    return {link["text"]: link.get("href", None) for link in links_with_urls}


import pandas as pd
from pathlib import Path

def update_csv_with_links(csv_path, doc_path):
    csv_path = Path(csv_path)  # Convert to Path object if not already
    
    # **Check if CSV is empty before reading**
    if not csv_path.exists() or csv_path.stat().st_size == 0:  
        print(f"Skipping empty or missing file: {csv_path.name}")
        return
    
    try:
        df = pd.read_csv(csv_path)
        
        # **Check if the DataFrame is empty after loading**
        if df.empty:
            print(f"Skipping empty DataFrame: {csv_path.name}")
            return
        
        # Normalize extracted citations
        df["extracted_citation"] = df["paragraph_text"].apply(
            lambda text: normalize_citation(extract_citations(text)) if pd.notna(text) else None
        )
        
        # Normalize citation_links keys
        citation_links = extract_hyperlinks(doc_path)
        normalized_citation_links = {normalize_citation(k): v for k, v in citation_links.items()}
        
        # Assign URLs to citations
        df["link"] = df["extracted_citation"].apply(
            lambda text: normalized_citation_links.get(text, None) if pd.notna(text) else None
        )
        
        df.to_csv(csv_path, index=False)
        print(f"Updated CSV saved to: {csv_path}")

    except pd.errors.EmptyDataError:
        print(f"Skipping {csv_path.name}: CSV file is empty or unreadable.")
        return

    

def find_matching_docx(csv_name, docx_directory):
    normalized_csv_name = normalize_case_name(csv_name.replace('.csv', '.docx'))
    for root, _, files in os.walk(docx_directory):
        for file in files:
            if file.endswith(".docx") and normalize_case_name(file) == normalized_csv_name:
                return os.path.join(root, file)
    return None

def process_all_csvs(csv_directory, docx_directory):
    for root, _, files in os.walk(csv_directory):
        for file in files:
            if file.endswith(".csv"):
                csv_path = os.path.join(root, file)
                docx_path = find_matching_docx(file, docx_directory)
                # if file != 'ת"פ 49772-11-16.csv':
                #     continue
                if docx_path:
                    update_csv_with_links(csv_path, docx_path)
                else:
                    print(f"No matching DOCX found for: {file}")

docx_csv_dir = f"/home/liorkob/M.Sc/thesis/data/drugs/docx_csv"
citations_dir = f"/home/liorkob/M.Sc/thesis/data/drugs/tag_citations"
process_all_csvs(citations_dir, docx_csv_dir)


In [None]:
import os
import pandas as pd

# Define directories and paths
UPDATED_CSV_DIR = "/home/liorkob/M.Sc/thesis/data/drugs/tag_citations"

def verify_updated_files_tag_1():
    """Iterates over updated CSV files and prints missing links for rows where tag is 1."""

    for root, _, files in os.walk(UPDATED_CSV_DIR):
        for file in files:
            if file.endswith(".csv"):
                csv_path = os.path.join(root, file)
                df = pd.read_csv(csv_path)

                # Filter rows with tag = 1 and missing links
                missing_links = df[(df["predicted_label"] == 1) & (df["extracted_citation"].notna()) & (df["link"].isna())]
                
                if not missing_links.empty:
                    print(f"\n🔍 Missing links in file: {file}")
                    for _, row in missing_links.iterrows():
                        print(f"- Citation: {row['extracted_citation']}")
                        print(f"  Paragraph: {row['paragraph_text'][:200]}...")  # Show first 200 chars
                        print("-" * 50)

# Run verification for tag = 1
verify_updated_files_tag_1()
