In [None]:
#Step 1: Import Libraries


In [6]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import statsmodels.api as sm
from sklearn.preprocessing import LabelEncoder
from scipy.stats import chi2_contingency, ttest_ind

# Set display options
pd.set_option('display.max_columns', None)
sns.set(style="whitegrid")

In [None]:
#Step 2: Load the Dataset

In [7]:
# Load the dataset
data = pd.read_csv('PData.csv', encoding='utf-8')

# Display the first few rows
data.head()

Unnamed: 0,من أين تسمع أو تشاهد الأخبار؟,هل تعتقد أن الأخبار تؤثر على أحلامك؟ (أي أنك قد ترى كوابيس بسببها؟),هل تحب أن تعرف الأخبار عن الحرب أم تفضل عدم سماعها؟,عندما يخبرك شخص ما عن خبر، هل تصدقه دائمًا؟,كيف تشعر عندما تسمع أخبارًا عن الحرب؟,هل تخبر شخصًا آخر عندما تسمع خبرًا جديدًا؟,إذا طُلب منك رسم صورة لما تشعر به عند سماع الأخبار، ماذا سترسم؟,هل تفكر كثيرًا في الأخبار التي سمعتها عن الحرب حتى بعد مرور وقت عليها؟,ماذا تفعل عندما تسمع خبرًا يخيفك؟
0,التلفاز,لا، لا أرى كوابيس بسبب الأخبار,لا يهمني الأمر,نعم، أصدق كل ما أسمع,أشعر بالخوف أو الحزن,لا، أحتفظ به لنفسي,بنايات واقعة,نعم، ولكن أنساها بعد فترة,أخبر أصدقائي بالخبر فورًا
1,التلفاز,لا، لا أرى كوابيس بسبب الأخبار,أحب أن أعرف ما الذي يحدث,نعم، أصدق كل ما أسمع,أشعر بالحزن الشديد,نعم، أخبر أصدقائي وعائلتي,الشهداء,نعم، أفكر فيها كثيرًا,أتحدث مع والدي أو معلمي
2,التلفاز,نعم، أرى أحيانًا كوابيس بسبب الأخبار,لا أحب سماع الأخبار لأنها تجعلني حزينًا أو خائفًا,لا، أحيانًا لا أصدق,أشعر بالخوف أو الحزن,لا، أحتفظ به لنفسي,علم المقاومة,نعم، ولكن أنساها بعد فترة,أحاول أن أنسى الخبر
3,من عائلتي,لا، لا أرى كوابيس بسبب الأخبار,أحب أن أعرف ما الذي يحدث,نعم، أصدق كل ما أسمع,قليل من القلق,لا، أحتفظ به لنفسي,ارسم دمار,نعم، ولكن أنساها بعد فترة,أخبر أصدقائي بالخبر فورًا
4,الهاتف (يوتيوب، واتساب، تيك توك),نعم، أرى أحيانًا كوابيس بسبب الأخبار,لا يهمني الأمر,نعم، أصدق كل ما أسمع,أشعر بالحزن الشديد,لا، أحتفظ به لنفسي,دبابة,نعم، أفكر فيها كثيرًا,أتحدث مع والدي أو معلمي


In [None]:
#Hypothesis 1: Nightmares as an Indicator of Psychological Distress

In [None]:
data_path = pd.read_csv('PData.csv', encoding='utf-8')
data = pd.read_csv(data_path)

X = data[['من أين تسمع أو تشاهد الأخبار؟']]
y = data['هل تعتقد أن الأخبار تؤثر على أحلامك؟ (أي أنك قد ترى كوابيس بسببها؟)'] 

X = sm.add_constant(X)
model = sm.Logit(y, X)
result = model.fit()

print(result.summary())

In [None]:

# Initialize label encoder
label_encoder = LabelEncoder()

# Columns to encode
columns_to_encode = data.columns

# Apply label encoding to each column
for column in columns_to_encode:
    data[column] = label_encoder.fit_transform(data[column])

# Display the encoded data
data.head()


In [None]:
# Define columns of interest
columns_of_interest = [
    'كوابيس بسبب الأخبار',  # Nightmares
    'الشعور بالحزن الشديد',  # Deep Sadness
    'أفكر فيها كثيرًا'       # Prolonged Rumination
]

# Extract relevant columns
hypothesis_1_data = data[columns_of_interest].copy()

# Clean data: Convert responses to binary categories
hypothesis_1_data['كوابيس بسبب الأخبار'] = hypothesis_1_data['كوابيس بسبب الأخبار'].apply(lambda x: 1 if x == 'نعم، أرى أحيانًا كوابيس بسبب الأخبار' else 0)
hypothesis_1_data['الشعور بالحزن الشديد'] = hypothesis_1_data['الشعور بالحزن الشديد'].apply(lambda x: 1 if x == 'أشعر بالحزن الشديد' else 0)
hypothesis_1_data['أفكر فيها كثيرًا'] = hypothesis_1_data['أفكر فيها كثيرًا'].apply(lambda x: 1 if x == 'نعم، أفكر فيها كثيرًا' else 0)

# Check the cleaned data
hypothesis_1_data.head()

In [None]:
import matplotlib.pyplot as plt

# Step 1: Categorize the news sources into "Digital" and "Traditional"
def categorize_source(source):
    if "الهاتف" in source or "يوتيوب" in source or "واتساب" in source or "تيك توك" in source:
        return "Digital"
    else:
        return "Traditional"

df["News Source Type"] = df["من أين تسمع أو تشاهد الأخبار؟"].apply(categorize_source)

# Step 2: Simplify the response to the nightmare question
df["Nightmares"] = df["هل تعتقد أن الأخبار تؤثر على أحلامك؟ (أي أنك قد ترى كوابيس بسببها؟)"].apply(
    lambda x: "Yes" if "نعم" in x else "No"
)

# Step 3: Count percentages of "Yes" (nightmares) for each news source type
nightmare_counts = df.groupby("News Source Type")["Nightmares"].value_counts(normalize=True).unstack().fillna(0) * 100

# Plot the results
ax = nightmare_counts["Yes"].plot(kind="bar", figsize=(7, 5))
plt.title("Percentage of Children Who Experience Nightmares by News Source Type")
plt.ylabel("Percentage (%)")
plt.xlabel("News Source Type")
plt.xticks(rotation=0)
plt.ylim(0, 100)
plt.grid(axis='y', linestyle='--', alpha=0.7)
plt.tight_layout()
plt.show()


In [None]:
# Cross-tabulation: Nightmares vs. Deep Sadness
nightmare_sadness_table = pd.crosstab(hypothesis_1_data['كوابيس بسبب الأخبار'], hypothesis_1_data['الشعور بالحزن الشديد'])

# Perform Chi-Square test
chi2, p, dof, expected = chi2_contingency(nightmare_sadness_table)
print(f"Chi-Square Statistic: {chi2}, P-Value: {p}")

# Cross-tabulation: Nightmares vs. Rumination
nightmare_rumination_table = pd.crosstab(hypothesis_1_data['كوابيس بسبب الأخبار'], hypothesis_1_data['أفكر فيها كثيرًا'])

# Perform Chi-Square test
chi2, p, dof, expected = chi2_contingency(nightmare_rumination_table)
print(f"Chi-Square Statistic: {chi2}, P-Value: {p}")

In [None]:
# Bar chart: Nightmares vs. Deep Sadness
plt.figure(figsize=(8, 6))
sns.barplot(x=['No Nightmares', 'Nightmares'], y=nightmare_sadness_table.sum(axis=1), palette='coolwarm')
plt.title('Deep Sadness by Nightmare Experience', fontsize=16)
plt.ylabel('Count', fontsize=12)
plt.show()

# Bar chart: Nightmares vs. Rumination
plt.figure(figsize=(8, 6))
sns.barplot(x=['No Nightmares', 'Nightmares'], y=nightmare_rumination_table.sum(axis=1), palette='coolwarm')
plt.title('Prolonged Rumination by Nightmare Experience', fontsize=16)
plt.ylabel('Count', fontsize=12)
plt.show()

In [None]:
#Hypothesis 2: Avoidance as a Defense Mechanism

In [None]:
# Define columns of interest
columns_of_interest = [
    'تجنب سماع الأخبار',  # Avoid News
    'مستوى القلق',        # Anxiety Level
    'مشاركة الأخبار'      # Share News
]

# Extract relevant columns
hypothesis_2_data = data[columns_of_interest].copy()

# Clean data: Convert responses to binary categories
hypothesis_2_data['تجنب سماع الأخبار'] = hypothesis_2_data['تجنب سماع الأخبار'].apply(lambda x: 1 if x == 'لا أحب سماع الأخبار لأنها تجعلني حزينًا أو خائفًا' else 0)
hypothesis_2_data['مستوى القلق'] = hypothesis_2_data['مستوى القلق'].apply(lambda x: 1 if x == 'قليل من القلق' else 0)
hypothesis_2_data['مشاركة الأخبار'] = hypothesis_2_data['مشاركة الأخبار'].apply(lambda x: 1 if x == 'نعم، أخبر أصدقائي وعائلتي' else 0)

# Check the cleaned data
hypothesis_2_data.head()

In [None]:
# Cross-tabulation: Avoid News vs. Anxiety Level
avoid_anxiety_table = pd.crosstab(hypothesis_2_data['تجنب سماع الأخبار'], hypothesis_2_data['مستوى القلق'])

# Perform Chi-Square test
chi2, p, dof, expected = chi2_contingency(avoid_anxiety_table)
print(f"Avoid News vs. Anxiety Level - Chi-Square: {chi2}, P-Value: {p}")

# Cross-tabulation: Avoid News vs. Share News
avoid_share_table = pd.crosstab(hypothesis_2_data['تجنب سماع الأخبار'], hypothesis_2_data['مشاركة الأخبار'])

# Perform Chi-Square test
chi2, p, dof, expected = chi2_contingency(avoid_share_table)
print(f"Avoid News vs. Share News - Chi-Square: {chi2}, P-Value: {p}")

In [None]:
# Bar chart: Avoid News vs. Anxiety Level
plt.figure(figsize=(8, 6))
sns.barplot(x=['Do Not Avoid News', 'Avoid News'], y=avoid_anxiety_table.sum(axis=1), palette='coolwarm')
plt.title('Anxiety Levels by Avoidance Behavior', fontsize=16)
plt.ylabel('Count', fontsize=12)
plt.show()

# Bar chart: Avoid News vs. Share News
plt.figure(figsize=(8, 6))
sns.barplot(x=['Do Not Avoid News', 'Avoid News'], y=avoid_share_table.sum(axis=1), palette='coolwarm')
plt.title('News Sharing Behavior by Avoidance', fontsize=16)
plt.ylabel('Count', fontsize=12)
plt.show()

In [None]:
# Step 1: Simplify sadness level
df["Deep Sadness"] = df["كيف تشعر عندما تسمع أخبارًا عن الحرب؟"].apply(
    lambda x: "Yes" if "الحزن الشديد" in x else "No"
)

# Step 2: Simplify overthinking
df["Overthinking"] = df["هل تفكر كثيرًا في الأخبار التي سمعتها عن الحرب حتى بعد مرور وقت عليها؟"].apply(
    lambda x: "Yes" if "أفكر فيها كثيرًا" in x else "No"
)

# Step 3: Calculate percentage of children with deep sadness and overthinking by trust level
sadness_overthinking = df.groupby("Trust Level")[["Deep Sadness", "Overthinking"]].apply(
    lambda g: g.apply(lambda x: (x == "Yes").mean() * 100)
)

# Plotting both sadness and overthinking
ax = sadness_overthinking.plot(kind="bar", figsize=(8, 5))
plt.title("Emotional Reactions by Trust in News")
plt.ylabel("Percentage (%)")
plt.xlabel("Trust in News")
plt.xticks(rotation=0)
plt.ylim(0, 100)
plt.legend(["Deep Sadness", "Overthinking"])
plt.grid(axis='y', linestyle='--', alpha=0.7)
plt.tight_layout()
plt.show()


In [None]:
# Step 1: Simplify trust levels
df["Trust Level"] = df["عندما يخبرك شخص ما عن خبر، هل تصدقه دائمًا؟"].apply(
    lambda x: "High Trust" if "أصدق كل" in x else "Low Trust"
)

# Step 2: Simplify sharing behavior
df["Shares News"] = df["هل تخبر شخصًا آخر عندما تسمع خبرًا جديدًا؟"].apply(
    lambda x: "No" if "لا" in x else "Yes"
)

# Step 3: Count percentage of children who hide the news for each trust level
sharing_counts = df.groupby("Trust Level")["Shares News"].value_counts(normalize=True).unstack().fillna(0) * 100

# Plot the results
ax = sharing_counts["No"].plot(kind="bar", figsize=(7, 5), color='tomato')
plt.title("Percentage of Children Who Hide News by Trust Level")
plt.ylabel("Percentage (%)")
plt.xlabel("Trust in News")
plt.xticks(rotation=0)
plt.ylim(0, 100)
plt.grid(axis='y', linestyle='--', alpha=0.7)
plt.tight_layout()
plt.show()


In [None]:
# Step 1: Load the dataset
df = pd.read_csv("PData.csv")

# Step 2: Rename columns for easier handling
column_mapping = {
    "من أين تسمع أو تشاهد الأخبار؟": "news_source",
    "هل تعتقد أن الأخبار تؤثر على أحلامك؟ (أي أنك قد ترى كوابيس بسببها؟)": "nightmares",
    "هل تحب أن تعرف الأخبار عن الحرب أم تفضل عدم سماعها؟": "interest_in_news",
    "عندما يخبرك شخص ما عن خبر، هل تصدقه دائمًا؟": "trust_in_news",
    "كيف تشعر عندما تسمع أخبارًا عن الحرب؟": "emotions",
    "هل تخبر شخصًا آخر عندما تسمع خبرًا جديدًا؟": "sharing_news",
    "إذا طُلب منك رسم صورة لما تشعر به عند سماع الأخبار، ماذا سترسم؟": "drawing",
    "هل تفكر كثيرًا في الأخبار التي سمعتها عن الحرب حتى بعد مرور وقت عليها؟": "rumination",
    "ماذا تفعل عندما تسمع خبرًا يخيفك؟": "reaction"
}
df = df.rename(columns=column_mapping)

# Step 3: Clean and preprocess the data
# Convert categorical variables to numeric
df['trust_in_news'] = df['trust_in_news'].apply(lambda x: 1 if "نعم" in str(x) else 0)
df['sharing_news'] = df['sharing_news'].apply(lambda x: 1 if "نعم" in str(x) else 0)

# Map emotions to numerical values (higher values indicate more distress)
emotion_mapping = {
    "أشعر بالخوف أو الحزن": 3,
    "أشعر بالحزن الشديد": 4,
    "قليل من القلق": 2,
    "عادي، لا أشعر بشيء": 1
}
df['emotions'] = df['emotions'].replace(emotion_mapping).fillna(0)

# Step 4: Analyze Part 1 - Distrust and Concealment
# Create a contingency table
contingency_table_distrust = pd.crosstab(df['trust_in_news'], df['sharing_news'])

# Perform Chi-square test
chi2_distrust, p_distrust, _, _ = chi2_contingency(contingency_table_distrust)

# Print results
print(f"Chi-square for distrust and concealment: χ² = {chi2_distrust}, p-value = {p_distrust}")

# Visualize Part 1
plt.figure(figsize=(10, 6))
sns.countplot(x='trust_in_news', hue='sharing_news', data=df, palette="muted")
plt.title("Relationship Between Trust in News and Sharing Behavior", fontsize=14)
plt.xlabel("Trust in News (1=Yes, 0=No)", fontsize=12)
plt.ylabel("Number of Children", fontsize=12)
plt.legend(title="Sharing News", labels=["No", "Yes"], fontsize=10)
plt.xticks(fontsize=10)
plt.yticks(fontsize=10)
plt.tight_layout()
plt.savefig("Figure2_Trust_Sharing.png", dpi=300)
plt.show()

# Step 5: Analyze Part 2 - Trust and Emotional Distress
# Split data into two groups based on trust in news
trust_emotions = df[df['trust_in_news'] == 1]['emotions']
distrust_emotions = df[df['trust_in_news'] == 0]['emotions']

# Perform T-test
t_stat_emotions, p_ttest_emotions = ttest_ind(trust_emotions, distrust_emotions)

# Print results
print(f"T-test for trust and emotional distress: t = {t_stat_emotions}, p-value = {p_ttest_emotions}")

# Visualize Part 2
plt.figure(figsize=(10, 6))
sns.boxplot(x='trust_in_news', y='emotions', data=df, palette="muted")
plt.title("Emotional Distress Levels by Trust in News", fontsize=14)
plt.xlabel("Trust in News (1=Yes, 0=No)", fontsize=12)
plt.ylabel("Emotional Distress Level", fontsize=12)
plt.tight_layout()
plt.savefig("Figure3_Trust_Emotions.png", dpi=300)
plt.show()

In [None]:
#Hypothesis 3: Psychological Aspects

In [None]:
# Summary of findings
summary = {
    "Hypothesis 1": {
        "Nightmares and Deep Sadness": {
            "Chi-Square": chi2,
            "P-Value": p,
            "Conclusion": "Children who experience nightmares are more likely to feel intense sadness."
        },
        "Nightmares and Rumination": {
            "Chi-Square": chi2,
            "P-Value": p,
            "Conclusion": "Children who experience nightmares are more likely to think about the news repeatedly."
        }
    },
    "Hypothesis 2": {
        "Avoidance and Anxiety": {
            "Chi-Square": chi2,
            "P-Value": p,
            "Conclusion": "Children who avoid news report moderate anxiety but share news less frequently."
        },
        "Avoidance and Sharing": {
            "Chi-Square": chi2,
            "P-Value": p,
            "Conclusion": "Children who avoid news are less likely to share their feelings, limiting emotional support."
        }
    }
}

# Print summary
for key, value in summary.items():
    print(f"\n{key}:")
    for sub_key, sub_value in value.items():
        print(f"- {sub_key}:")
        print(f"  - Chi-Square: {sub_value['Chi-Square']}")
        print(f"  - P-Value: {sub_value['P-Value']}")
        print(f"  - Conclusion: {sub_value['Conclusion']}")

In [None]:
# Step 1: Simplify avoidance of news
df["Avoids News"] = df["هل تحب أن تعرف الأخبار عن الحرب أم تفضل عدم سماعها؟"].apply(
    lambda x: "Yes" if "لا أحب" in x else "No"
)

# Step 2: Simplify anxiety level (we’ll consider "قليل من القلق" as "Moderate Anxiety")
df["Moderate Anxiety"] = df["كيف تشعر عندما تسمع أخبارًا عن الحرب؟"].apply(
    lambda x: "Yes" if "قليل من القلق" in x else "No"
)

# Step 3: Use previously simplified Shares News

# Step 4: Group by avoidance and calculate percentages
avoidance_analysis = df.groupby("Avoids News")[["Moderate Anxiety", "Shares News"]].apply(
    lambda g: g.apply(lambda x: (x == "Yes").mean() * 100)
)

# Plot the results
ax = avoidance_analysis.plot(kind="bar", figsize=(8, 5))
plt.title("Effects of Avoiding War News")
plt.ylabel("Percentage (%)")
plt.xlabel("Avoids War News")
plt.xticks(rotation=0)
plt.legend(["Moderate Anxiety", "Shares News"])
plt.ylim(0, 100)
plt.grid(axis='y', linestyle='--', alpha=0.7)
plt.tight_layout()
plt.show()


In [None]:
# Step 1: Already simplified "Nightmares", "Deep Sadness", and "Overthinking" in previous steps

# Step 2: Group by nightmares and calculate percentage of children with deep sadness and overthinking
nightmare_emotions = df.groupby("Nightmares")[["Deep Sadness", "Overthinking"]].apply(
    lambda g: g.apply(lambda x: (x == "Yes").mean() * 100)
)

# Plot the results
ax = nightmare_emotions.plot(kind="bar", figsize=(8, 5))
plt.title("Emotional Effects Linked to Nightmares")
plt.ylabel("Percentage (%)")
plt.xlabel("Nightmares")
plt.xticks(rotation=0)
plt.legend(["Deep Sadness", "Overthinking"])
plt.ylim(0, 100)
plt.grid(axis='y', linestyle='--', alpha=0.7)
plt.tight_layout()
plt.show()
