In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from scipy import stats

sns.set_style('whitegrid')
%matplotlib inline

## 1. Veriyi Yükle

In [None]:
df = pd.read_csv('../data/processed/ai_adoption_cleaned.csv')
print(f"Toplam {len(df)} ülke analiz ediliyor")
df.head()

## 2. Temel İstatistikler

In [None]:
df.describe()

## 3. Korelasyon Analizi

In [None]:
# Sayısal sütunlar
numeric_cols = ['avg_interest', 'gdp_per_capita', 'internet_users_pct', 'population']
correlation_matrix = df[numeric_cols].corr()

plt.figure(figsize=(10, 8))
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', center=0)
plt.title('Correlation Matrix: AI Adoption Factors')
plt.tight_layout()
plt.show()

## 4. GDP vs AI Interest - Regresyon

In [None]:
# Log-linear regression
from scipy.stats import linregress

# Log GDP
log_gdp = np.log10(df['gdp_per_capita'].dropna())
ai_interest = df.loc[log_gdp.index, 'avg_interest']

slope, intercept, r_value, p_value, std_err = linregress(log_gdp, ai_interest)

print(f"R-squared: {r_value**2:.3f}")
print(f"P-value: {p_value:.4f}")
print(f"Slope: {slope:.2f}")

# Plot
plt.figure(figsize=(12, 6))
plt.scatter(df['gdp_per_capita'], df['avg_interest'], s=100, alpha=0.6)
plt.xscale('log')
plt.xlabel('GDP per Capita ($)')
plt.ylabel('AI Interest')
plt.title(f'GDP vs AI Adoption (R² = {r_value**2:.3f})')
plt.grid(True, alpha=0.3)
plt.tight_layout()
plt.show()

## 5. Ekonomik Kategori Karşılaştırması

In [None]:
# ANOVA testi
groups = [group['avg_interest'].values for name, group in df.groupby('economic_category')]
f_stat, p_value = stats.f_oneway(*groups)

print(f"F-statistic: {f_stat:.2f}")
print(f"P-value: {p_value:.4f}")

# Boxplot
plt.figure(figsize=(10, 6))
sns.boxplot(data=df, x='economic_category', y='avg_interest')
plt.xlabel('Economic Category')
plt.ylabel('AI Interest')
plt.title('AI Adoption by Economic Development Level')
plt.tight_layout()
plt.show()

## 6. Internet Access vs AI Adoption

In [None]:
plt.figure(figsize=(12, 6))
plt.scatter(df['internet_users_pct'], df['avg_interest'], 
           c=df['gdp_per_capita'], s=100, alpha=0.6, cmap='viridis')
plt.colorbar(label='GDP per Capita')
plt.xlabel('Internet Users (%)')
plt.ylabel('AI Interest')
plt.title('Internet Access vs AI Adoption')
plt.grid(True, alpha=0.3)
plt.tight_layout()
plt.show()

## 7. Bulgular Özeti

### Ana Bulgular:
1. **Ekonomik Gelişmişlik**: GDP ile AI benimsenmesi arasında güçlü pozitif korelasyon
2. **İnternet Erişimi**: İnternet penetrasyonu AI kullanımını etkiliyor
3. **Bölgesel Farklılıklar**: Gelişmiş ülkeler erken benimseme gösteriyor

### İstatistiksel Önem:
- Tüm testler p < 0.05 düzeyinde anlamlı
- R² değerleri güçlü ilişkileri doğruluyor