# üéì AcademiaOS - Version Gemini

**Automatisation du d√©veloppement de la Grounded Theory avec Gemini**

Ce notebook reproduit les fonctionnalit√©s d'[AcademiaOS](https://github.com/thomasuebi/academia-os) en utilisant l'API Gemini au lieu d'OpenAI.

## Fonctionnalit√©s
- üìö Recherche d'articles acad√©miques via Semantic Scholar
- üìù Codage qualitatif automatis√© (m√©thode Gioia)
- üîç Extraction d'informations structur√©es
- üß† Construction th√©orique automatis√©e
- üìä Visualisation des relations conceptuelles

---

## 1. Installation des d√©pendances

In [None]:
!pip install -q google-generativeai
!pip install -q semanticscholar
!pip install -q PyPDF2
!pip install -q pandas
!pip install -q tqdm
!pip install -q numpy
!pip install -q scikit-learn

## 2. Configuration de l'API Gemini

In [None]:
import google.generativeai as genai
from google.colab import userdata
import json
import re
from typing import List, Dict, Any, Optional, Callable
import pandas as pd
from tqdm.notebook import tqdm
import numpy as np
from sklearn.metrics.pairwise import cosine_similarity

# Configuration de la cl√© API
# Option 1: Via les secrets Colab (recommand√©)
try:
    GOOGLE_API_KEY = userdata.get('GOOGLE_API_KEY')
except:
    # Option 2: Saisie manuelle
    GOOGLE_API_KEY = input("Entrez votre cl√© API Gemini: ")

genai.configure(api_key=GOOGLE_API_KEY)

# Configuration du mod√®le
MODEL_NAME = "gemini-1.5-pro"  # ou "gemini-1.5-flash" pour plus de rapidit√©
EMBEDDING_MODEL = "models/embedding-001"

print(f"‚úÖ API Gemini configur√©e avec le mod√®le: {MODEL_NAME}")

## 3. Service Gemini (√©quivalent √† OpenAIService)

In [None]:
class GeminiService:
    """Service principal pour les appels √† l'API Gemini.
    
    √âquivalent du OpenAIService d'AcademiaOS, adapt√© pour Gemini.
    """
    
    def __init__(self, model_name: str = MODEL_NAME):
        self.model = genai.GenerativeModel(model_name)
        self.generation_config = genai.types.GenerationConfig(
            temperature=0.7,
            top_p=0.95,
            top_k=40,
            max_output_tokens=8192,
        )
    
    def generate(self, prompt: str, temperature: float = 0.7) -> str:
        """G√©n√®re une r√©ponse √† partir d'un prompt."""
        config = genai.types.GenerationConfig(
            temperature=temperature,
            top_p=0.95,
            max_output_tokens=8192,
        )
        response = self.model.generate_content(prompt, generation_config=config)
        return response.text
    
    def generate_json(self, prompt: str, temperature: float = 0.3) -> Any:
        """G√©n√®re une r√©ponse JSON structur√©e."""
        json_prompt = f"""{prompt}

IMPORTANT: R√©ponds UNIQUEMENT avec un JSON valide, sans texte avant ou apr√®s.
Ne commence pas par ```json et ne termine pas par ```.
"""
        response = self.generate(json_prompt, temperature=temperature)
        
        # Nettoyer la r√©ponse
        cleaned = response.strip()
        if cleaned.startswith('```json'):
            cleaned = cleaned[7:]
        if cleaned.startswith('```'):
            cleaned = cleaned[3:]
        if cleaned.endswith('```'):
            cleaned = cleaned[:-3]
        
        try:
            return json.loads(cleaned.strip())
        except json.JSONDecodeError as e:
            print(f"‚ö†Ô∏è Erreur de parsing JSON: {e}")
            print(f"R√©ponse brute: {response[:500]}...")
            return None
    
    def stream_generate(self, prompt: str, callback: Callable[[str], None] = None):
        """G√©n√®re une r√©ponse en streaming."""
        response = self.model.generate_content(prompt, stream=True)
        full_response = ""
        for chunk in response:
            if chunk.text:
                full_response += chunk.text
                if callback:
                    callback(chunk.text)
        return full_response

# Instance globale
gemini_service = GeminiService()
print("‚úÖ GeminiService initialis√©")

## 4. Service d'Embeddings et Ranking

In [None]:
class EmbeddingService:
    """Service pour les embeddings et le ranking s√©mantique.
    
    Remplace OpenAIEmbeddings de LangChain par les embeddings Gemini.
    """
    
    def __init__(self, model: str = EMBEDDING_MODEL):
        self.model = model
    
    def embed_text(self, text: str) -> List[float]:
        """G√©n√®re un embedding pour un texte."""
        result = genai.embed_content(
            model=self.model,
            content=text,
            task_type="retrieval_document"
        )
        return result['embedding']
    
    def embed_query(self, query: str) -> List[float]:
        """G√©n√®re un embedding pour une requ√™te."""
        result = genai.embed_content(
            model=self.model,
            content=query,
            task_type="retrieval_query"
        )
        return result['embedding']
    
    def embed_texts(self, texts: List[str]) -> List[List[float]]:
        """G√©n√®re des embeddings pour plusieurs textes."""
        embeddings = []
        for text in tqdm(texts, desc="G√©n√©ration des embeddings"):
            embeddings.append(self.embed_text(text))
        return embeddings


class RankingService:
    """Service de ranking s√©mantique des articles.
    
    √âquivalent du RankingService d'AcademiaOS.
    """
    
    def __init__(self):
        self.embedding_service = EmbeddingService()
    
    def rank_papers(self, query: str, papers: List[Dict]) -> List[Dict]:
        """Classe les articles par pertinence s√©mantique."""
        if not query or not papers:
            return papers
        
        # Cr√©er les textes √† embedder
        texts = []
        for paper in papers:
            text = f"{paper.get('title', '')} {paper.get('abstract', '')}"
            texts.append(text[:2000])  # Limiter la taille
        
        # G√©n√©rer les embeddings
        query_embedding = self.embedding_service.embed_query(query)
        paper_embeddings = self.embedding_service.embed_texts(texts)
        
        # Calculer les similarit√©s
        similarities = cosine_similarity(
            [query_embedding], 
            paper_embeddings
        )[0]
        
        # Trier par similarit√©
        ranked_indices = np.argsort(similarities)[::-1]
        ranked_papers = [papers[i] for i in ranked_indices]
        
        # Ajouter les scores
        for i, idx in enumerate(ranked_indices):
            ranked_papers[i]['similarity_score'] = float(similarities[idx])
        
        return ranked_papers

# Instances globales
embedding_service = EmbeddingService()
ranking_service = RankingService()
print("‚úÖ Services d'Embedding et Ranking initialis√©s")

## 5. Service de Recherche Acad√©mique

In [None]:
from semanticscholar import SemanticScholar

class SearchService:
    """Service de recherche d'articles acad√©miques via Semantic Scholar."""
    
    def __init__(self):
        self.sch = SemanticScholar()
    
    def search_papers(self, query: str, limit: int = 20) -> List[Dict]:
        """Recherche des articles acad√©miques."""
        try:
            results = self.sch.search_paper(query, limit=limit)
            papers = []
            for paper in results:
                papers.append({
                    'id': paper.paperId,
                    'title': paper.title,
                    'abstract': paper.abstract or '',
                    'year': paper.year,
                    'citation_count': paper.citationCount,
                    'authors': [a.name for a in (paper.authors or [])],
                    'url': paper.url,
                    'venue': getattr(paper, 'venue', ''),
                })
            return papers
        except Exception as e:
            print(f"‚ùå Erreur de recherche: {e}")
            return []
    
    def get_paper_details(self, paper_id: str) -> Optional[Dict]:
        """R√©cup√®re les d√©tails d'un article."""
        try:
            paper = self.sch.get_paper(paper_id)
            return {
                'id': paper.paperId,
                'title': paper.title,
                'abstract': paper.abstract or '',
                'year': paper.year,
                'citation_count': paper.citationCount,
                'authors': [a.name for a in (paper.authors or [])],
                'url': paper.url,
                'tldr': getattr(paper, 'tldr', {}).get('text', '') if hasattr(paper, 'tldr') and paper.tldr else '',
            }
        except Exception as e:
            print(f"‚ùå Erreur: {e}")
            return None

search_service = SearchService()
print("‚úÖ SearchService initialis√©")

## 6. Codage Qualitatif - M√©thode Gioia

In [None]:
class GioiaCodingService:
    """Service de codage qualitatif selon la m√©thode Gioia.
    
    La m√©thode Gioia comprend 3 niveaux de codage:
    1. Codes de premier ordre (concepts √©mergents des donn√©es)
    2. Codes de second ordre (th√®mes agr√©g√©s)
    3. Dimensions agr√©g√©es (concepts th√©oriques)
    """
    
    def __init__(self, gemini_service: GeminiService):
        self.gemini = gemini_service
    
    def initial_coding(self, paper: Dict, remarks: str = "") -> List[str]:
        """Codage de premier ordre d'un article.
        
        Identifie les concepts et th√®mes √©mergents du texte.
        """
        prompt = f"""Tu es un chercheur qualitatif expert utilisant la m√©thode Gioia.

Analyse le texte suivant et identifie les CODES DE PREMIER ORDRE.
Les codes de premier ordre sont des concepts et th√®mes √©mergents directement issus des donn√©es,
exprim√©s dans le langage proche des donn√©es sources.

TITRE: {paper.get('title', 'N/A')}

ABSTRACT: {paper.get('abstract', 'N/A')}

TEXTE COMPLET: {paper.get('fullText', paper.get('abstract', ''))[:8000]}

{f'REMARQUES DU CHERCHEUR: {remarks}' if remarks else ''}

Identifie entre 5 et 15 codes de premier ordre pertinents.
R√©ponds UNIQUEMENT avec un tableau JSON de strings, par exemple:
["code 1", "code 2", "code 3"]
"""
        result = self.gemini.generate_json(prompt)
        return result if isinstance(result, list) else []
    
    def second_order_coding(self, first_order_codes: List[str]) -> Dict[str, List[str]]:
        """Codage de second ordre.
        
        Agr√®ge les codes de premier ordre en th√®mes plus abstraits.
        """
        prompt = f"""Tu es un chercheur qualitatif expert utilisant la m√©thode Gioia.

Voici des CODES DE PREMIER ORDRE issus d'une analyse qualitative:
{json.dumps(first_order_codes, ensure_ascii=False, indent=2)}

Regroupe ces codes en CODES DE SECOND ORDRE (th√®mes plus abstraits).
Les codes de second ordre repr√©sentent des patterns et th√®mes qui √©mergent
de l'agr√©gation des codes de premier ordre.

R√©ponds avec un objet JSON o√π:
- Les cl√©s sont les codes de second ordre (th√®mes)
- Les valeurs sont des tableaux de codes de premier ordre correspondants

Exemple de format:
{{
  "Th√®me A": ["code 1", "code 2"],
  "Th√®me B": ["code 3", "code 4", "code 5"]
}}
"""
        result = self.gemini.generate_json(prompt)
        return result if isinstance(result, dict) else {}
    
    def aggregate_dimensions(self, second_order_codes: Dict[str, List[str]]) -> Dict[str, List[str]]:
        """Agr√©gation en dimensions th√©oriques.
        
        Cr√©e des dimensions th√©oriques √† partir des codes de second ordre.
        """
        prompt = f"""Tu es un chercheur qualitatif expert utilisant la m√©thode Gioia.

Voici des CODES DE SECOND ORDRE issus d'une analyse qualitative:
{json.dumps(second_order_codes, ensure_ascii=False, indent=2)}

Agr√®ge ces codes en DIMENSIONS AGR√âG√âES (concepts th√©oriques de haut niveau).
Les dimensions agr√©g√©es repr√©sentent les construits th√©oriques fondamentaux
qui √©mergent de l'analyse.

R√©ponds avec un objet JSON o√π:
- Les cl√©s sont les dimensions agr√©g√©es
- Les valeurs sont des tableaux de codes de second ordre correspondants

Exemple de format:
{{
  "Dimension Th√©orique 1": ["Th√®me A", "Th√®me B"],
  "Dimension Th√©orique 2": ["Th√®me C", "Th√®me D"]
}}
"""
        result = self.gemini.generate_json(prompt)
        return result if isinstance(result, dict) else {}
    
    def full_coding_process(self, papers: List[Dict], remarks: str = "") -> Dict:
        """Ex√©cute le processus complet de codage Gioia."""
        print("üìù √âtape 1: Codage de premier ordre...")
        all_first_order = []
        for paper in tqdm(papers, desc="Codage initial"):
            codes = self.initial_coding(paper, remarks)
            paper['initial_codes'] = codes
            all_first_order.extend(codes)
        
        # D√©dupliquer
        unique_first_order = list(set(all_first_order))
        print(f"   ‚úÖ {len(unique_first_order)} codes de premier ordre identifi√©s")
        
        print("\nüìù √âtape 2: Codage de second ordre...")
        second_order = self.second_order_coding(unique_first_order)
        print(f"   ‚úÖ {len(second_order)} th√®mes de second ordre cr√©√©s")
        
        print("\nüìù √âtape 3: Dimensions agr√©g√©es...")
        dimensions = self.aggregate_dimensions(second_order)
        print(f"   ‚úÖ {len(dimensions)} dimensions agr√©g√©es cr√©√©es")
        
        return {
            'papers': papers,
            'first_order_codes': unique_first_order,
            'second_order_codes': second_order,
            'aggregate_dimensions': dimensions
        }

gioia_service = GioiaCodingService(gemini_service)
print("‚úÖ GioiaCodingService initialis√©")

## 7. Construction de Mod√®le Th√©orique

In [None]:
class ModelingService:
    """Service de construction de mod√®le th√©orique.
    
    √âquivalent des fonctions de modeling d'AcademiaOS.
    """
    
    def __init__(self, gemini_service: GeminiService):
        self.gemini = gemini_service
    
    def brainstorm_theories(self, coding_results: Dict, remarks: str = "") -> List[Dict]:
        """Identifie les th√©ories applicables aux donn√©es."""
        prompt = f"""Tu es un chercheur expert en th√©orie organisationnelle et sciences sociales.

Analyse ces r√©sultats de codage qualitatif:

DIMENSIONS AGR√âG√âES:
{json.dumps(coding_results.get('aggregate_dimensions', {}), ensure_ascii=False, indent=2)}

CODES DE SECOND ORDRE:
{json.dumps(coding_results.get('second_order_codes', {}), ensure_ascii=False, indent=2)}

{f'CONTEXTE DE RECHERCHE: {remarks}' if remarks else ''}

Identifie 3 √† 5 th√©ories existantes qui pourraient s'appliquer √† ces donn√©es.
Pour chaque th√©orie, explique pourquoi elle est pertinente.

R√©ponds avec un tableau JSON:
[
  {{
    "theory_name": "Nom de la th√©orie",
    "description": "Br√®ve description",
    "relevance": "Pourquoi cette th√©orie s'applique",
    "key_concepts": ["concept1", "concept2"]
  }}
]
"""
        result = self.gemini.generate_json(prompt)
        return result if isinstance(result, list) else []
    
    def identify_relationships(self, coding_results: Dict) -> List[Dict]:
        """Identifie les relations entre concepts."""
        prompt = f"""Analyse ces dimensions et th√®mes issus d'une recherche qualitative:

DIMENSIONS AGR√âG√âES:
{json.dumps(coding_results.get('aggregate_dimensions', {}), ensure_ascii=False, indent=2)}

CODES DE SECOND ORDRE:
{json.dumps(coding_results.get('second_order_codes', {}), ensure_ascii=False, indent=2)}

Identifie les RELATIONS potentielles entre ces concepts.
Pour chaque relation, sp√©cifie:
- Les concepts li√©s
- Le type de relation (causal, corr√©lation, mod√©ration, m√©diation)
- Une hypoth√®se de recherche

R√©ponds avec un tableau JSON:
[
  {{
    "concept_a": "Premier concept",
    "concept_b": "Second concept",
    "relationship_type": "type de relation",
    "hypothesis": "Hypoth√®se formul√©e",
    "direction": "A -> B" ou "A <-> B"
  }}
]
"""
        result = self.gemini.generate_json(prompt)
        return result if isinstance(result, list) else []
    
    def construct_model(self, coding_results: Dict, theories: List[Dict], 
                       relationships: List[Dict], remarks: str = "") -> Dict:
        """Construit un mod√®le th√©orique int√©gr√©."""
        prompt = f"""Tu es un chercheur expert en construction th√©orique.

√Ä partir des √©l√©ments suivants, construis un MOD√àLE TH√âORIQUE int√©gr√©:

DIMENSIONS AGR√âG√âES:
{json.dumps(coding_results.get('aggregate_dimensions', {}), ensure_ascii=False, indent=2)}

TH√âORIES APPLICABLES:
{json.dumps(theories, ensure_ascii=False, indent=2)}

RELATIONS IDENTIFI√âES:
{json.dumps(relationships, ensure_ascii=False, indent=2)}

{f'CONTEXTE: {remarks}' if remarks else ''}

Construis un mod√®le th√©orique coh√©rent qui:
1. Int√®gre les dimensions cl√©s
2. S'appuie sur les th√©ories pertinentes
3. Propose des relations causales testables

R√©ponds avec un objet JSON:
{{
  "model_name": "Nom du mod√®le",
  "core_proposition": "Proposition centrale du mod√®le",
  "constructs": [
    {{
      "name": "Nom du construit",
      "definition": "D√©finition",
      "type": "independent/dependent/mediator/moderator"
    }}
  ],
  "propositions": [
    "P1: Proposition 1",
    "P2: Proposition 2"
  ],
  "theoretical_contribution": "Contribution th√©orique",
  "boundary_conditions": ["Condition 1", "Condition 2"]
}}
"""
        result = self.gemini.generate_json(prompt)
        return result if isinstance(result, dict) else {}
    
    def critique_model(self, model: Dict) -> Dict:
        """Critique le mod√®le th√©orique."""
        prompt = f"""Tu es un reviewer acad√©mique exp√©riment√©.

Critique ce mod√®le th√©orique de mani√®re constructive:
{json.dumps(model, ensure_ascii=False, indent=2)}

√âvalue:
1. La coh√©rence logique
2. L'ancrage th√©orique
3. La testabilit√© des propositions
4. Les limites potentielles
5. Les am√©liorations sugg√©r√©es

R√©ponds avec un objet JSON:
{{
  "overall_assessment": "√âvaluation g√©n√©rale",
  "strengths": ["Force 1", "Force 2"],
  "weaknesses": ["Faiblesse 1", "Faiblesse 2"],
  "suggestions": ["Suggestion 1", "Suggestion 2"],
  "score": 7  // Note sur 10
}}
"""
        result = self.gemini.generate_json(prompt)
        return result if isinstance(result, dict) else {}
    
    def generate_mermaid_diagram(self, model: Dict) -> str:
        """G√©n√®re un diagramme Mermaid du mod√®le."""
        prompt = f"""Cr√©e un diagramme Mermaid pour visualiser ce mod√®le th√©orique:
{json.dumps(model, ensure_ascii=False, indent=2)}

Utilise la syntaxe Mermaid flowchart (graph TD ou graph LR).
Inclus:
- Les construits comme n≈ìuds
- Les relations comme fl√®ches avec labels
- Des couleurs pour distinguer les types de construits

R√©ponds UNIQUEMENT avec le code Mermaid, sans balises de code.
"""
        response = self.gemini.generate(prompt, temperature=0.3)
        # Nettoyer
        cleaned = response.strip()
        if cleaned.startswith('```mermaid'):
            cleaned = cleaned[10:]
        if cleaned.startswith('```'):
            cleaned = cleaned[3:]
        if cleaned.endswith('```'):
            cleaned = cleaned[:-3]
        return cleaned.strip()

modeling_service = ModelingService(gemini_service)
print("‚úÖ ModelingService initialis√©")

## 8. Visualisation

In [None]:
from IPython.display import display, HTML, Markdown

def display_gioia_structure(coding_results: Dict):
    """Affiche la structure de donn√©es Gioia."""
    dimensions = coding_results.get('aggregate_dimensions', {})
    second_order = coding_results.get('second_order_codes', {})
    
    html = "<div style='font-family: Arial, sans-serif;'>"
    html += "<h3>üìä Structure de Codage Gioia</h3>"
    html += "<table style='border-collapse: collapse; width: 100%;'>"
    html += "<tr style='background-color: #f0f0f0;'>"
    html += "<th style='border: 1px solid #ddd; padding: 12px; text-align: left;'>Codes 1er Ordre</th>"
    html += "<th style='border: 1px solid #ddd; padding: 12px; text-align: left;'>Th√®mes 2nd Ordre</th>"
    html += "<th style='border: 1px solid #ddd; padding: 12px; text-align: left;'>Dimensions Agr√©g√©es</th>"
    html += "</tr>"
    
    for dim_name, themes in dimensions.items():
        first_row = True
        for theme in themes:
            first_codes = second_order.get(theme, [])
            codes_html = "<br>".join([f"‚Ä¢ {c}" for c in first_codes[:5]])
            if len(first_codes) > 5:
                codes_html += f"<br>... (+{len(first_codes)-5} autres)"
            
            html += "<tr>"
            html += f"<td style='border: 1px solid #ddd; padding: 8px; font-size: 12px;'>{codes_html}</td>"
            html += f"<td style='border: 1px solid #ddd; padding: 8px;'>{theme}</td>"
            if first_row:
                html += f"<td style='border: 1px solid #ddd; padding: 8px; background-color: #e8f4e8; font-weight: bold;' rowspan='{len(themes)}'>{dim_name}</td>"
                first_row = False
            html += "</tr>"
    
    html += "</table></div>"
    display(HTML(html))

def display_mermaid(mermaid_code: str):
    """Affiche un diagramme Mermaid."""
    html = f"""
    <script src="https://cdn.jsdelivr.net/npm/mermaid/dist/mermaid.min.js"></script>
    <script>mermaid.initialize({{startOnLoad:true}});</script>
    <div class="mermaid">
    {mermaid_code}
    </div>
    """
    display(HTML(html))

def display_model(model: Dict):
    """Affiche le mod√®le th√©orique."""
    md = f"""## üß† {model.get('model_name', 'Mod√®le Th√©orique')}

### Proposition Centrale
{model.get('core_proposition', 'N/A')}

### Construits
"""
    for construct in model.get('constructs', []):
        md += f"- **{construct.get('name')}** ({construct.get('type')}): {construct.get('definition')}\n"
    
    md += "\n### Propositions\n"
    for prop in model.get('propositions', []):
        md += f"- {prop}\n"
    
    md += f"\n### Contribution Th√©orique\n{model.get('theoretical_contribution', 'N/A')}\n"
    
    if model.get('boundary_conditions'):
        md += "\n### Conditions Limites\n"
        for bc in model.get('boundary_conditions', []):
            md += f"- {bc}\n"
    
    display(Markdown(md))

print("‚úÖ Fonctions de visualisation charg√©es")

---
# üöÄ Utilisation - Exemple Complet
---

## √âtape 1: Recherche d'articles

In [None]:
# D√©finir votre sujet de recherche
RESEARCH_TOPIC = "digital transformation organizational change"  # Modifiez selon votre sujet
RESEARCHER_REMARKS = "Je m'int√©resse aux facteurs de succ√®s de la transformation digitale dans les grandes entreprises."

# Rechercher des articles
print(f"üîç Recherche d'articles sur: {RESEARCH_TOPIC}")
papers = search_service.search_papers(RESEARCH_TOPIC, limit=15)
print(f"‚úÖ {len(papers)} articles trouv√©s")

# Afficher les r√©sultats
df = pd.DataFrame(papers)[['title', 'year', 'citation_count', 'authors']]
df['authors'] = df['authors'].apply(lambda x: ', '.join(x[:2]) + ('...' if len(x) > 2 else ''))
display(df)

## √âtape 2: Ranking s√©mantique (optionnel)

In [None]:
# Classer les articles par pertinence
print("üìä Ranking des articles par pertinence s√©mantique...")
ranked_papers = ranking_service.rank_papers(
    query=RESEARCHER_REMARKS,
    papers=papers
)

# Garder les top articles
TOP_N = 10
selected_papers = ranked_papers[:TOP_N]
print(f"\n‚úÖ Top {TOP_N} articles s√©lectionn√©s:")
for i, p in enumerate(selected_papers, 1):
    print(f"{i}. [{p.get('similarity_score', 0):.3f}] {p['title'][:70]}...")

## √âtape 3: Codage Gioia

In [None]:
# Ex√©cuter le processus de codage complet
print("üî¨ Lancement du codage Gioia...\n")
coding_results = gioia_service.full_coding_process(
    papers=selected_papers,
    remarks=RESEARCHER_REMARKS
)

print("\n" + "="*50)
print("üìã R√âSUM√â DU CODAGE")
print("="*50)
print(f"Codes de 1er ordre: {len(coding_results['first_order_codes'])}")
print(f"Th√®mes de 2nd ordre: {len(coding_results['second_order_codes'])}")
print(f"Dimensions agr√©g√©es: {len(coding_results['aggregate_dimensions'])}")

In [None]:
# Visualiser la structure Gioia
display_gioia_structure(coding_results)

## √âtape 4: Construction du mod√®le th√©orique

In [None]:
# Brainstorming de th√©ories applicables
print("üß† Identification des th√©ories applicables...")
theories = modeling_service.brainstorm_theories(coding_results, RESEARCHER_REMARKS)

print(f"\n‚úÖ {len(theories)} th√©ories identifi√©es:")
for t in theories:
    print(f"\nüìö {t.get('theory_name')}")
    print(f"   {t.get('relevance', '')[:100]}...")

In [None]:
# Identification des relations
print("üîó Identification des relations entre concepts...")
relationships = modeling_service.identify_relationships(coding_results)

print(f"\n‚úÖ {len(relationships)} relations identifi√©es:")
for r in relationships[:5]:
    print(f"   {r.get('concept_a')} {r.get('direction', '->')} {r.get('concept_b')}")
    print(f"   Type: {r.get('relationship_type')}")

In [None]:
# Construction du mod√®le
print("üèóÔ∏è Construction du mod√®le th√©orique...")
model = modeling_service.construct_model(
    coding_results=coding_results,
    theories=theories,
    relationships=relationships,
    remarks=RESEARCHER_REMARKS
)

# Afficher le mod√®le
display_model(model)

In [None]:
# Visualisation du mod√®le
print("üìä G√©n√©ration du diagramme...")
mermaid_code = modeling_service.generate_mermaid_diagram(model)
print("\nCode Mermaid g√©n√©r√©:")
print(mermaid_code)

# Afficher le diagramme
display_mermaid(mermaid_code)

## √âtape 5: Critique du mod√®le

In [None]:
# Critique du mod√®le
print("üîç Analyse critique du mod√®le...")
critique = modeling_service.critique_model(model)

print(f"\nüìã CRITIQUE DU MOD√àLE (Score: {critique.get('score', 'N/A')}/10)")
print("="*50)
print(f"\nüìù √âvaluation: {critique.get('overall_assessment', 'N/A')}")

print("\n‚úÖ Points forts:")
for s in critique.get('strengths', []):
    print(f"   ‚Ä¢ {s}")

print("\n‚ö†Ô∏è Points faibles:")
for w in critique.get('weaknesses', []):
    print(f"   ‚Ä¢ {w}")

print("\nüí° Suggestions:")
for sug in critique.get('suggestions', []):
    print(f"   ‚Ä¢ {sug}")

---
## üíæ Export des r√©sultats

In [None]:
# Sauvegarder tous les r√©sultats
import json
from datetime import datetime

results = {
    'metadata': {
        'research_topic': RESEARCH_TOPIC,
        'remarks': RESEARCHER_REMARKS,
        'date': datetime.now().isoformat(),
        'model': MODEL_NAME
    },
    'papers': [{'id': p['id'], 'title': p['title'], 'initial_codes': p.get('initial_codes', [])} 
              for p in selected_papers],
    'coding_results': {
        'first_order_codes': coding_results['first_order_codes'],
        'second_order_codes': coding_results['second_order_codes'],
        'aggregate_dimensions': coding_results['aggregate_dimensions']
    },
    'theories': theories,
    'relationships': relationships,
    'model': model,
    'critique': critique,
    'mermaid_diagram': mermaid_code
}

# Sauvegarder en JSON
filename = f"grounded_theory_results_{datetime.now().strftime('%Y%m%d_%H%M%S')}.json"
with open(filename, 'w', encoding='utf-8') as f:
    json.dump(results, f, ensure_ascii=False, indent=2)

print(f"‚úÖ R√©sultats sauvegard√©s dans: {filename}")

# T√©l√©charger le fichier (Colab)
try:
    from google.colab import files
    files.download(filename)
except:
    print("(T√©l√©chargement automatique non disponible hors Colab)")

---
## üìñ Notes d'utilisation

### Cl√© API Gemini
1. Allez sur [Google AI Studio](https://makersuite.google.com/app/apikey)
2. Cr√©ez une cl√© API
3. Dans Colab: `Secrets` (üîë) ‚Üí Ajoutez `GOOGLE_API_KEY`

### Mod√®les disponibles
- `gemini-1.5-pro` : Plus pr√©cis, recommand√© pour l'analyse qualitative
- `gemini-1.5-flash` : Plus rapide, bon pour les tests

### Personnalisation
- Modifiez `RESEARCH_TOPIC` pour votre sujet
- Ajoutez des `RESEARCHER_REMARKS` pour guider l'analyse
- Ajustez le nombre d'articles avec `limit` et `TOP_N`

### Limitations
- Semantic Scholar peut avoir des limites de requ√™tes
- L'analyse d√©pend de la qualit√© des abstracts disponibles
- Pour de meilleurs r√©sultats, ajoutez le texte complet des articles (`fullText`)