In [3]:
import pandas as pd
import math

class Irt:
    """Classe creata per applicare algoritmi di Item Response Theory ad oggetti che rappresentano le prove d'esame,
       i quali hanno una riga per studente e le colonne rappresentano gli item su cui applicare le funzioni."""
    
    class RangeError(Exception):
       """Eccezione per input fuori dal range"""
       pass
    
    __minVal = 0
    __maxVal = 10
    
    def __init__(self, path):        
        """Il costruttore prende come parametro il path del file csv da analizzare."""        
        self.__df = pd.read_csv(path, index_col = 0) # rendo la prima colonna l'indice della tabella
        self.numItems = len(self.__df.columns) # salvo il numero di items    
        
    def __getNumInput(self,msg):
        """Prendo valore in input assicurandomi che sia intero e compreso nell'intervallo"""
        while True:
            try:
                n = float(input(msg))
                if n < self.__minVal or n > self.__maxVal:
                    raise RangeError
                break
            except ValueError:
                print("L'input non è un numero")
            except RangeError:
                print("L'input non è compreso nell'intervallo (", self.__minVal, "," , self.__maxVal, ")")
        return n
    
    def changeInterval(self, min, max):
        """Modifica l'intervallo di valori delle difficoltà e dei discriminanti"""
        self.__minVal = min
        self.__maxVal = max     
        
    def __getProbInput(self,msg):
        """Prendo valore in input assicurandomi che sia una probabilità, quindi compreso tra lo 0% ed il 100%"""
        while True:
            try:
                n = float(input(msg))
                if n < 0 or n > 100:
                    raise RangeError
                break
            except ValueError:
                print("L'input non è un numero")
            except RangeError:
                print("L'input non è compreso nell'intervallo (", self.__minVal, "," , self.__maxVal, ")")
        return n      
       
    def __getDiff(self, n):
        """Metodo usato per ottenere la lista di difficoltà degli esercizi"""
        
        lsDiff = pd.DataFrame(columns = self.__df.columns , index = ["Difficulty"])
        print("Insersci la difficoltà per i seguenti item: \n")
        for columns in lsDiff:
            lsDiff.loc["Difficulty",columns] = self.__getNumInput(columns + ": ")
        return lsDiff 

    def __getDiscrim(self, n):
        """Metodo usato per ottenere la lista di discriminanti degli esercizi"""        
        
        lsDiscrim = pd.DataFrame(columns = self.__df.columns , index = ["Discriminant"])
        print("Insersci i discriminanti per i seguenti item: \n")
        for columns in lsDiscrim:
            lsDiscrim.loc["Discriminant",columns] = self.__getNumInput(columns + ": ")
        return lsDiscrim

    def __getGuess(self, n):
        """Metodo usato per ottenere la lista di probabilità di indovinare esercizi"""    
        
        lsGuess = pd.DataFrame(columns = self.__df.columns , index = ["Guess"])
        print("Insersci le probabilità di indovinare i seguenti item: \n")
        for columns in lsGuess:
            lsGuess.loc["Guess",columns] = self.__getProbInput(columns + ": ")/100
        return lsGuess  
    
    def __estimateAbility(self, lsDiff):
        """Metodo usato per fornire una stima delle abilità degli studenti tramite una media ponderata"""   
        
        lsAb = pd.DataFrame(index = self.__df.index , columns = ["Ability"])
        for index, row in self.__df.iterrows():
            ability = (row*(lsDiff.loc["Difficulty"])).sum()/lsDiff.loc["Difficulty"].sum()
            lsAb.loc[index,"Ability"] = round(ability, 2)
        return lsAb      
    
    def pl1(self):
        """Metodo usato per applicare il modello PL1 dell'Item Response Theory, esso usa solo il parametro delle difficoltà""" 
        
        lsDiff = self.__getDiff(self.numItems)
        lsAb   = self.__estimateAbility(lsDiff)
        dfProb = pd.DataFrame(columns=self.__df.columns, index=self.__df.index)
        for index, row in dfProb.iterrows():
            for columns in dfProb:
                ability    = lsAb.loc  [index,"Ability"]
                difficulty = lsDiff.loc["Difficulty",columns]
                res = (math.exp(ability - difficulty)) / (1 + math.exp(ability - difficulty))
                dfProb.loc[index, columns] = str(round(res * 100 , 2)) + "%"
        return dfProb

    def pl2(self):
        """Metodo usato per applicare il modello PL1 dell'Item Response Theory, esso usa le difficoltà ed i discriminanti"""  
        
        lsDiff    = self.__getDiff(self.numItems)
        lsAb      = self.__estimateAbility(lsDiff)
        print()
        lsDiscrim = self.__getDiscrim(self.numItems)
        dfProb = pd.DataFrame(columns=self.__df.columns, index=self.__df.index)
        for index, row in dfProb.iterrows():
            for columns in dfProb:
                ability      = lsAb.loc     [index,"Ability"]
                difficulty   = lsDiff.loc   ["Difficulty",columns]      
                discriminant = lsDiscrim.loc["Discriminant",columns]
                res = (math.exp(discriminant * (ability - difficulty))) / (1 + math.exp(discriminant * (ability - difficulty)))
                dfProb.loc[index, columns] = str(round(res * 100 , 2)) + "%"
        return dfProb

    def pl3(self):
        """Metodo usato per applicare il modello PL1 dell'Item Response Theory, esso usa le difficoltà, discriminanti e 
        le probabilità di indovinare gli esercizi"""        
        
        lsDiff    = self.__getDiff(self.numItems)
        lsAb      = self.__estimateAbility(lsDiff)
        print()
        lsDiscrim = self.__getDiscrim(self.numItems)
        print()
        lsGuess   = self.__getGuess(self.numItems)
        dfProb    = pd.DataFrame(columns=self.__df.columns, index=self.__df.index)
        
        for index, row in dfProb.iterrows():
            for columns in dfProb:
                ability      = lsAb.loc     [index,"Ability"]
                difficulty   = lsDiff.loc   ["Difficulty",columns]      
                discriminant = lsDiscrim.loc["Discriminant",columns]            
                guessProb    = lsGuess.loc  ["Guess",columns]
                res = guessProb + (1 - guessProb) * (math.exp(discriminant * (ability - difficulty))) / (1 + math.exp(discriminant * (ability - difficulty)))
                dfProb.loc[index, columns] = str(round(res * 100 , 2)) + "%"
        return dfProb    
    
    def getDf(self):
        """Restituisce il la tabella relativa al file csv utilizzato"""
        return self.__df    

In [5]:
test = Irt("testcsv.csv")
test.pl3()

Insersci la difficoltà per i seguenti item: 

Esercizio1: 5
Esercizio2: 1
Esercizio3: 1

Insersci i discriminanti per i seguenti item: 

Esercizio1: 1
Esercizio2: 1
Esercizio3: 1

Insersci le probabilità di indovinare i seguenti item: 

Esercizio1: 1
Esercizio2: 1
Esercizio3: 1


Unnamed: 0_level_0,Esercizio1,Esercizio2,Esercizio3
Studente,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Marco,91.99%,99.84%,99.84%
Simone,78.63%,99.5%,99.5%
Davide,78.63%,99.5%,99.5%


In [3]:
test.getDf()

Unnamed: 0_level_0,Esercizio1,Esercizio2,Esercizio3
Studente,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Marco,8,7,5
Simone,7,5,4
Davide,6,5,9


In [2]:
class RangeError(Exception):
   """Eccezione per input fuori dal range"""
   pass

def gett(msg):
    """Prendo valore in input assicurandomi che sia intero e compreso nell'intervallo"""
    while True:
        try:
            n = float(input(msg))
            if n < 0 or n > 10:
                raise RangeError
            break
        except ValueError:
            print("L'input non è un numero")
        except RangeError:
            print("L'input non è compreso nell'intervallo")
    return n

gett("viao ")

viao ret
L'input non è un numero
viao 55
L'input non è compreso nell'intervallo
viao 5.4


5.4