# Spécification de l'intention en Lux

+ **`Lux` fournit un langage flexible pour communiquer votre intention d'analyse au système, afin que `Lux` puisse vous fournir des recommandations meilleures et plus pertinentes. Dans ce didacticiel, nous verrons différentes manières de spécifier l'intention, y compris les attributs et les valeurs qui vous intéressent ou non, les spécificateurs d'énumération, ainsi que les éventuelles contraintes sur l'encodage de la visualisation.**

+ **La principale façon de définir `l'intention` actuelle associée à une trame de données consiste à définir la propriété d'intention de la trame de données et à fournir une liste de spécifications en entrée. Nous décrirons d'abord comment l'intention peut être spécifiée via des descriptions abrégées pratiques sous forme d'entrées de chaîne, puis nous décrirons l'utilisation avancée via l'objet `lux.Clause`.**

# Install Packages

In [None]:
!pip install --upgrade lux-api
#!jupyter labextension install luxwidget

# Import Packages

In [1]:
import pandas as pd
import lux

In [2]:
from google.colab import output
output.enable_custom_widget_manager()

# Descriptions de base
+ **Ensemble de données universitaires.**

In [3]:
df = pd.read_csv("https://raw.githubusercontent.com/lux-org/lux-datasets/master/data/college.csv")
lux.config.default_display = "lux"

In [None]:
df.columns.tolist()

In [None]:
df.info()

# Spécification des attributs d'intérêt
+ **Vous pouvez indiquer que vous êtes intéressé par un attribut, disons `AverageCost`.**

In [33]:
df.intent = ['AverageCost']
df

Button(description='Toggle Pandas/Lux', layout=Layout(top='5px', width='140px'), style=ButtonStyle())

Output()

In [7]:
# Check for the existence of 'FundingModel'
if 'FundingModel' in df.columns:
    print("'FundingModel' column exists in the DataFrame.")
else:
    print("Error: 'FundingModel' column not found in the DataFrame.")


'FundingModel' column exists in the DataFrame.


In [35]:
df.intent = ['FundingModel ']
df

The following issues are ecountered when validating the parsed intent:
- The input attribute 'FundingModel ' does not exist in the DataFrame. 
  Please check your input intent for typos.


Button(description='Toggle Pandas/Lux', layout=Layout(top='5px', width='140px'), style=ButtonStyle())

Output()

In [36]:
possible_attributes = "AverageCost|Expenditure|MedianDebt|MedianEarnings"
df.intent = [possible_attributes,"FundingModel"]
df

Button(description='Toggle Pandas/Lux', layout=Layout(top='5px', width='140px'), style=ButtonStyle())

Output()

# Spécification des valeurs d'intérêt
+ **Dans `Lux`, vous pouvez également spécifier des valeurs particulières correspondant à des sous-ensembles de données qui pourraient vous intéresser. Par exemple, vous pourriez être intéressé uniquement par les collèges situés en Nouvelle-Angleterre.**

In [23]:
df.columns.tolist()

['Name',
 'PredominantDegree',
 'HighestDegree',
 'FundingModel',
 'Region',
 'Geography',
 'AdmissionRate',
 'ACTMedian',
 'SATAverage',
 'AverageCost',
 'Expenditure',
 'AverageFacultySalary',
 'MedianDebt',
 'AverageAgeofEntry',
 'MedianFamilyIncome',
 'MedianEarnings']

In [37]:
df[df["Region"]=="New England"]

Button(description='Toggle Pandas/Lux', layout=Layout(top='5px', width='140px'), style=ButtonStyle())

Output()

In [38]:
df.intent = ["MedianDebt","Region=New England|Southeast|Far West"]
df

Button(description='Toggle Pandas/Lux', layout=Layout(top='5px', width='140px'), style=ButtonStyle())

Output()

# Spécification d'intention avancée via lux.Clause

+ **La description de base basée sur une chaîne constitue un moyen pratique de spécifier l'intention. Cependant, toutes les spécifications ne peuvent pas être exprimées via les descriptions basées sur des chaînes ; des spécifications plus complexes peuvent être exprimées via l'objet `lux.Clause`. Les deux modes de spécification sont essentiellement équivalents, `lux.processor.Parser` analysant le champ de description dans l'objet lux.Clause.**

# Spécification d'attributs ou de valeurs d'intérêt

+ **Pour voir un exemple de la façon dont `lux.Clause` est utilisé, nous réécrivons notre exemple précédent d'expression d'intérêt pour `AverageCost` comme suit :**

In [25]:
df.intent = [lux.Clause(attribute='AverageCost')]
df

Button(description='Toggle Pandas/Lux', layout=Layout(top='5px', width='140px'), style=ButtonStyle())

Output()

In [26]:
df.intent = ['MedianDebt',
            lux.Clause(attribute='Region',filter_op='=', value=['New England','Southeast','Far West'])]
df

Button(description='Toggle Pandas/Lux', layout=Layout(top='5px', width='140px'), style=ButtonStyle())

Output()

# Modification de la fonction d'agrégation appliquée

In [27]:
df.intent = [lux.Clause(attribute='AverageCost', channel='y')]
df

Button(description='Toggle Pandas/Lux', layout=Layout(top='5px', width='140px'), style=ButtonStyle())

Output()

# Spécification des caractères génériques

In [30]:
df.intent = ['AverageCost',lux.Clause('?')]
df

Button(description='Toggle Pandas/Lux', layout=Layout(top='5px', width='140px'), style=ButtonStyle())

Output()

In [31]:
df.intent = ['AverageCost',lux.Clause('?',data_type='quantitative')]
df

Button(description='Toggle Pandas/Lux', layout=Layout(top='5px', width='140px'), style=ButtonStyle())

Output()

In [32]:
df.intent = ['AverageCost',lux.Clause(attribute='Geography',filter_op='=',value='?')]
df

Button(description='Toggle Pandas/Lux', layout=Layout(top='5px', width='140px'), style=ButtonStyle())

Output()