# SpÃ©cification de l'intention en Lux

+ **`Lux` fournit un langage flexible pour communiquer votre intention d'analyse au systÃ¨me, afin que `Lux` puisse vous fournir des recommandations meilleures et plus pertinentes. Dans ce didacticiel, nous verrons diffÃ©rentes maniÃ¨res de spÃ©cifier l'intention, y compris les attributs et les valeurs qui vous intÃ©ressent ou non, les spÃ©cificateurs d'Ã©numÃ©ration, ainsi que les Ã©ventuelles contraintes sur l'encodage de la visualisation.**

+ **La principale faÃ§on de dÃ©finir `l'intention` actuelle associÃ©e Ã  une trame de donnÃ©es consiste Ã  dÃ©finir la propriÃ©tÃ© d'intention de la trame de donnÃ©es et Ã  fournir une liste de spÃ©cifications en entrÃ©e. Nous dÃ©crirons d'abord comment l'intention peut Ãªtre spÃ©cifiÃ©e via des descriptions abrÃ©gÃ©es pratiques sous forme d'entrÃ©es de chaÃ®ne, puis nous dÃ©crirons l'utilisation avancÃ©e via l'objet `lux.Clause`.**

# Install Packages

In [None]:
!pip install --upgrade lux-api
#!jupyter labextension install luxwidget

# Import Packages

In [1]:
import pandas as pd
import lux

In [2]:
from google.colab import output
output.enable_custom_widget_manager()

# Descriptions de base
+ **Ensemble de donnÃ©es universitaires.**

In [3]:
df = pd.read_csv("https://raw.githubusercontent.com/lux-org/lux-datasets/master/data/college.csv")
lux.config.default_display = "lux"

In [None]:
df.columns.tolist()

In [None]:
df.info()

# SpÃ©cification des attributs d'intÃ©rÃªt
+ **Vous pouvez indiquer que vous Ãªtes intÃ©ressÃ© par un attribut, disons `AverageCost`.**

In [33]:
df.intent = ['AverageCost']
df

Button(description='Toggle Pandas/Lux', layout=Layout(top='5px', width='140px'), style=ButtonStyle())

Output()

In [7]:
# Check for the existence of 'FundingModel'
if 'FundingModel' in df.columns:
    print("'FundingModel' column exists in the DataFrame.")
else:
    print("Error: 'FundingModel' column not found in the DataFrame.")


'FundingModel' column exists in the DataFrame.


In [35]:
df.intent = ['FundingModel ']
df

The following issues are ecountered when validating the parsed intent:
- The input attribute 'FundingModel ' does not exist in the DataFrame. 
  Please check your input intent for typos.


Button(description='Toggle Pandas/Lux', layout=Layout(top='5px', width='140px'), style=ButtonStyle())

Output()

In [36]:
possible_attributes = "AverageCost|Expenditure|MedianDebt|MedianEarnings"
df.intent = [possible_attributes,"FundingModel"]
df

Button(description='Toggle Pandas/Lux', layout=Layout(top='5px', width='140px'), style=ButtonStyle())

Output()

# SpÃ©cification des valeurs d'intÃ©rÃªt
+ **Dans `Lux`, vous pouvez Ã©galement spÃ©cifier des valeurs particuliÃ¨res correspondant Ã  des sous-ensembles de donnÃ©es qui pourraient vous intÃ©resser. Par exemple, vous pourriez Ãªtre intÃ©ressÃ© uniquement par les collÃ¨ges situÃ©s en Nouvelle-Angleterre.**

In [23]:
df.columns.tolist()

['Name',
 'PredominantDegree',
 'HighestDegree',
 'FundingModel',
 'Region',
 'Geography',
 'AdmissionRate',
 'ACTMedian',
 'SATAverage',
 'AverageCost',
 'Expenditure',
 'AverageFacultySalary',
 'MedianDebt',
 'AverageAgeofEntry',
 'MedianFamilyIncome',
 'MedianEarnings']

In [37]:
df[df["Region"]=="New England"]

Button(description='Toggle Pandas/Lux', layout=Layout(top='5px', width='140px'), style=ButtonStyle())

Output()

In [38]:
df.intent = ["MedianDebt","Region=New England|Southeast|Far West"]
df

Button(description='Toggle Pandas/Lux', layout=Layout(top='5px', width='140px'), style=ButtonStyle())

Output()

# SpÃ©cification d'intention avancÃ©e via lux.Clause

+ **La description de base basÃ©e sur une chaÃ®ne constitue un moyen pratique de spÃ©cifier l'intention. Cependant, toutes les spÃ©cifications ne peuvent pas Ãªtre exprimÃ©es via les descriptions basÃ©es sur des chaÃ®nes ; des spÃ©cifications plus complexes peuvent Ãªtre exprimÃ©es via l'objet `lux.Clause`. Les deux modes de spÃ©cification sont essentiellement Ã©quivalents, `lux.processor.Parser` analysant le champ de description dans l'objet lux.Clause.**

# SpÃ©cification d'attributs ou de valeurs d'intÃ©rÃªt

+ **Pour voir un exemple de la faÃ§on dont `lux.Clause` est utilisÃ©, nous rÃ©Ã©crivons notre exemple prÃ©cÃ©dent d'expression d'intÃ©rÃªt pour `AverageCost` comme suitÂ :**

In [25]:
df.intent = [lux.Clause(attribute='AverageCost')]
df

Button(description='Toggle Pandas/Lux', layout=Layout(top='5px', width='140px'), style=ButtonStyle())

Output()

In [26]:
df.intent = ['MedianDebt',
            lux.Clause(attribute='Region',filter_op='=', value=['New England','Southeast','Far West'])]
df

Button(description='Toggle Pandas/Lux', layout=Layout(top='5px', width='140px'), style=ButtonStyle())

Output()

# Modification de la fonction d'agrÃ©gation appliquÃ©e

In [27]:
df.intent = [lux.Clause(attribute='AverageCost', channel='y')]
df

Button(description='Toggle Pandas/Lux', layout=Layout(top='5px', width='140px'), style=ButtonStyle())

Output()

# SpÃ©cification des caractÃ¨res gÃ©nÃ©riques

In [30]:
df.intent = ['AverageCost',lux.Clause('?')]
df

Button(description='Toggle Pandas/Lux', layout=Layout(top='5px', width='140px'), style=ButtonStyle())

Output()

In [31]:
df.intent = ['AverageCost',lux.Clause('?',data_type='quantitative')]
df

Button(description='Toggle Pandas/Lux', layout=Layout(top='5px', width='140px'), style=ButtonStyle())

Output()

In [32]:
df.intent = ['AverageCost',lux.Clause(attribute='Geography',filter_op='=',value='?')]
df

Button(description='Toggle Pandas/Lux', layout=Layout(top='5px', width='140px'), style=ButtonStyle())

Output()