# Application de la découverte de motifs pour l’analyse de parties de Tennis de Table

https://perso.liris.cnrs.fr/marc.plantevit/ENS/DM/TT_Patterns.pdf

![unknown.png](attachment:unknown.png)

- __F.T.__: joueur à gauche;
- __B.T.__: joueur à droite.

In [1]:
import pandas as pd
import numpy as np
import sys
sys.path.insert(0, './emm')
import EMM as emm
# sys.path.insert(0, './SeqScout/')
# from seqscout.seq_scout import seq_scout


In [23]:
data = pd.read_csv("TT_game.csv", sep = ";",
                   dtype={
                          "Nom": str,
                          "Position": str,
                          "Durée": str,
                          "Genre": str,
                          "Latéralité": str,
                          "Set": str,
                          "Système": str,
                          "Coup": str,
                          "Nbre de coups par point": np.float64,
                          "Durée du point": str,
                          "Score": str,
                          "Points F": np.float64,
                          "Points B": np.float64,
                          "Type de service": str,
                          "Type Coup TK": str,
                          "Zone de jeu": str
}
                  )

In [24]:
data.tail(30)

Unnamed: 0,Nom,Position,Durée,Genre,Latéralité,Set,Système,Coup,Nbre de coups par point,Durée du point,Score,Points F,Points B,Type de service,Type Coup TK,Zone de jeu
492,B.T. (243),0:13:54.016,0:00:00.350,,Coup droit,SET,,B.T.,,,,,,,Attaque / Offensif,M2
493,F.T. (246),0:13:54.366,0:00:00.500,,Revers,SET,,F.T.,,,,,,,Attaque / Offensif,G3
494,B.T. (244),0:13:54.867,0:00:02.018,,Revers,SET,,Serveur Point +,,,Serveur Point + 8-3,8.0,3.0,,Attaque / Offensif,D3
495,B.T. (245),0:13:58.053,0:00:00.984,,Coup droit,SET,,B.T.,,,,,,Latéral droit,,D3
496,F.T. (247),0:13:59.405,0:00:00.350,,Coup droit,SET,,F.T.,,,,,,,Attaque / Offensif,D3
497,B.T. (246),0:13:59.755,0:00:00.133,,Coup droit,SET,,Serveur Point -,,,Serveur Point - 9-3,9.0,3.0,,Attaque / Offensif,M3
498,F.T. (248),0:14:02.608,0:00:02.452,,,SET,,F.T.,,,,,,Latéral droit,,
499,B.T. (247),0:14:05.644,0:00:00.550,,Coup droit,SET,,B.T.,,,,,,,Poussette,M1
500,F.T. (249),0:14:06.195,0:00:01.134,,Coup droit,SET,,Serveur Point -,,,Serveur Point - 9-4,9.0,4.0,,Attaque / Offensif,D3
501,F.T. (250),0:14:09.448,0:00:03.053,,Coup droit,SET,,F.T.,,,,,,Latéral droit,,


In [4]:
data['Position'] = pd.to_timedelta(data['Position'])
data['Durée'] = pd.to_timedelta(data['Durée'])
data['Durée du point'] = pd.to_timedelta(data['Durée du point'])

In [5]:
data["Position"] = (data["Position"] / np.timedelta64(10**9,'ns')).astype(float)
data["Durée"] = (data["Durée"] / np.timedelta64(10**9,'ns')).astype(float)

In [6]:
## data clean

# clean "Set" column
for index, row in data.iterrows():
    val = row["Nom"]
    if val.startswith("SET"):
        set_nb = val.split("(")[1][:1]
    data.at[index, "Set"] = set_nb
    

# delete "Genre" column
data = data.drop(columns=["Genre"])

In [7]:
# comptage des coups pour chaque point joué
c = 0
for index, row in data.iterrows():
    if (row["Coup"] != "F.T.") and (row["Coup"] != "B.T."):
        c = 0
        data.at[index, "Nbre de coups par point"] = c
    else:
        c += 1
        data.at[index, "Nbre de coups par point"] = c
data["Nbre de coups par point"] = pd.to_numeric(data["Nbre de coups par point"]).astype(int)        

In [8]:
 data["Durée du point"] = (data["Durée du point"] / np.timedelta64(10**9,'ns')).astype(float)

In [9]:
# Calcul de la durée de chaque point joué
prec = 0.000
for index, row in data.iterrows():
    if row["Nbre de coups par point"] == 1:
        data.at[index,'Durée du point'] = prec
        prec = 0.000
    else:
        data.at[index, 'Durée du point'] = row["Durée"] + prec
        prec = data.at[index, 'Durée du point']

In [22]:
data.tail(30)

Unnamed: 0,Nom,Position,Durée,Latéralité,Set,Système,Coup,Nbre de coups par point,Durée du point,Score,Points F,Points B,Type de service,Type Coup TK,Zone de jeu
492,B.T. (243),834.016,0.35,Coup droit,5,,B.T.,3,1.0499999999999998,,8.0,2.0,,Attaque / Offensif,M2
493,F.T. (246),834.366,0.5,Revers,5,,F.T.,4,1.5499999999999998,,8.0,2.0,,Attaque / Offensif,G3
494,B.T. (244),834.867,2.018,Revers,5,,Serveur Point +,0,3.568,Serveur Point + 8-3,8.0,3.0,,Attaque / Offensif,D3
495,B.T. (245),838.053,0.984,Coup droit,5,,B.T.,1,3.568,,8.0,3.0,Latéral droit,,D3
496,F.T. (247),839.405,0.35,Coup droit,5,,F.T.,2,0.35,,8.0,3.0,,Attaque / Offensif,D3
497,B.T. (246),839.755,0.133,Coup droit,5,,Serveur Point -,0,0.483,Serveur Point - 9-3,9.0,3.0,,Attaque / Offensif,M3
498,F.T. (248),842.608,2.452,,5,,F.T.,1,0.483,,9.0,3.0,Latéral droit,,
499,B.T. (247),845.644,0.55,Coup droit,5,,B.T.,2,0.55,,9.0,3.0,,Poussette,M1
500,F.T. (249),846.195,1.134,Coup droit,5,,Serveur Point -,0,1.684,Serveur Point - 9-4,9.0,4.0,,Attaque / Offensif,D3
501,F.T. (250),849.448,3.053,Coup droit,5,,F.T.,1,1.684,,9.0,4.0,Latéral droit,,


In [11]:
# clean "Latéralité"
# data["Latéralité"].replace({"Droitier/gaucher": np.NaN}, inplace=True)
# data["Latéralité"].fillna(2, inplace=True)


# for index, row in data.iterrows():
#     if row["Latéralité"] == "Revers":
#         data.at[index, "Latéralité"] = 0
#     elif row["Latéralité"] == "Coup droit":
#         data.at[index, "Latéralité"] = 1
        
# data["Latéralité"] = data["Latéralité"].astype(int)   

# 0: Revers
# 1: Coup droit
# 2: nan

In [12]:
# colonnes Points F et B        
Na_or_Not = data["Points B"].isna()
set_nb = 0
for index in range(data.shape[0]):
    if Na_or_Not[index] :
        data.at[index, "Points B"] = set_nb
    else : 
        set_nb = data.at[index, "Points B"]
        
Na_or_Not = data["Points F"].isna()
set_nb = 0
for index in range(data.shape[0]):
    if Na_or_Not[index] :
        data.at[index, "Points F"] = set_nb
    else : 
        set_nb = data.at[index, "Points F"]

In [13]:
# elimination de la colonne score
# data = data.drop(columns=["Score"])
# elimination de la colonne système
# data = data.drop(columns=["Système"])

In [14]:
# encode coup avec des entiers
# data["Coup"].fillna(2, inplace=True)
# data["Coup"] = data["Coup"].astype(str) 

# c = 0
# flip=True
# for index, row in data.iterrows():
#     if row["Coup"] == "F.T.":
#         data.at[index, "Coup"] = 0
#     elif row["Coup"] == "B.T.":
#         data.at[index, "Coup"] = 1
#     elif row["Coup"].startswith("Serveur"):
#         if c == 2:
#             if flip:
#                 flip = False
#             else:
#                 flip = True
#             c = 0
#         if flip:
#             data.at[index, "Coup"] = 0
#         elif not flip:
#             data.at[index, "Coup"] = 1
#         c += 1
#     elif row["Coup"].startswith("SERVICE"):
#         if flip:
#             data.at[index, "Coup"] = 0
#         elif not flip:
#             data.at[index, "Coup"] = 1
            
# data["Coup"] = data["Coup"].astype(int) 

# 0: F.T.
# 1: B.T.
# 2: nan

In [15]:
# encode type de service avec des entiers
# data["Type de service"].fillna(2, inplace=True)

# for index, row in data.iterrows():
#     if row["Type de service"] == "Latéral droit":
#         data.at[index, "Type de service"] = 0
#     elif row["Type de service"] == "Latéral gauche":
#         data.at[index, "Type de service"] = 1
#     else:
#         data.at[index, "Type de service"] = 2
        
# 0: lateral droit
# 1: lateral gauche
# 2: nan

In [16]:
# encode type de service avec des entiers
# data["Type Coup TK"].fillna(3, inplace=True)

# for index, row in data.iterrows():
#     if row["Type Coup TK"] == "Controle / Résistance":
#         data.at[index, "Type Coup TK"] = 0
#     elif row["Type Coup TK"] == "Attaque / Offensif":
#         data.at[index, "Type Coup TK"] = 1
#     elif row["Type Coup TK"] == "Poussette":
#         data.at[index, "Type Coup TK"] = 2
        
# 0: Controle / Résistance
# 1: Attaque / Offensif
# 2: Poussette
# 3: nan

In [17]:
# # encode zones
# data["Zone de jeu"].fillna(10, inplace=True)

# for index, row in data.iterrows():
#     if row["Zone de jeu"] == "M1":
#         data.at[index, "Zone de jeu"] = 0
#     elif row["Zone de jeu"] == "M2":
#         data.at[index, "Zone de jeu"] = 1
#     elif row["Zone de jeu"] == "M3":
#         data.at[index, "Zone de jeu"] = 2
#     elif row["Zone de jeu"] == "G1":
#         data.at[index, "Zone de jeu"] = 3
#     elif row["Zone de jeu"] == "G2":
#         data.at[index, "Zone de jeu"] = 4
#     elif row["Zone de jeu"] == "G21":
#         data.at[index, "Zone de jeu"] = 5
#     elif row["Zone de jeu"] == "G3":
#         data.at[index, "Zone de jeu"] = 6
#     elif row["Zone de jeu"] == "D1":
#         data.at[index, "Zone de jeu"] = 7
#     elif row["Zone de jeu"] == "D2":
#         data.at[index, "Zone de jeu"] = 8
#     elif row["Zone de jeu"] == "D3":
#         data.at[index, "Zone de jeu"] = 9

# data["Zone de jeu"] = data["Zone de jeu"].astype(int)

In [18]:
# data[data["Type de service"] == "SERVICE"]
# x = data["Zone de jeu"].unique().tolist()
# x
# data[1:30]

In [19]:
data = data.astype(str)

In [20]:
# data = data.dropna()
# target_columns = ['Zone de jeu']
# clf = emm.EMM(width=10, depth=2, evaluation_metric='distribution_cosine')
# clf.search(data, target_cols=target_columns)
# clf.visualise(subgroups=5, cols=3)

In [21]:
data.dtypes

Nom                        object
Position                   object
Durée                      object
Latéralité                 object
Set                        object
Système                    object
Coup                       object
Nbre de coups par point    object
Durée du point             object
Score                      object
Points F                   object
Points B                   object
Type de service            object
Type Coup TK               object
Zone de jeu                object
dtype: object