In [1]:
import pandas as pd

In [2]:
# Lee el archivo Excel
df = pd.read_excel('dataset/customer.xlsx')

# Convierte las fechas al formato correcto (YYYY-MM-DD)
df['CreateDate'] = pd.to_datetime(df['CreateDate'], format='%d/%m/%Y').dt.strftime('%Y-%m-%d')
df['DateOfBirth'] = pd.to_datetime(df['DateOfBirth'], format='%d/%m/%Y').dt.strftime('%Y-%m-%d')

# Obtiene el nombre de la tabla
table_name = 'customer'

# Define los tipos de datos correspondientes
column_types = {
    'CustId': 'INT',
    'AccountLocation': 'VARCHAR(255)',
    'Title': 'VARCHAR(255)',
    'FirstName': 'VARCHAR(255)',
    'LastName': 'VARCHAR(255)',
    'CreateDate': 'DATE',
    'CountryCode': 'VARCHAR(255)',
    'Language': 'VARCHAR(255)',
    'Status': 'VARCHAR(255)',
    'DateOfBirth': 'DATE',
    'Contact': 'VARCHAR(255)',
    'CustomerGroup': 'VARCHAR(255)'
}

# Genera el script SQL para crear la tabla
create_table_script = f"CREATE TABLE {table_name} (\n"
for column_name, column_type in column_types.items():
    create_table_script += f"    {column_name} {column_type},\n"
create_table_script = create_table_script.rstrip(",\n") + "\n);"

# Genera el script SQL para insertar los datos en la tabla
insert_into_script = f"INSERT INTO {table_name} ({', '.join(column_types.keys())}) VALUES\n"
for index, row in df.iterrows():
    values = ', '.join([f"'{value}'" if isinstance(value, str) else f"{value}" if pd.notnull(value) else 'NULL' for value in row.tolist()])
    insert_into_script += f"({values}),\n"
insert_into_script = insert_into_script.rstrip(",\n") + ";"

# Guarda los scripts SQL en un archivo
with open('customer-mysql.sql', 'w') as file:
    file.write(create_table_script + '\n\n')
    file.write(insert_into_script)

print("Scripts SQL generados y guardados en 'customer-mysql.sql'.")

# Extrae los datos de la tabla en el formato especificado
df['CreateDate'] = pd.to_datetime(df['CreateDate']).dt.strftime('%d/%m/%Y')  # Convierte la fecha al formato DD/MM/YYYY
df['DateOfBirth'] = pd.to_datetime(df['DateOfBirth']).dt.strftime('%d/%m/%Y')  # Convierte la fecha al formato DD/MM/YYYY
formatted_df = df[['CustId', 'AccountLocation', 'Title', 'FirstName', 'LastName', 'CreateDate', 'CountryCode', 'Language', 'Status', 'DateOfBirth', 'Contact', 'CustomerGroup']]

# Muestra los datos
print(formatted_df.to_string(index=False))


Scripts SQL generados y guardados en 'customer-mysql.sql'.
 CustId AccountLocation Title FirstName LastName CreateDate CountryCode Language Status DateOfBirth Contact CustomerGroup
4188499             GIB    Mr     Elvis  Presley 01/11/2011          US       en      A  18/10/1948       Y        Bronze
1191874             GIB    Mr       Jim Morrison 19/09/2008          US       en      A  27/07/1967       Y          Gold
3042166             GIB    Mr     Keith     Moon 11/01/2011         UK        en      A  26/07/1970       Y          Gold
5694730             GIB    Mr     James  Hendrix 10/10/2012          US       en      A  05/04/1976       N        Bronze
4704925             GIB    Mr      Marc    Bolan 26/03/2012         UK        en      A  11/03/1982       Y        Bronze
1569944             GIB  Miss    Janice   Joplin 09/04/2009          US       en      A  22/08/1954       Y          Gold
3531845             GIB    Mr       Bon    Scott 02/04/2011          AU       en      A

In [3]:
# Lee el archivo Excel
df = pd.read_excel('dataset/account.xlsx')

# Obtiene el nombre de la tabla
table_name = 'account'

# Define los tipos de datos correspondientes
column_types = {
    'AccountNo': 'VARCHAR(255)',
    'CustId': 'INT',
    'AccountLocation': 'VARCHAR(255)',
    'CurrencyCode': 'VARCHAR(10)',
    'DailyDepositLimit': 'DECIMAL(10, 2)',
    'StakeScale': 'DECIMAL(10, 2)',
    'SourceProd': 'VARCHAR(255)'
}

# Genera el script SQL para crear la tabla
create_table_script = f"CREATE TABLE {table_name} (\n"
for column_name, column_type in column_types.items():
    create_table_script += f"    {column_name} {column_type},\n"
create_table_script = create_table_script.rstrip(",\n") + "\n);"

# Genera el script SQL para insertar los datos en la tabla
insert_into_script = f"INSERT INTO {table_name} ({', '.join(column_types.keys())}) VALUES\n"
for index, row in df.iterrows():
    values = ', '.join([f"'{value}'" if isinstance(value, str) else f"{value}" if pd.notnull(value) else 'NULL' for value in row.tolist()])
    insert_into_script += f"({values}),\n"
insert_into_script = insert_into_script.rstrip(",\n") + ";"

# Guarda los scripts SQL en un archivo
with open('account-mysql.sql', 'w') as file:
    file.write(create_table_script + '\n\n')
    file.write(insert_into_script)

print("Scripts SQL generados y guardados en 'account-mysql.sql'.")

# Extrae los datos de la tabla en el formato especificado
formatted_df = df[['AccountNo', 'CustId', 'AccountLocation', 'CurrencyCode', 'DailyDepositLimit', 'StakeScale', 'SourceProd']]

# Muestra los datos
print(formatted_df.to_string(index=False))


Scripts SQL generados y guardados en 'account-mysql.sql'.
 AccountNo  CustId AccountLocation CurrencyCode  DailyDepositLimit  StakeScale SourceProd
00357DG    3531845             GIB          GBP                  0        1.00         GM
00497XG    4188499             GIB          GBP                  0        1.00         SB
00692VS    4704925             GIB          USD                  0        2.00         SB
00775SM    2815836             GIB          USD                  0        1.00         SB
00C017      889782             GIB          GBP               1500        0.41         XX
00J381     1191874             GIB          GBP                500        8.00         XX
01148BP    1569944             GIB          GBP                  0        8.00         XX
01152SJ    1965214             GIB          USD                  0        1.00         PO
01196ZZ    3042166             GIB          EUR                  0        8.00         SB
01284UW    5694730             GIB        

In [4]:
# Lee el archivo Excel
df = pd.read_excel('dataset/product.xlsx')

# Llena los valores nulos en CLASSID y CATEGORYID con 'NULL'
df['CLASSID'] = df['CLASSID'].fillna('NULL')
df['CATEGORYID'] = df['CATEGORYID'].fillna('NULL')

# Obtiene el nombre de la tabla
table_name = 'product'

# Define los tipos de datos correspondientes
column_types = {
    'CLASSID': 'VARCHAR(255)',
    'CATEGORYID': 'VARCHAR(255)',
    'product': 'VARCHAR(255)',
    'sub_product': 'VARCHAR(255)',
    'description': 'VARCHAR(255)',
    'bet_or_play': 'INT'
}

# Genera el script SQL para crear la tabla
create_table_script = f"CREATE TABLE {table_name} (\n"
for column_name, column_type in column_types.items():
    create_table_script += f"    {column_name} {column_type},\n"
create_table_script = create_table_script.rstrip(",\n") + "\n);"

# Genera el script SQL para insertar los datos en la tabla
insert_into_script = f"INSERT INTO {table_name} ({', '.join(column_types.keys())}) VALUES\n"
for index, row in df.iterrows():
    values = ', '.join([f"'{value}'" if isinstance(value, str) and value != 'NULL' else f"{value}" if pd.notnull(value) else 'NULL' for value in row.tolist()])
    insert_into_script += f"({values}),\n"
insert_into_script = insert_into_script.rstrip(",\n") + ";"

# Guarda los scripts SQL en un archivo
with open('product-mysql.sql', 'w') as file:
    file.write(create_table_script + '\n\n')
    file.write(insert_into_script)

print("Scripts SQL generados y guardados en 'product-mysql.sql'.")

# Extrae los datos de la tabla en el formato especificado
formatted_df = df[['CLASSID', 'CATEGORYID', 'product', 'sub_product', 'description', 'bet_or_play']]

# Muestra los datos
print(formatted_df.to_string(index=False))


Scripts SQL generados y guardados en 'product-mysql.sql'.
   CLASSID  CATEGORYID     product             sub_product               description  bet_or_play
22522_SALE       22522       Vegas             Vegas Bonus                     Vegas            0
  BETC_RET           0  Sportsbook                 Various           Bet Corrections            0
  BONS_GAM           0       Games             Games Bonus               Games Bonus            0
 BONS_SPRB           0  Sportsbook                SB Bonus                  SB Bonus            0
 BONS_VEGA           0       Vegas             Vegas Bonus               Vegas Bonus            0
  CSH_PPAL           0 Adjustments      Banking Correction                    PayPal            0
 GWIL_SPRT           0  Sportsbook       Goodwill Payments         Goodwill Payments            0
      NULL           0  Sportsbook                 Various     Manual Bets (Various)            1
         1           5  Sportsbook                Football  

In [3]:
# Lee el archivo Excel
df = pd.read_excel('betting.xlsx')

# Convierte las fechas al formato correcto (YYYY-MM-DD)
df['BetDate'] = pd.to_datetime(df['BetDate'], format='%d/%m/%Y').dt.strftime('%Y-%m-%d')

# Obtiene el nombre de la tabla
table_name = 'betting'

# Define los tipos de datos correspondientes
column_types = {
    'AccountNo': 'VARCHAR(255)',
    'BetDate': 'DATE',
    'ClassId': 'VARCHAR(255)',
    'CategoryId': 'INT',
    'Source': 'VARCHAR(255)',
    'BetCount': 'INT',
    'Bet_Amt': 'DECIMAL(10, 4)',  
    'Win_Amt': 'DECIMAL(10, 4)', 
    'Product': 'VARCHAR(255)'
}

# Genera el script SQL para crear la tabla
create_table_script = f"CREATE TABLE {table_name} (\n"
for column_name, column_type in column_types.items():
    create_table_script += f"    {column_name} {column_type},\n"
create_table_script = create_table_script.rstrip(",\n") + "\n);"

# Genera el script SQL para insertar los datos en la tabla
insert_into_script = f"INSERT INTO {table_name} ({', '.join(column_types.keys())}) VALUES\n"
for index, row in df.iterrows():
    values = ', '.join([f"'{value}'" if isinstance(value, str) else f"{value}" if pd.notnull(value) else 'NULL' for value in row.tolist()])
    insert_into_script += f"({values}),\n"
insert_into_script = insert_into_script.rstrip(",\n") + ";"

# Guarda los scripts SQL en un archivo
with open('betting-mysql.sql', 'w') as file:
    file.write(create_table_script + '\n\n')
    file.write(insert_into_script)

print("Scripts SQL generados y guardados en 'betting-mysql.sql'.")

# Extrae los datos de la tabla en el formato especificado
df['BetDate'] = pd.to_datetime(df['BetDate']).dt.strftime('%d/%m/%Y')  # Convierte la fecha al formato DD/MM/YYYY
formatted_df = df[['AccountNo', 'BetDate', 'ClassId', 'CategoryId', 'Source', 'BetCount', 'Bet_Amt', 'Win_Amt', 'Product']]

# Muestra los datos
print(formatted_df.to_string(index=False))

Scripts SQL generados y guardados en 'betting-mysql.sql'.
 AccountNo    BetDate    ClassId  CategoryId Source  BetCount    Bet_Amt    Win_Amt     Product
01196ZZ    24/11/2012 22512_XFER       22512      I       189 29364.0000 28947.0000       Vegas
00357DG    27/11/2012 22512_XFER       22512      I      1415 19835.0000 18639.1500       Vegas
00357DG    24/11/2012 22512_XFER       22512      I      2026 19280.8000 17904.5000       Vegas
01196ZZ    19/12/2012 22512_XFER       22512      I       151 17301.0000 16956.0000       Vegas
01284UW    21/10/2012         46           5      I        25 16850.0000  3319.1100  Sportsbook
00357DG    26/11/2012 22512_XFER       22512      I      1859 16078.5000 12299.5200       Vegas
00357DG    17/11/2012 22512_XFER       22512      I      1469 15204.0000 14758.8000       Vegas
00357DG    30/11/2012 22512_XFER       22512      I       920 15000.0000 10169.8000       Vegas
01284UW    14/10/2012         46           5      I        25 13700.0000 10781

In [5]:
df3 = pd.read_excel('betting.xlsx')

df3.head()

df3['AccountNo'] = df3['AccountNo'].str.strip()

In [6]:
print(tuple(df3.columns))

('AccountNo', 'BetDate', 'ClassId', 'CategoryId', 'Source', 'BetCount', 'Bet_Amt', 'Win_Amt', 'Product')


In [7]:
df3_list = []
for i in range(len(df3)):
    temp3 = (tuple(df3.loc[i]))
    df3_list.append(temp3)


df3_list

[('01196ZZ',
  Timestamp('2012-11-24 00:00:00'),
  '22512_XFER',
  22512,
  'I',
  189,
  29364.0,
  28947.0,
  'Vegas'),
 ('00357DG',
  Timestamp('2012-11-27 00:00:00'),
  '22512_XFER',
  22512,
  'I',
  1415,
  19835.0,
  18639.15,
  'Vegas'),
 ('00357DG',
  Timestamp('2012-11-24 00:00:00'),
  '22512_XFER',
  22512,
  'I',
  2026,
  19280.8,
  17904.5,
  'Vegas'),
 ('01196ZZ',
  Timestamp('2012-12-19 00:00:00'),
  '22512_XFER',
  22512,
  'I',
  151,
  17301.0,
  16956.0,
  'Vegas'),
 ('01284UW',
  Timestamp('2012-10-21 00:00:00'),
  46,
  5,
  'I',
  25,
  16850.0,
  3319.11,
  'Sportsbook'),
 ('00357DG',
  Timestamp('2012-11-26 00:00:00'),
  '22512_XFER',
  22512,
  'I',
  1859,
  16078.5,
  12299.52,
  'Vegas'),
 ('00357DG',
  Timestamp('2012-11-17 00:00:00'),
  '22512_XFER',
  22512,
  'I',
  1469,
  15204.0,
  14758.8,
  'Vegas'),
 ('00357DG',
  Timestamp('2012-11-30 00:00:00'),
  '22512_XFER',
  22512,
  'I',
  920,
  15000.0,
  10169.8,
  'Vegas'),
 ('01284UW',
  Timestamp('20

In [8]:
file = open('Betting.txt','w')

for tuple in df3_list:
    file.write(str(tuple) + ',' + '\n')

file.close()