In [1]:
import yaml
import sys
import os
import datetime
try:
    from yaml import CLoader as Loader
except:
    from yaml import Loader
import glob
from tqdm import tqdm
from tqdm.contrib.concurrent import process_map

base = '../../'
n_cores = os.cpu_count()

def read_file(file_path): 
    with open(file_path, 'r') as file:
        file_content = file.read()
    return file_content 

def load_yaml(inp):
    with open(inp,'r') as istream:
        y =  yaml.load(istream, Loader=Loader)
    return y

    
code_file_tmpl = read_file('templates/code_file.tmpl')
hook_subroutine_body = read_file('templates/hook_subroutine_body.tmpl') 
hook_function_body = read_file('templates/hook_function_body.tmpl')
hook_function_cpx_intel_body = read_file('templates/hook_function_cpx_intel_body.tmpl')
hook_function_cpx_gnu_body = read_file('templates/hook_function_cpx_gnu_body.tmpl')


In [2]:
def is_complex_function(y):
    cpx_function = ("return_type_complex" in y and y["return_type_complex"])
    return cpx_function
        
def generate_subroutine(y, intel_interface = False, component = "lapack"):
    function_name = y['name'];
    arg_list = ""
    arg_list_void = ""
    call_list_void = ""
    cpx_function = False
    function = False
    return_type="void"
    body = hook_subroutine_body
    
    if y["return_type"] != "void":
        body = hook_function_body
        function = True
        cpx_function = ("return_type_complex" in y and y["return_type_complex"])
        return_type = y["return_type"];
        if return_type == "int": 
            return_type = "blasint"; 
        if cpx_function and not intel_interface:
            body = hook_function_cpx_gnu_body
        if cpx_function and intel_interface:
            body = hook_function_cpx_intel_body
                     
    first = True;
    for a in y['args']:
        if not first:
            arg_list += ", "
            arg_list_void += ", "
            call_list_void += ", "
        first = False
        type_ = a['type']
        if type_ == 'int':
            type_ = 'blasint' 
        if type_ == "float _Complex":
            type_ = '{:s}_complex_float'.format(component)
        if type_ == "double _Complex":
            type_ = '{:s}_complex_double'.format(component)            
        if a['pointer']:
            arg_list += type_ + " *" + a['name']
            arg_list_void += "void *" + a['name']
            call_list_void += "(void *) " + a['name']
        else:
            arg_list += type_ + " " + a['name']
            arg_list_void += a['type'] + " " + a['name']
            call_list_void += a['name']
    if len(arg_list) == 0:
        arg_list = "void"
    if len(arg_list) == 0:
        arg_list = "void"
    if len(arg_list_void) == 0:
        arg_list_void = "void"
        
    return body.format(
                      return_type = return_type,
                      function_name = function_name, 
                      arg_list = arg_list,
                      arg_list_void = arg_list_void, 
                      call_list_void = call_list_void)


def generate_lapack(version):
    print("Generate Profile Hook for LAPACK {:s}".format(version))

    year = datetime.date.today().year
    versionx = version.replace('.','_')
    versionx = versionx.replace('-','_')
    varr = version.split(".")
    major = int(varr[0])
    minor = int(varr[1])
    varr2 = varr[2].split("-")
    patch = int(varr2[0])
    if ( len(varr2) > 1):
        extra = "without deprecated" 
    else:
        extra = "with deprecated"

    inputs = './lapack/yaml/'+version+'.yaml'
    
    try:
        ignore_file = load_yaml('./lapack/yaml/ignore-'+version+'.yaml')
        ignore = ignore_file["ignore"]
    except:
        ignore = list()
    
    
    body =  '#include "profile_hook.h"\n'
    body += '#include "cscutils/table.h"\n'
    body += '#include "flexiblas_backend.h"\n'
    body += '#include "flexiblas_real_lapack_'+versionx+'.h"\n'
    body += '\n\n'   

        
    # r = process_map(load_yaml, inputs, max_workers = n_cores, chunksize=1)
    r = load_yaml(inputs)
    function_list = list();
    for y in tqdm(r):
        name = y["name"]
        if name in ignore: 
            continue
        function_list.append(name)
        if is_complex_function(y):
            body += "#ifdef FLEXIBLAS_ABI_GNU\n"
            body += generate_subroutine(y, intel_interface = False) + '\n'
            body += "#else\n"
            body += generate_subroutine(y, intel_interface = True) + '\n'
            body += "#endif\n"
            
        else:
            body += generate_subroutine(y) + '\n'
            
    body += "void profile_lapack_add(csc_table_t *tab, int col_name, int col_calls, int col_time) {\n"
    for name in function_list:
        body += "    ADD_BLAS_ENTRY({:s});\n".format(name)
    body += "    return;\n"
    body += "}\n"

    profile_loader = open (base+'/src/hooks/profile/profile_lapack_'+versionx+'.c','w')
    profile_loader.write(code_file_tmpl.format(
                        year = datetime.date.today().year, 
                        body = body))
    profile_loader.close()

In [3]:
generate_lapack("3.12.1")
generate_lapack("3.12.1-wodprc")
generate_lapack("3.12.0")
generate_lapack("3.12.0-wodprc")
generate_lapack("3.11.0")
generate_lapack("3.11.0-wodprc")
generate_lapack("3.10.1")
generate_lapack("3.10.1-wodprc")
generate_lapack("3.10.0")
generate_lapack("3.10.0-wodprc")
generate_lapack("3.9.1")
generate_lapack("3.9.1-wodprc")
generate_lapack("3.9.0")
generate_lapack("3.9.0-wodprc")
generate_lapack("3.8.0")
generate_lapack("3.8.0-wodprc")
generate_lapack("3.7.1")
generate_lapack("3.7.1-wodprc")
generate_lapack("3.7.0")
generate_lapack("3.7.0-wodprc")
generate_lapack("3.6.1")
generate_lapack("3.6.1-wodprc")
generate_lapack("3.6.0")
generate_lapack("3.6.0-wodprc")
generate_lapack("3.5.0")
generate_lapack("3.4.2")
generate_lapack("3.4.1")
generate_lapack("3.4.0")
generate_lapack("3.3.1")
generate_lapack("3.3.0")

Generate Profile Hook for LAPACK 3.12.1


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2112/2112 [00:00<00:00, 41892.86it/s]


Generate Profile Hook for LAPACK 3.12.1-wodprc


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2068/2068 [00:00<00:00, 45426.47it/s]


Generate Profile Hook for LAPACK 3.12.0


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2104/2104 [00:00<00:00, 60358.78it/s]


Generate Profile Hook for LAPACK 3.12.0-wodprc


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2060/2060 [00:00<00:00, 59980.61it/s]


Generate Profile Hook for LAPACK 3.11.0


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2074/2074 [00:00<00:00, 67854.81it/s]


Generate Profile Hook for LAPACK 3.11.0-wodprc


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2038/2038 [00:00<00:00, 63810.51it/s]


Generate Profile Hook for LAPACK 3.10.1


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2060/2060 [00:00<00:00, 32414.94it/s]


Generate Profile Hook for LAPACK 3.10.1-wodprc


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2024/2024 [00:00<00:00, 46161.93it/s]


Generate Profile Hook for LAPACK 3.10.0


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2060/2060 [00:00<00:00, 68789.74it/s]


Generate Profile Hook for LAPACK 3.10.0-wodprc


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2024/2024 [00:00<00:00, 61741.50it/s]


Generate Profile Hook for LAPACK 3.9.1


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2042/2042 [00:00<00:00, 67099.40it/s]


Generate Profile Hook for LAPACK 3.9.1-wodprc


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2006/2006 [00:00<00:00, 50629.87it/s]


Generate Profile Hook for LAPACK 3.9.0


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2030/2030 [00:00<00:00, 37624.72it/s]


Generate Profile Hook for LAPACK 3.9.0-wodprc


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1994/1994 [00:00<00:00, 35229.62it/s]


Generate Profile Hook for LAPACK 3.8.0


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2008/2008 [00:00<00:00, 48593.98it/s]


Generate Profile Hook for LAPACK 3.8.0-wodprc


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1972/1972 [00:00<00:00, 34556.50it/s]


Generate Profile Hook for LAPACK 3.7.1


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1989/1989 [00:00<00:00, 45470.24it/s]


Generate Profile Hook for LAPACK 3.7.1-wodprc


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1953/1953 [00:00<00:00, 64465.80it/s]


Generate Profile Hook for LAPACK 3.7.0


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1989/1989 [00:00<00:00, 64705.43it/s]


Generate Profile Hook for LAPACK 3.7.0-wodprc


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1953/1953 [00:00<00:00, 67642.24it/s]


Generate Profile Hook for LAPACK 3.6.1


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1796/1796 [00:00<00:00, 61371.89it/s]


Generate Profile Hook for LAPACK 3.6.1-wodprc


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1760/1760 [00:00<00:00, 68784.71it/s]


Generate Profile Hook for LAPACK 3.6.0


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1792/1792 [00:00<00:00, 65745.81it/s]


Generate Profile Hook for LAPACK 3.6.0-wodprc


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1756/1756 [00:00<00:00, 71458.21it/s]


Generate Profile Hook for LAPACK 3.5.0


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1746/1746 [00:00<00:00, 70657.78it/s]


Generate Profile Hook for LAPACK 3.4.2


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1672/1672 [00:00<00:00, 71588.45it/s]


Generate Profile Hook for LAPACK 3.4.1


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1672/1672 [00:00<00:00, 67335.03it/s]


Generate Profile Hook for LAPACK 3.4.0


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1672/1672 [00:00<00:00, 47690.74it/s]


Generate Profile Hook for LAPACK 3.3.1


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1640/1640 [00:00<00:00, 67399.50it/s]


Generate Profile Hook for LAPACK 3.3.0


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1634/1634 [00:00<00:00, 70907.49it/s]


In [None]:
def load_name_from_yaml(inp):
        with open(inp,'r') as istream:
            y =  yaml.load(istream, Loader=Loader)
        name = y[0]['name'];
        return name
    
def generate_profile_structure():
    lapack_yaml = glob.glob("lapack/yaml/3*.yaml")
    r = list()
    for f in tqdm(lapack_yaml):
        r.extend(load_yaml(f))
    # r2 = process_map(load_yaml, lapack_yaml, max_workers = n_cores, chunksize=1)
    lapack_list = list(dict.fromkeys([x['name'] for x in r]))
    
    fp = open(base+'/src/hooks/profile/profile_data_lapack.h', 'w')
    for name in tqdm(lapack_list):
        fp.write('profile_data_t {:s};\n'.format(name))
    fp.close()

generate_profile_structure()

 60%|███████████████████████████████████████████████████████████████████████████████████████████▊                                                             | 18/30 [00:46<00:32,  2.74s/it]