In [None]:
import numpy as np

In [None]:
import matplotlib.pyplot as plt

## Codigo ensamblador que efectua el producto interno entre dos vectores float

In [None]:
%%file asmFloatInnerProd.asm

global asmFloatInnerProd
    section .text

asmFloatInnerProd:
    xorpd xmm0, xmm0
    xorpd xmm1, xmm1
    xorpd xmm2, xmm2
    cmp rdx, 0
    je done
next:
    movss xmm0, [rdi]
    movss xmm1, [rsi]
    mulss xmm0, xmm1
    addss xmm2, xmm0
    add rdi, 4
    add rsi, 4
    sub rdx, 1
    jnz next 
done:
    movss xmm0, xmm2
    ret


## Archivo de cabecera de la función en ensamblador para explicitar los parametros y sus tipos de dato

In [None]:
%%file asmFloatInnerProd.c
extern float asmFloatInnerProd(float *v1, float *v2, int N);

## Reglas para generar la libreria compartida que se vinculara con python

In [None]:
! nasm -f elf64 asmFloatInnerProd.asm -o asmFloatInnerProd.o
! gcc -shared asmFloatInnerProd.o asmFloatInnerProd.c -o asmFloatInnerProd.so

In [None]:
import ctypes

## Funcion que vincula la libreria compartida en ASM con Python

In [None]:
def ctypes_asmFloatInnerProd():
    # indicar la ruta de la shared library
    libfile = './asmFloatInnerProd.so'

    # cargar la shared library
    lib = ctypes.CDLL(libfile)

    # tipo de dato de los argumentos
    lib.asmFloatInnerProd.argtypes = [
        numpy.ctypeslib.ndpointer(dtype=numpy.float32),
        numpy.ctypeslib.ndpointer(dtype=numpy.float32),
        ctypes.c_int
    ]
    
    #Tipo de dato que devuelve
    lib.asmFloatInnerProd.restype = ctypes.c_float
    
    # funcion configurada
    return lib.asmFloatInnerProd

In [None]:
%%file cFloatInnerProd.c

float cFloatInnerProd(float *v1, float *v2, int N)
{
    float sum = 0;
    for (int i = 0; i < N; i++)
    {
        sum += v1[i] * v2[i];
    }
    return = sum;
}

## Reglas para generar la libreria compartida de código en C

In [None]:
# para generar el object file
! gcc -c -Wall -Werror -fpic cFloatInnerProd.c
#muestre errorres, resalte errores, pic (position independend code)

# para crear la shared library
! gcc -shared cFloatInnerProd.o -o cFloatInnerProd.so

In [None]:
def ctypes_cFloatInnerProd():
    # indicar la ruta de la shared library
    libfile = './cFloatInnerProd.so'

    # cargar la shared library
    lib = ctypes.CDLL(libfile)

    # tipo de dato de los argumentos
    lib.asmFloatInnerProd.argtypes = [
        numpy.ctypeslib.ndpointer(dtype=numpy.float32),
        numpy.ctypeslib.ndpointer(dtype=numpy.float32),
        ctypes.c_int
    ]
    
    #Tipo de dato que devuelve
    lib.cFloatInnerProd.restype = ctypes.c_float
    
    # funcion configurada
    return lib.cFloatInnerProd

## Limpieza de archivos

In [None]:
! rm *.o
! rm *.so
! rm *.asm
! rm *.c