# Punto Flotante

El estandar IEEE754 establece una forma para almacenar numeros en una computadora. 

1. A single-precision number consists of 32 bits, with 1 bit for the sign, 8 for the exponent, and 23 for the significand.

2. A double-precision number consists of 64 bits with 1 bit for the sign, 11 for the exponent, and 52 for the significand.

3. An extended-precision number consists of 80 bits, with 1 bit for the sign, 15 for the exponent, and 64 for the significand.



Por ejemplo, para usar doble-precision usamos :

$x=(-1)^s (1.b_{13} b_{14} \ldots b_{64})_2 \times 2^{e-1023}$

1. $s \in \{0,1\}$ es el signo.
2. $b_{13} b_{14} \ldots b_{64}$ es la mantisa.
3. $e$ es el exponente.


In [14]:
b=bitstring(Int8(7.0))

"00000111"

In [18]:
b=bitstring(Float16(7.0))

"0100011100000000"

In [48]:
length(b)

16

In [115]:
signo=b[1]
exponente=b[2:6]
fraccion=b[7:16]

"1100000000"

In [117]:
exponent(Float16(7.0))

2

In [118]:
function to_decimal(bit_string::String)::Int
    d=map(x->parse(Int,x),collect(bit_string))
    e=length(bit_string)-1:-1:0
    return sum([i*2^j for (i,j) in zip(d,e)])
end;

In [121]:
to_decimal(exponente)-(2^5/2-1)

2.0

In [122]:
fraccion

"1100000000"

In [91]:
function to_fraction(bit_string::String)::Real
    d=map(x->parse(Int,x),collect(bit_string))
    e=1:1:length(bit_string)
    return sum([i*2.0^(-j) for (i,j) in zip(d,e)])
end;

In [98]:
significand(Float16(7.0))

Float16(1.75)

In [123]:
1+to_fraction(fraccion)

1.75

In [113]:
function to_decimal_fraction(fraccion::String,exponente::String)::Real
    m=to_fraction(fraccion)
    e=to_decimal(exponente)-(2^length(exponente)/2-1)
    return (1+m)*2.0^(e)
end;

In [124]:
to_decimal_fraction(fraccion,exponente)

7.0

### Ejercicio 1

Encuentre la representación (mantisa, exponente y signo) de punto flotante precision media para el número $x=10.375_{10}$

In [106]:
x=Float16(10.375)

Float16(10.375)

In [107]:
typeof(x)

Float16

In [108]:
using Printf

p=round(x)
r=mod(x,p)
@printf("Parte entera %d, real %f",p,r)

Parte entera 10, real 0.375000

### Ejercicio 2

Encuentre la representación (mantisa, exponente y signo) de punto flotante para el número $x=123.15625_{10}$

In [7]:
x=123.15625
b=bitstring(x)

"0100000001011110110010100000000000000000000000000000000000000000"

# Error de Aproximación

Sabemos que la función $f(x)=e^x$ puede ser aproximada mediante la serie de Taylor truncada:

$e^x = 1 + x + \frac{x^2}{2!} + \frac{x^3}{3!} + \frac{x^4}{4!} + \cdots.$

Por ejemplo, si evaluamos $f(1)$ debiesemos obtener un valor cercano a $e$

In [103]:
exp(1.)

2.718281828459045

In [113]:
function taylor_series(x::Float64,k::Int)::Float64
    range=1:1:k
    res=1.
    for i in range
        res+=(x^i)/factorial(big(i))
    end
    return res
end

taylor_series (generic function with 1 method)

In [114]:
taylor_series(1.,3)

2.6666666666666665

In [135]:
err=Inf
k=1
while err>eps(Float64)
    val=taylor_series(1.,k)
    err=abs(exp(1.)-val)
    @printf("val : %f, orden : %d, error : %d \n",val,k,err)
    k+=1
end


In [136]:
val=taylor_series(1.,k)

2.718281828459045

In [134]:
k

18

In [137]:
function taylor_series(x::Float32,k::Int)::Float32
    range=1:1:k
    res=1.
    for i in range
        res+=(x^i)/factorial(big(i))
    end
    return res
end

taylor_series (generic function with 2 methods)

In [139]:
err=Inf
k=1
while err>eps(Float32)
    val=taylor_series(Float32(1.),k)
    err=abs(exp(1.)-val)
    @printf("val : %f, orden : %d, error : %d \n",val,k,err)
    k+=1
end


In [140]:
k

11

In [142]:
eps(Float32)>eps(Float64)

true