In [31]:
import hashlib
import base64

In [None]:
def compute_padding( algorithm: str = 'md5',
         output_format: str = 'bytes', 
         message: bytes = None,
        ):
    """
    Parameters
    ----------
    algorithm : str
        One of: 'md5', 'sha256', 'sha512'
    message : bytes
        Data to hash. Required.
    output_format : str
        One of: 'bytes', 'hex', 'base64'
    
    Returns
    -------
    bytes or str
        The padding that the given algorithm adds to the message before processing. To be used in implementation of the length extension attack. 
    """
    # Importing necessary libraries
    import hashlib
    import base64

    # Handling input errors
    valid_algorithms = ['md5', 'sha256', 'sha512']
    valid_formats = ['bytes', 'hex', 'base64']

    if algorithm not in valid_algorithms:
        return ValueError('Algorithm must be one of md5, sha256, or sha512')
    
    if output_format not in valid_formats:
        return ValueError('Output format must be one of bytes, hex, or base64')
    
    if not isinstance(message, bytes):
        return TypeError("Message must have type 'bytes")
    
    # padding

    L = 8 * len(message) # compute the length of the message in binary
    len_in_binary = bytes([L]) # convert the length to bytes
    K = 0 # initializing the number of zeroes to computed according to the encryption method
    
    # md5 padding

    if algorithm == 'md5' or 'sha256':
        K = (448 - L - 1) % 512

    else:
        K = (896 - L - 1) % 1024

    one_place = K % 8
    extra_zeroes = (K - one_place) // 8

    bytes_pad = bytes([1 << one_place]) + bytes(extra_zeroes) + len_in_binary
        

    if output_format == 'bytes':
        return bytes_pad
    if output_format == 'hex':
        return bytes_pad.hex()
    if output_format == 'base64':
        return base64.b64encode(bytes_pad)
        
    






    

    

In [88]:
compute_padding(message=b'Hello', output_format='bytes', algorithm='sha256')

b'\x80\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00('

In [79]:
b = compute_padding(message=b'Hello', output_format='bytes', algorithm='sha256')
binary_str = bin(int.from_bytes(b, 'big'))  # or 'little' depending on byte order
print(binary_str)  # Output: '0b100000111111111'

0b1000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000101000


In [None]:
L = len(binary_str)
K = L - 3 - 6
K


444

In [None]:
K=12
string_pad = '1' + ('0' * K)
string_pad.encode()
hex(int(string_pad))


'0xe8d4a51000'

In [None]:
bin(1 << 511)

'0b10000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000'

In [None]:
512 / 8

64.0

In [None]:
#1 make a byte for 10000000
b = 2 ** 7

# shift the binary number 1 by 7 bits to get 10000000
c = 1 << 7

#2 make into bytes object
bs = bytes([b])

#3 make a bunch of 0 bytes
zs = bytes(63)

#4 concatenate
pad = bs + zs

In [None]:
zs

b'\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00'

In [None]:
pad

b'\x80\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00'

In [None]:
0b1010000

80

In [33]:
m = b'Hello'

In [34]:
type(m)

bytes

In [35]:
len(m)

5

In [37]:
K = (448 - len(m) - 1) % 512
K

442

In [39]:
442 /8

55.25

In [46]:
int.from_bytes(bytes([1]) + bytes(1), 'big')

256

In [47]:
bytes([1]) + bytes(1)

b'\x01\x00'

In [48]:
1 << 8

256

In [50]:
n = K % 8
n

2

In [51]:
k = (K - n) // 8
k

55

In [53]:
pad = bytes([1 << n]) + bytes(k)
pad

b'\x04\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00'

In [54]:
hex_str = "48656c6c6f21"  # "Hello!" in hex
bytes_from_hex = bytes.fromhex(hex_str)
hex_from_bytes = bytes_from_hex.hex()

print("\n9. Hex to bytes:", bytes_from_hex)
print("   Bytes to hex:", hex_from_bytes)


9. Hex to bytes: b'Hello!'
   Bytes to hex: 48656c6c6f21


In [63]:
m = b'Hello'
bytes([len(m)])

b'\x05'

In [66]:
int.from_bytes(b'\x04', 'big')

4