# Pasos:
1. Cargar archivo "videos_candidatos_desconocidos.csv"
2. Crear lista de videos de un candidato
3. Descargar videos
4. Proceso de uno por uno:
    - Seleccionar video
    - Seleccionar 30 segundos aleatorios de video
    - Identificar frames de los 30 segundos 
    - Crear video de 30 segundos a partir de frames seleccionados
5. Detectar frames importantes de videos de 30 segundos

In [None]:
import pandas as pd
import youtube_dl
import cv2 
import os
import datetime
import random

## 1. Cargar archivo "videos_candidatos_desconocidos.csv"

In [None]:
# Descargar el csv del drive

df = pd.read_csv("videos_candidatos_desconocidos.csv")
df

Unnamed: 0,id,tipo_elecciones,pais,año,fecha_eleccion,vuelta,candidato,video
0,1,presidencial,Ecuador,2021,,,Andres Arauz,https://www.youtube.com/watch?v=eedEQl76vWY
1,2,presidencial,Ecuador,2021,,,Andres Arauz,https://www.youtube.com/watch?v=JLC-iS7XE0Y
2,3,presidencial,Ecuador,2021,,,Andres Arauz,https://www.youtube.com/watch?v=zrmZao51UAg
3,4,presidencial,Ecuador,2021,,,Andres Arauz,https://www.youtube.com/watch?v=xfFhkJTjlWg
4,5,presidencial,Ecuador,2021,,,Andres Arauz,https://www.youtube.com/watch?v=Ievt-n_2GLs
5,6,presidencial,Ecuador,2021,,,Andres Arauz,https://www.youtube.com/watch?v=OCcdW4m-vfg
6,7,presidencial,Ecuador,2021,,,Andres Arauz,https://www.youtube.com/watch?v=RbpZCR8wgYw
7,8,presidencial,Chile,2021,21/11/2021,1.0,José Antonio Kast - Gabriel Boric,https://www.youtube.com/watch?v=y1uxdnWeKUU
8,9,presidencial,Chile,2021,19/12/2021,2.0,José Antonio Kast - Gabriel Boric,https://www.youtube.com/watch?v=0ImpuCRKp5M
9,10,presidencial,Chile,2021,21/11/2021,1.0,José Antonio Kast - Gabriel Boric,https://www.youtube.com/watch?v=iCLptZmDRvo


## 2. Crear lista de videos de un candidato

In [None]:
# Seleccionar sus video según el candidato

lista_link = (df["video"][1],df["video"][2],df["video"][3],df["video"][4],df["video"][5],df["video"][6])
lista_link

('https://www.youtube.com/watch?v=JLC-iS7XE0Y',
 'https://www.youtube.com/watch?v=zrmZao51UAg',
 'https://www.youtube.com/watch?v=xfFhkJTjlWg',
 'https://www.youtube.com/watch?v=Ievt-n_2GLs',
 'https://www.youtube.com/watch?v=OCcdW4m-vfg',
 'https://www.youtube.com/watch?v=RbpZCR8wgYw')

## 3. Descargar videos

In [None]:
os.chdir(r'C:\Users\Maria\Tesis\tesis\videos_completos')

def descargar_videos(lista_link):
    count=0
    while count<len(lista_link):
        link=lista_link[count]
        ydl = youtube_dl.YoutubeDL({'outtmpl': '%(id)s.%(ext)s'})

        with ydl:
            result = ydl.extract_info(link,download=True)

        if 'entradas' in result:
            video = result['entradas'][0]
        else:
            # Just a video
            video = result

        print(video)
        video_url = video['url']
        print(f"El video {count} se ha descargado exitosamente")
        count+=1

    return f"Se han descargado {len(lista_link)} videos"

In [None]:
descargar_videos(lista_link)

[youtube] JLC-iS7XE0Y: Downloading webpage
[youtube] JLC-iS7XE0Y: Downloading MPD manifest
[download] Destination: JLC-iS7XE0Y.mp4
[download]   5.2% of 109.00MiB at 16.38KiB/s ETA 01:47:37      

## 4. Proceso de uno por uno:

### - Seleccionar video

In [None]:
video_seleccionado = 'C:/Users/Maria/Tesis/tesis/videos_completos/arauz1.mp4' 

### - Seleccionar 30 segundos aleatorios de video

In [None]:
# Seleccionar 30 segundos aleatorios 
    
def segundos_a_fecha(segundos):
    horas = int(segundos / 60 / 60)
    segundos -= horas*60*60
    minutos = int(segundos/60)
    segundos -= minutos*60
    return f"{horas:02d}:{minutos:02d}:{segundos:02d}"

def seg30_aleatorios(ruta_video):
    data = cv2.VideoCapture(ruta_video) 

    # Definir duración total de video
    frames = data.get(cv2.CAP_PROP_FRAME_COUNT) 
    fps = int(data.get(cv2.CAP_PROP_FPS)) 
    segundos = int(frames / fps) 
    video_time = str(datetime.timedelta(seconds=segundos)) 
    print("Tiempo video completo")
    print(f"Segundos totales: {segundos}")
    print(f"Duración total: {video_time}")

    # Escoger 20 segundos aleatorios
    seg_inicio = random.randint(1, segundos-30)
    seg_final = seg_inicio+30

    # Convertir segundos en tiempo completo
    tie_inicio = segundos_a_fecha(seg_inicio)
    tie_final = segundos_a_fecha(seg_final)
    print("\n")
    print("Tiempo video de 30 segundos")
    print(f"Inicio aleatorio seleccionado: {seg_inicio}")
    print(f"Final 30 segundos            : {seg_final}")
    print(f"Tiempo inicio aleatorio : {tie_inicio}")
    print(f"Tiempo final 30 segundos: {tie_final}")
    
    return (segundos,seg_inicio,seg_final)

In [None]:
lista_seg = seg30_aleatorios(video_seleccionado)
lista_seg

Tiempo video completo
Segundos totales: 43
Duración total: 0:00:43


Tiempo video de 20 segundos
Inicio aleatorio seleccionado: 13
Final 20 segundos            : 33
Tiempo inicio aleatorio : 00:00:13
Tiempo final 20 segundos: 00:00:33


(43, 13, 33)

#### IMPORTANTE: Luego de seleccionar los tiempos de 30 segundos aleatorios 

*   Elemento de lista
*   Elemento de lista

verificar que el candidato salga en ese tiempo antes de pasar con el siguiente código.

### - Identificar frames de los 30 segundos

In [None]:
# Identificar frames de los 20 segundos aleatorios 

def count_frames(path, override=False):
    video = cv2.VideoCapture(path)
    total = 0
    if override:
        total = count_frames_manual(video)
    else:
        try:
            if is_cv3():
                total = int(video.get(cv2.CAP_PROP_FRAME_COUNT))
            else:
                total = int(video.get(cv2.cv.CV_CAP_PROP_FRAME_COUNT))
        except:
            total = count_frames_manual(video)
    video.release()
    return total

def count_frames_manual(video):
    total = 0
    while True:
        (grabbed, frame) = video.read()
        if not grabbed:
            break
        total += 1
    return total

In [None]:
frames_totales = count_frames(video_seleccionado)
frames_inicio = int(frames_totales*lista_seg[1]/lista_seg[0])
frames_final = int(frames_totales*lista_seg[2]/lista_seg[0])
print(f"Frames totales: {frames_totales}")
print(f"Frames inicio: {frames_inicio}")
print(f"Frames final: {frames_final}")

Frames totales: 1081
Frames inicio: 326
Frames final: 829


### - Crear video de 30 segundos a partir de frames seleccionados

In [None]:
vidcap = cv2.VideoCapture(video_seleccionado)
# Crear carpeta donde guardará los frames
os.chdir(r'C:\Users\Maria\Tesis\tesis\frames_video')
success,image = vidcap.read()
count = 0
archivos=[]
lista_borrar=[]
while count in range(0,frames_totales):
    cv2.imwrite("%d.jpg" % count, image)       
    success,image = vidcap.read()
    print('Nuevo frame: ', f"{count}.jpg")
    lista_borrar.append(f"{count}.jpg")
    if count>=frames_inicio and count<=frames_final:
        archivos.append(f"{count}.jpg")
    count += 1

Nuevo frame:  0.jpg
Nuevo frame:  1.jpg
Nuevo frame:  2.jpg
Nuevo frame:  3.jpg
Nuevo frame:  4.jpg
Nuevo frame:  5.jpg
Nuevo frame:  6.jpg
Nuevo frame:  7.jpg
Nuevo frame:  8.jpg
Nuevo frame:  9.jpg
Nuevo frame:  10.jpg
Nuevo frame:  11.jpg
Nuevo frame:  12.jpg
Nuevo frame:  13.jpg
Nuevo frame:  14.jpg
Nuevo frame:  15.jpg
Nuevo frame:  16.jpg
Nuevo frame:  17.jpg
Nuevo frame:  18.jpg
Nuevo frame:  19.jpg
Nuevo frame:  20.jpg
Nuevo frame:  21.jpg
Nuevo frame:  22.jpg
Nuevo frame:  23.jpg
Nuevo frame:  24.jpg
Nuevo frame:  25.jpg
Nuevo frame:  26.jpg
Nuevo frame:  27.jpg
Nuevo frame:  28.jpg
Nuevo frame:  29.jpg
Nuevo frame:  30.jpg
Nuevo frame:  31.jpg
Nuevo frame:  32.jpg
Nuevo frame:  33.jpg
Nuevo frame:  34.jpg
Nuevo frame:  35.jpg
Nuevo frame:  36.jpg
Nuevo frame:  37.jpg
Nuevo frame:  38.jpg
Nuevo frame:  39.jpg
Nuevo frame:  40.jpg
Nuevo frame:  41.jpg
Nuevo frame:  42.jpg
Nuevo frame:  43.jpg
Nuevo frame:  44.jpg
Nuevo frame:  45.jpg
Nuevo frame:  46.jpg
Nuevo frame:  47.jpg
Nu

In [None]:
# Path hace referencia a la carpeta donde están los frames
path = "C:/Users/Maria/Tesis/tesis/frames_video"
#archivosl = sorted(os.listdir(path))
img_array = []

lista_frames=[]
for x in range(0, len(archivos)):
    nomArchivo = archivos[x]
    dirArchivo = path + "/" + str(nomArchivo)
    lista_frames.append(dirArchivo)
    img = cv2.imread(dirArchivo)
    img_array.append(img)
    
height, width = img.shape[:2]

# IMPORTANTE: Crear una carpeta para que almacene los videos de 20 segundos, 
# luego colocar la ruta aquí y cambiar el nombre del video para 
# que no lo reemplace (Cambiar arauz1.mp4) 
os.chdir(r'C:\Users\Maria\Tesis\tesis\videos_20seg')
video = cv2.VideoWriter('arauz1.mp4', cv2.VideoWriter_fourcc(*'DIVX'), 29, (width, height))

for i in range(0, len(archivos)):
    video.write(img_array[i])

video.release()

In [None]:
# Eliminar frames de la carpeta para el siguiente video
os.chdir(r'C:\Users\Maria\Tesis\tesis\frames_video')
for f in lista_borrar:
    os.remove(f)