# Kinetics動画のダウンロード

本ファイルでは、Kinetics動画をダウンロードします。


## 解説

https://github.com/activitynet/ActivityNet/tree/master/Crawler/Kinetics

のKineticsの動画ダウンロード環境を利用します。

Python2系なので、新しい仮想環境を作成します。
今いるディレクトリはUbuntuのhomeです。

以下のコマンドをターミナルで実行し、フォルダ「video_download」のファイル「environment.yml」に記載したパッケージをインストールした仮想環境を作成します

- source deactivate

- conda env create -f ./ECO_scene_classifier/video_download/environment.yml

作成した仮想環境に入ります

- source activate kinetics

youtube-dlのパッケージを更新インストールします

- pip install --upgrade youtube-dl

- pip install --upgrade joblib

これで準備ができたので、JupyteNotebookを立ち上げ、本ファイルを実行します

- jupyter notebook --port 9999


In [1]:
# Colab用，youtube-dlのインストール
!pip install youtube-dl

Collecting youtube-dl
[?25l  Downloading https://files.pythonhosted.org/packages/a4/5f/db1fb30596fbfabd3500e741cd9c73d0cb1d25387582fd21289bed05a9c2/youtube_dl-2020.6.16.1-py2.py3-none-any.whl (1.8MB)
[K     |▏                               | 10kB 16.1MB/s eta 0:00:01[K     |▍                               | 20kB 6.1MB/s eta 0:00:01[K     |▌                               | 30kB 6.6MB/s eta 0:00:01[K     |▊                               | 40kB 6.8MB/s eta 0:00:01[K     |█                               | 51kB 6.4MB/s eta 0:00:01[K     |█                               | 61kB 7.0MB/s eta 0:00:01[K     |█▎                              | 71kB 7.5MB/s eta 0:00:01[K     |█▍                              | 81kB 8.4MB/s eta 0:00:01[K     |█▋                              | 92kB 8.8MB/s eta 0:00:01[K     |█▉                              | 102kB 8.5MB/s eta 0:00:01[K     |██                              | 112kB 8.5MB/s eta 0:00:01[K     |██▏                             | 122k

In [3]:
import os

# フォルダ「data」が存在しない場合は作成する
data_dir = "./data/"
if not os.path.exists(data_dir):
    os.mkdir(data_dir)
    
# フォルダ「kinetics_videos」が存在しない場合は作成する
data_dir = "./data/kinetics_videos/"
if not os.path.exists(data_dir):
    os.mkdir(data_dir)
    
    
# フォルダ「video_download」のpytnonファイル「download.py」を実行します
# 取得するyoutubeデータはフォルダ「video_download」のkinetics-400_val_8videos.csvに記載した8動画です
# 保存先はフォルダ「data」内のフォルダ「kinetics_videos」です
!python2 ./video_download/download.py ./video_download/kinetics-400_val_8videos.csv ./data/kinetics_videos/
    

/tmp/kinetics/a572c8a0-abca-469a-a644-889201395810.%(ext)s
/tmp/kinetics/d2d29369-74d5-47d2-a019-1a08653c3d12.%(ext)s
/tmp/kinetics/cd449792-a78a-4aa3-8d06-17510cb72835.%(ext)s
/tmp/kinetics/b3f5796f-e806-49f6-920a-28ab6439f30e.%(ext)s
/tmp/kinetics/08b7ccc8-5443-4751-8515-475036560c0d.%(ext)s
/tmp/kinetics/9cbbfd33-3912-4dd7-b08a-5d203134ee2f.%(ext)s
/tmp/kinetics/b5ac3ce4-c936-4030-99ce-fa2784c58cef.%(ext)s
/tmp/kinetics/aeea4208-3ccc-4f27-9327-16b3a926482c.%(ext)s


以上

# 動画データを画像データに変換
ダウンロードした動画をframeごとにjpeg形式の画像データに変換します．

## 事前準備

ffmepgが入っていない場合には，
以下のコマンドをターミナルで実行し，Ubuntuにてffmpegをインストールします．

- sudo apt install ffmpeg


In [5]:
import os
import subprocess  # ターミナルで実行するコマンドを実行できる


# 動画が保存されたフォルダ「kinetics_videos」にある、クラスの種類とパスを取得
dir_path = './data/kinetics_videos'
class_list = os.listdir(path=dir_path)
print(class_list)

# 各クラスの動画ファイルを画像ファイルに変換する
for class_list_i in (class_list):  # クラスごとのループ

    # クラスのフォルダへのパスを取得
    class_path = os.path.join(dir_path, class_list_i)

    # 各クラスのフォルダ内の動画ファイルをひとつずつ処理するループ
    for file_name in os.listdir(class_path):

        # ファイル名と拡張子に分割
        name, ext = os.path.splitext(file_name)

        # mp4ファイルでない、フォルダなどは処理しない
        if ext != '.mp4':
            continue

        # 動画ファイルを画像に分割して保存するフォルダ名を取得
        dst_directory_path = os.path.join(class_path, name)

        # 上記の画像保存フォルダがなければ作成
        if not os.path.exists(dst_directory_path):
            os.mkdir(dst_directory_path)

        # 動画ファイルへのパスを取得
        video_file_path = os.path.join(class_path, file_name)

        # ffmpegを実行させ、動画ファイルをjpgにする （高さは256ピクセルで幅はアスペクト比を変えない）
        # kineticsの動画の場合10秒になっており、大体300ファイルになる（30 frames /sec）
        cmd = 'ffmpeg -i \"{}\" -vf scale=-1:256 \"{}/image_%05d.jpg\"'.format(
            video_file_path, dst_directory_path)
        print(cmd)
        subprocess.call(cmd, shell=True)
        print('\n')

print("動画ファイルを画像ファイルに変換しました。")


['bungee jumping', 'arm wrestling']
ffmpeg -i "./data/kinetics_videos/bungee jumping/dAeUFSdYG1I_000010_000020.mp4" -vf scale=-1:256 "./data/kinetics_videos/bungee jumping/dAeUFSdYG1I_000010_000020/image_%05d.jpg"


ffmpeg -i "./data/kinetics_videos/bungee jumping/TUvSX0pYu4o_000002_000012.mp4" -vf scale=-1:256 "./data/kinetics_videos/bungee jumping/TUvSX0pYu4o_000002_000012/image_%05d.jpg"


ffmpeg -i "./data/kinetics_videos/bungee jumping/zkXOcxGnUhs_000025_000035.mp4" -vf scale=-1:256 "./data/kinetics_videos/bungee jumping/zkXOcxGnUhs_000025_000035/image_%05d.jpg"


ffmpeg -i "./data/kinetics_videos/bungee jumping/b6yQZjPE26c_000023_000033.mp4" -vf scale=-1:256 "./data/kinetics_videos/bungee jumping/b6yQZjPE26c_000023_000033/image_%05d.jpg"


ffmpeg -i "./data/kinetics_videos/arm wrestling/ehLnj7pXnYE_000027_000037.mp4" -vf scale=-1:256 "./data/kinetics_videos/arm wrestling/ehLnj7pXnYE_000027_000037/image_%05d.jpg"


ffmpeg -i "./data/kinetics_videos/arm wrestling/C4lCVBZ3ux0_000028

## Colab用，データをローカルにダウンロード

In [6]:
# ダウンロードしたいフォルダを zip 圧縮する
!zip -r /content/kinetic_videos.zip /content/data

# 圧縮した zip ファイルをダウンロードする
from google.colab import files
files.download('/content/kinetic_videos.zip')

updating: content/data/ (stored 0%)
updating: content/data/kinetics_videos/ (stored 0%)
updating: content/data/kinetics_videos/bungee jumping/ (stored 0%)
updating: content/data/kinetics_videos/bungee jumping/dAeUFSdYG1I_000010_000020.mp4 (deflated 1%)
updating: content/data/kinetics_videos/bungee jumping/TUvSX0pYu4o_000002_000012.mp4 (deflated 0%)
updating: content/data/kinetics_videos/bungee jumping/zkXOcxGnUhs_000025_000035.mp4 (deflated 1%)
updating: content/data/kinetics_videos/bungee jumping/b6yQZjPE26c_000023_000033.mp4 (deflated 0%)
updating: content/data/kinetics_videos/arm wrestling/ (stored 0%)
updating: content/data/kinetics_videos/arm wrestling/ehLnj7pXnYE_000027_000037.mp4 (deflated 1%)
updating: content/data/kinetics_videos/arm wrestling/C4lCVBZ3ux0_000028_000038.mp4 (deflated 0%)
updating: content/data/kinetics_videos/arm wrestling/BdMiTo_OtnU_000024_000034.mp4 (deflated 0%)
updating: content/data/kinetics_videos/arm wrestling/5JzkrOVhPOw_000027_000037.mp4 (deflated 0%)

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>