# Overview

This Jupyter Notebook takes in translations of the Take One brochure and outputs it as a JSON file for the MyBus tool.

The data was originally in a Word document.  In transferring it to a Word document, line breaks and spaces were cleaned up in the content.  Different languages use spaces differently.

The output file is used by the MyBus tool to display the Take One brochure as an HTML page instead of only as a PDF file.  It contains all the details for all line changes aggregated into a single view.


In [2]:
import pandas as pd

languages = ['en','es','zh-TW','vi','ko','ja','hy','ru']

# Input

Read in CSV file that contains all translatons of the Take-One Brochure.

The languages are:

* English (en)
* Spanish (es)
* Chinese-Traditional (zh-TW)
* Vietnamese (vi)
* Korean (ko)
* Japanese (ja)
* Armenian (hy)
* Russian (ru)

In [5]:
takeone = pd.read_csv('data-input/all-lines.csv', 
    usecols={'section','order','en','es','zh-TW','vi','ko','ja','hy','ru','line'},
    dtype={'section':'string', 'order':'int64', 'en':'string', 'es':'string', 'zh-TW':'string', 'vi':'string', 'ko':'string', 'ja':'string', 'hy':'string', 'ru':'string', 'line':'int64'})

# Remove message about front door boarding being back.
takeone.drop(94, inplace=True)

takeone.tail()

Unnamed: 0,section,order,en,es,zh-TW,vi,ko,ja,hy,ru,line
89,details,77,"770 – Line 770 will be discontinued, and repla...",770: La línea 770 será descontinuada y reempla...,770 - 770號線將停運，取而代之的是頻繁往返的70號線，在El Monte Stati...,Tuyến 770 - Tuyến 770 sẽ ngừng hoạt động và đư...,770 – 770번 버스가 중단되는 대신 70번 버스의 운행 횟수가 늘어납니다. 7...,770 - 770番線は廃止され、代わりに頻繁に運行される70番線がEl Monte駅とLA...,770 – 770-րդ գիծը կդադարեցվի և կփոխարինվի հաճա...,770 – Маршрут № 770 будет прекращен и заменен ...,770
90,details,78,"780 – Line 780 will be discontinued, replaced ...",780: La línea 780 será descontinuada y reempla...,780 - 780號線將停運，取而代之的是180號線在Pasadena City Colle...,Tuyến 780 - Tuyến 780 sẽ ngừng hoạt động và đư...,"780 – 780번 버스는 운행이 중단되며, 180번 버스와 217번 버스로 대체 ...",780 - 780番線は廃止され、代わりに180号線がPasadena City Colle...,"780 –780-րդ գիծը կդադարեցվի, այն կփոխարինվի 18...","780 – Маршрут № 780 будет прекращен, заменен б...",780
91,details,79,"788 – Line 788, which has not operated since m...","788: La línea 788, que no funciona desde media...",788- 788號線自2020年中期以來一直沒有運行，將永久停運，取而代之的是在Sylmar...,Tuyến 788 - Tuyến 788 bị ngừng hoạt động từ gi...,788 – 788번 버스는 2020년 중반부터 운행되지 않아 영구 중단이 결정되었고...,788 - 2020年半ばから運行されていない788番線は永久に廃止され、Sylmar/Sa...,"788 – 788-րդ գիծը, որը չի գործել 2020-ի կեսերի...","788 – Маршрут № 788, который не осуществляет д...",788
92,details,80,901 – No route changes to G Line (Orange) rout...,901: No habrá cambios en la ruta de Metro G Li...,901 - G線（橙線）的路線沒有變化。這條路線現在完全由電池電動巴士運行。,Tuyến 901 - Tuyến G (Màu cam) không bị điều ch...,901 – G 선(오렌지)의 노선은 변경되지 않습니다. 901번 버스는 현재 전기 ...,901 - Gライン（オレンジ）のルートに変更はありません。この路線は現在、完全に電気バスで...,901– G գծի (նարնջագույն) երթուղին կմնա անփոփոխ...,901 – Маршрут не меняется на Оранжевой линии G...,901
93,end,1,For more information on Metro service changes ...,Para más información sobre los cambios en los ...,有關Metro服務變化和其他Metro服務的更多信息，請撥打323.GO.METRO，或訪問...,Để biết thêm thông tin về các thay đổi dịch vụ...,메트로 서비스 변경 및 기타 메트로 서비스에 대한 자세한 내용은 323.GO MET...,メトロのサービス変更やその他のメトロのサービスに関する詳細は、メトロ・カスタマー・サービス・...,Metro -ի ծառայությունների փոփոխությունների և M...,Для получения дополнительной информации об изм...,0


# Output

Create a JSON file for each language.

In [6]:
for i in languages:
    df = takeone[['section','order', i,'line']].copy()
    df = df.rename(columns={i: 'content'})
    df.to_json('data-output/takeone-' + i + '.json',orient='records')

