<a href="https://colab.research.google.com/github/alexlaurence/DoReMi/blob/master/DoReMi.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Installation

In [0]:
!pip install feedparser
!pip install --upgrade google-cloud-speech

In [0]:
import feedparser
import re, os, glob, shutil

from google.cloud import texttospeech
from google.oauth2 import service_account

from IPython.display import Audio
from scipy.io import wavfile

To generate speech, you need a credentials json file tied your Google Cloud account:

In [0]:
#set API Credentials
os.environ["GOOGLE_APPLICATION_CREDENTIALS"]='/content/My First Project-a8dd55fddd5e.json'

## DoReMi (v0.1.0-alpha)

By Alexander Laurence (alexander.adamlaurence@gmail.com)

http://celestial.tokyo/~AlexLaurence/

DoReMi is a tool for blind users to search job listings from by synthesising job listing RSS feeds from Scout.co.kr into speech with the help of Google's Text-to-Speech API powered by a WaveNet model.

**Why Google Text-to-Speech?**

The Text-to-Speech API creates raw audio data of natural, human speech. That is, it creates audio that sounds like a person talking. When you send a synthesis request to the Text-to-Speech API, you must specify a voice that 'speaks' the words.

**Why WaveNet?**

A WaveNet generates speech that sounds more natural than other text-to-speech systems. It synthesizes speech with more human-like emphasis and inflection on syllables, phonemes, and words. On average, a WaveNet produces speech audio that people prefer over other text-to-speech technologies.

Unlike most other text-to-speech systems, a WaveNet model creates raw audio waveforms from scratch. The model uses a neural network that has been trained using a large volume of speech samples. During training, the network extracts the underlying structure of the speech, such as which tones follow each other and what a realistic speech waveform looks like. When given a text input, the trained WaveNet model can generate the corresponding speech waveforms from scratch, one sample at a time, with up to 24,000 samples per second and seamless transitions between the individual sounds.

## Try it out!

In [102]:
def start():
  
  credentials = service_account.Credentials.from_service_account_file('/content/My First Project-a8dd55fddd5e.json')
  client = texttospeech.TextToSpeechClient(credentials=credentials)
  
  # set xml url as strings
  seoul = "http://feeds.feedburner.com/co/clsY"
  gangwon = "http://feeds.feedburner.com/co/Utav"
  gyeonggi = "http://feeds.feedburner.com/co/lUKP"
  gyeongnam = "http://feeds.feedburner.com/co/rMCwN"
  gyeongbuk = "http://feeds.feedburner.com/co/Dhwm"
  gwangju = "http://feeds.feedburner.com/co/LXwe"
  daegu = "http://feeds.feedburner.com/co/Bcsg"
  daejeon = "http://feeds.feedburner.com/co/zBIF"
  busan = "http://feeds.feedburner.com/co/dkiFn"
  ulsan = "http://feeds.feedburner.com/co/LFJz"
  incheon = "http://feeds.feedburner.com/co/EkCu"
  jeonnam = "http://feeds.feedburner.com/co/wjlNw"
  jeonbuk = "http://feeds.feedburner.com/co/ZaXx"
  jeju = "http://feeds.feedburner.com/co/viTpC"
  chungnam = "http://feeds.feedburner.com/co/yIBb"
  chungbuk = "http://feeds.feedburner.com/co/aXuFR"
  national = "http://feeds.feedburner.com/co/TmxG"

  # ask user to enter the city
  get_city = input('도시 이름: ').lower()
  print('OK! {}. 잠시만 기다려주세요...'.format(get_city))
  
  # set the value to the corresponding xml url
  if get_city == '서울' or get_city == 'seoul':
    get_city = seoul
  elif get_city == '강원' or get_city == 'gangwon':
    get_city = gangwon
  elif get_city == '경기' or get_city == 'gyeonggi':
    get_city = gyeonggi
  elif get_city == '경남' or get_city == 'gyeongnam':
    get_city = gyeongnam
  elif get_city == '경북' or get_city == 'gyeongbuk':
    get_city = gyeongbuk
  elif get_city == '광주' or get_city == 'gwangju':
    get_city = gwangju
  elif get_city == '대구' or get_city == 'daegu':
    get_city = daegu
  elif get_city == '대전' or get_city == 'daejeon':
    get_city = daejeon
  elif get_city == '부산' or get_city == 'busan':
    get_city = busan
  elif get_city == '울산' or get_city == 'ulsan':
    get_city = ulsan
  elif get_city == '인천' or get_city == 'incheon':
    get_city = incheon
  elif get_city == '전남' or get_city == 'jeonnam':
    get_city = jeonnam
  elif get_city == '전북' or get_city == 'jeonbuk':
    get_city = jeonbuk
  elif get_city == '제주' or get_city == 'jeju':
    get_city = jeju
  elif get_city == '충남' or get_city == 'chungnam':
    get_city = chungnam
  elif get_city == '충북' or get_city == 'chungbuk':
    get_city = chungbuk
  elif get_city == '전국' or get_city == 'national':
    get_city = national
  else:
    print('미안 난 이해를 못 했어...')
    start()

  # parse RSS feed
  feed = feedparser.parse(get_city)
  feed_title = feed['feed']['title']
  feed_entries = feed.entries
  
  # set voice settings
  voice = texttospeech.types.VoiceSelectionParams(
      language_code='ko-KR',
      name='ko-KR-Wavenet-A',
      ssml_gender=texttospeech.enums.SsmlVoiceGender.FEMALE)

  audio_config = texttospeech.types.AudioConfig(
      audio_encoding=texttospeech.enums.AudioEncoding.MP3,
      speaking_rate=0.6)
  
  # Create directory
  dst = '/content/audio/'
  if not os.path.exists(dst):
    os.makedirs(dst)

  # read entries
  i=1
  for entry in feed.entries:
    article_title = entry.title
    article_description = entry.description
    article_link = entry.link
    
    clean_title = re.sub("-", "", article_title)
    clean_description = re.sub("<.*?>", "", article_description)
    clean_description2 = re.sub(":", "", clean_description)
    clean_description3 = re.sub("·", " ", clean_description2)
    clean_description4 = re.sub("-", "", clean_description3)
    
    print("\n {} {}".format(clean_title, clean_description4))
    
    # synthesise text to speech
    input_text = texttospeech.types.SynthesisInput(text=clean_title+clean_description4)
    response = client.synthesize_speech(input_text, voice, audio_config)
    
    # The response's audio_content is binary.
    with open('listing_{}.mp3'.format(i), 'wb') as out:
        out.write(response.audio_content)
        print('\n')
        display(Audio('listing_{}.mp3'.format(i),rate=44100))
        
        src = "/content/"
        shutil.move(os.path.join(src, "listing_{}.mp3".format(i)), os.path.join(dst, "listing_{}.mp3".format(i)))
        #print('Audio content written to file "output.mp3"')
                
    i=i+1
    
print('DoReMi에서 오신 것을 환영합니다!')
start()

DoReMi에서 오신 것을 환영합니다!
도시 이름: incheon
OK! incheon. 잠시만 기다려주세요...

 서강물류  (주)서강물류서비스 신규차주+소유자모집 LG그룹물량계약. 화물운송 순수600 주5일 직접배차물량보장초보자  회사명  서강물류 모집내용  서강물류  (주)서강물류서비스 신규차주+소유자모집 LG그룹물량계약. 화물운송 순수600 주5일 직접배차물량보장초보자 직종   근무형태  정규직 경력  무관 학력  무관 지역  대구, 대구, 경북, 경북, 경기, 경기, 인천, 서울 마감일  채용시까지 입사지원하기 서강물류 기업의 진행중인 채용정보 보기





 (주)롯데TLS  운전/1톤투잡600만원/5톤제주도왕복/.1000만원순수입  회사명  (주)롯데TLS 모집내용  (주)롯데TLS  운전/1톤투잡600만원/5톤제주도왕복/.1000만원순수입 직종   근무형태  정규직, 계약직, 파견직, 전 체 경력  무관 학력  무관 지역  서울, 경기, 인천, 경기, 경기, 경기, 경기, 경기 마감일  수시채용 입사지원하기 (주)롯데TLS 기업의 진행중인 채용정보 보기





 서강물류  (주)서강화물/당사물량.직영배차 LG하우시스/미쓰비시 5톤14톤 윙바디 지입모집/ 월600800/ 주5일  회사명  서강물류 모집내용  서강물류  (주)서강화물/당사물량.직영배차 LG하우시스/미쓰비시 5톤14톤 윙바디 지입모집/ 월600800/ 주5일 직종   근무형태  정규직 경력  무관 학력  무관 지역  서울, 대구, 대전, 부산, 인천, 충북, 충남, 경기 마감일  채용시까지 입사지원하기 서강물류 기업의 진행중인 채용정보 보기





 서강물류  주5일.월금/대기업 LG이노텍/월수입600/수도권경상권 윙바디 지입운송/초보자가능/전액할부가능  회사명  서강물류 모집내용  서강물류  주5일.월금/대기업 LG이노텍/월수입600/수도권경상권 윙바디 지입운송/초보자가능/전액할부가능 직종   근무형태  정규직 경력  무관 학력  무관 지역  서울, 강원, 경기, 경남, 인천, 부산, 대구, 경북 마감일  채용시까지 입사지원하기 서강물류 기업의 진행중인 채용정보 보기





 서강물류  (주)서강화물 주5일근무 LG산전 5톤14톤 윙바디 지입운송/월600800/주5일/초보자가능  회사명  서강물류 모집내용  서강물류  (주)서강화물 주5일근무 LG산전 5톤14톤 윙바디 지입운송/월600800/주5일/초보자가능 직종   근무형태  정규직 경력  무관 학력  무관 지역  인천, 강원, 경기, 서울, 부산, 대구, 충남, 충북 마감일  채용시까지 입사지원하기 서강물류 기업의 진행중인 채용정보 보기





 (주)한국종합로지스  평생직장 삼성/롯데/LG.. 운송직모집 정년없이 장기간 근무가능 평생직장 주5일근무 월 600만원 지입기사/  회사명  (주)한국종합로지스 모집내용  (주)한국종합로지스  평생직장 삼성/롯데/LG.. 운송직모집 정년없이 장기간 근무가능 평생직장 주5일근무 월 600만원 지입기사/ 직종   근무형태  정규직, 계약직 경력  무관 학력  무관 지역  대전, 부산, 부산, 부산, 부산, , 인천 마감일  채용시까지 입사지원하기 (주)한국종합로지스 기업의 진행중인 채용정보 보기





 서강물류  (주)서강화물  구미 LS산전  군포 가온전선 5톤14톤 윙바디 지입차주모집/월600800/주5일/초보자가능  회사명  서강물류 모집내용  서강물류  (주)서강화물  구미 LS산전  군포 가온전선 5톤14톤 윙바디 지입차주모집/월600800/주5일/초보자가능 직종   근무형태  정규직 경력  무관 학력  무관 지역  경기, 경기, 경기, 서울, 서울, 경기, 인천, 인천 마감일  채용시까지 입사지원하기 서강물류 기업의 진행중인 채용정보 보기





 서강물류  주5일.월금 / 대기업 LG이노텍 윙바디운송 수도권경상권 지입모집/초보자가능/월600800/전액할부가능  회사명  서강물류 모집내용  서강물류  주5일.월금 / 대기업 LG이노텍 윙바디운송 수도권경상권 지입모집/초보자가능/월600800/전액할부가능 직종   근무형태  정규직 경력  무관 학력  무관 지역  서울, 경기, 경남, 경북, 대구, 대전, 부산, 인천 마감일  채용시까지 입사지원하기 서강물류 기업의 진행중인 채용정보 보기





 대산물류  대기업 빙그레 유제품 배송직/월500만이상/유류비도로비 전액지원  회사명  대산물류 모집내용  대산물류  대기업 빙그레 유제품 배송직/월500만이상/유류비도로비 전액지원 직종   근무형태  계약직, 도급 경력  무관 학력  무관 지역  서울, 서울, 서울, 인천, 경기, 경기, 경기, 경기 마감일  채용시까지 입사지원하기 대산물류 기업의 진행중인 채용정보 보기





 대산물류  야간 대기업 식자재 아워홈 배송직원 채용공고  회사명  대산물류 모집내용  대산물류  야간 대기업 식자재 아워홈 배송직원 채용공고 직종   근무형태  계약직, 도급 경력  무관 학력  무관 지역  서울, 인천, 경기, 경기, 경기 마감일  채용시까지 입사지원하기 대산물류 기업의 진행중인 채용정보 보기


