# Assignment 3. Text Processing 2
---

### **함수 작성하기**

In [47]:
#######################
# Test Processing II  #
#######################
import re

def digits_to_words(input_string):
    """
    인풋으로 받는 스트링에서 숫자만 추출하여 영어 단어로 변환하여 단어들이 연결된 스트링을 반환함
    아래의 요건들을 충족시켜야함
    * 반환하는 단어들은 영어 소문자여야함
    * 단어들 사이에는 띄어쓰기 한칸이 있음
    * 만약 인풋 스트링에서 숫자가 존재하지 않는 다면, 빈 문자열 (empty string)을 반환함
        Parameters:
            input_string (string): 영어로 된 대문자, 소문자, 띄어쓰기, 문장부호, 숫자로 이루어진 string
            ex - "Zip Code: 19104"
        Returns:
            digit_string (string): 위 요건을 충족시킨 숫자만 영어단어로 추출된 string
            ex - 'one nine one zero four'
        Examples:
            >>> import text_processing2 as tp2
            >>> digits_str1 = "Zip Code: 19104"
            >>> tp2.digits_to_words(digits_str1)
            'one nine one zero four'
            >>> digits_str2 = "Pi is 3.1415..."
            >>> tp2.digits_to_words(digits_str2)
            'three one four one five'
    """
    dic = {0:"zero", 1:"one", 2:"two", 3:"three", 4:"four", 5:"five", 6:"six", 7:"seven", 8:"eight", 9:"nine"}
    digit_string = str()
    # 숫자만 추출
    input_string = re.sub(r'[^0-9]', '', input_string)
    # 문자열로 변화
    for i in input_string:
        digit_string += dic[int(i)] + ' '
    
    return digit_string.strip()


"""
컴퓨터 프로그래밍에 많은 명명 규칙이 있지만, 두 규칙이 특히 흔히 쓰입니다. 
첫번째로는, 변수 이름을 'underscore'로 나눠준다거나, (ex. under_score_variable)
두번째로는, 변수 이름을 대소문자 구별해 구분자 (delimiter)없이 쓰는 경우가 있습니다. 
이 두번째의 경우에는 첫번째 단어는 소문자로, 그 후에 오는 단어들의 첫번째 글자들은 대문자로 쓰입니다 (ex. camelCaseVariable). 
"""


def to_camel_case(underscore_str):
    """
    이 문제에서 첫번째 규칙 'underscore variable' 에서 두번째 규칙 'camelcase variable'으로 변환함
    * 앞과 뒤에 여러개의 'underscore'는 무시해도 된
    * 만약 어떤 변수 이름이 underscore로만 이루어 진다면, 빈 문자열만 반환해도 됨
        Parameters:
            underscore_str (string): underscore case를 따른 스트링
        Returns:
            camelcase_str (string): camelcase를 따른 스트링
        Examples:
            >>> import text_processing2 as tp2
            >>> underscore_str1 = "to_camel_case"
            >>> tp2.to_camel_case(underscore_str1)
            "toCamelCase"
            >>> underscore_str2 = "__EXAMPLE__NAME__"
            >>> tp2.to_camel_case(underscore_str2)
            "exampleName"
            >>> underscore_str3 = "alreadyCamel"
            >>> tp2.to_camel_case(underscore_str3)
            "alreadyCamel"
    """
    # 언더바만 있는 경우, 없는 경우 예외처리
    if set(underscore_str) == {'_'}:
        return ''
    if underscore_str.find('_') == -1:
        return underscore_str
    
    camelcase_str = str()
    # 소문자로 변환 후에
    # 단어들을 합침 (맨 앞만 대문자로 변환)
    underscore_str = underscore_str.lower()
    underscore_str = underscore_str.split('_')
    for i in underscore_str:
        if i != '':
            camelcase_str += i.capitalize()
    
    return camelcase_str.replace(camelcase_str[0], camelcase_str[0].lower())

In [48]:
# -*- coding: utf8 -*-

import unittest
import random

class TestTextProcessing(unittest.TestCase):
    def test_digits_to_words(self):
        test_str = ""
        pred = digits_to_words(test_str)
        self.assertEqual(pred, "")

        test_str = "Zip Code: 19104"
        pred = digits_to_words(test_str)
        self.assertEqual(pred, "one nine one zero four")

        test_str = "Pi is 3.1415..."
        pred = digits_to_words(test_str)
        self.assertEqual(pred, "three one four one five")

        test_str = "There are 3 jellies."
        pred = digits_to_words(test_str)
        self.assertEqual(pred, "three")

        test_str = "Your room number is 205."
        pred = digits_to_words(test_str)
        self.assertEqual(pred, "two zero five")

        test_str = "1588-1588"
        pred = digits_to_words(test_str)
        self.assertEqual(pred, "one five eight eight one five eight eight")

        test_str = "My number: 010-1234-5678"
        pred = digits_to_words(test_str)
        self.assertEqual(pred, "zero one zero one two three four five six seven eight")

        test_str = "No digits"
        pred = digits_to_words(test_str)
        self.assertEqual(pred, "")

        test_str = "No digits here too!?$%"
        pred = digits_to_words(test_str)
        self.assertEqual(pred, "")

    def test_to_camel_case(self):
        test_str = "to_camel_case"
        pred = to_camel_case(test_str)
        self.assertEqual(pred, "toCamelCase")

        test_str = "__EXAMPLE__NAME__"
        pred = to_camel_case(test_str)
        self.assertEqual(pred, "exampleName")

        test_str = "alreadyCamel"
        pred = to_camel_case(test_str)
        self.assertEqual(pred, "alreadyCamel")

        test_str = "_______"
        pred = to_camel_case(test_str)
        self.assertEqual(pred, "")

        test_str = ""
        pred = to_camel_case(test_str)
        self.assertEqual(pred, "")

        test_str = "not_Camel_Yet"
        pred = to_camel_case(test_str)
        self.assertEqual(pred, "notCamelYet")

        test_str = "NOT_CAMEL_Yet"
        pred = to_camel_case(test_str)
        self.assertEqual(pred, "notCamelYet")

        test_str = "abc_def_ghi"
        pred = to_camel_case(test_str)
        self.assertEqual(pred, "abcDefGhi")

        test_str = "     "
        pred = to_camel_case(test_str)
        self.assertEqual(pred, "     ")

        test_str = "....."
        pred = to_camel_case(test_str)
        self.assertEqual(pred, ".....")


### **Test Code**

아래는 본인이 짠 code가 맞는지 test하는 code입니다.

함수별로 test가 진행되고, AssertionError 없이 모두 통과하면 성공입니다!

만약 AssertionError가 발생했다면, 해당 Error가 어느 함수에서 발생했는지를 확인하고, 그 부분을 수정해주시면 되겠습니다.


In [49]:
ttp = TestTextProcessing()
ttp.test_digits_to_words()
ttp.test_to_camel_case()