### 隨機取後不放回
  
* 語法為 ${\rm random.sample(循序結構,\space k=x)}$
* 可以達到由循序結構中取出 $\rm{x}$ 個不重複的元素組成的串列

In [None]:
import random

print(random.sample('Pneumonoultramicroscopicsilicovolcanoconiosis', k=10))
# print(random.sample(['red', 'blue', 'yellow', 'green', 'white', 'black'], k=3))
# print(random.sample(range(10000000), k=60))

### 簡單樂透模擬
<br>

我們可以利用 $\rm{random.sample()}$ 的性質來模擬樂透。假設樂透一張 ${50}$ 元，每期開獎 ${6}$ 個號碼，而我們想要知道購買 ${500}$ 張的盈虧情形：  
1. 為求簡化，我們假設對中任 $3$ 碼，可得 $400$ 元；對中任 $4$ 碼，可得 $2000$ 元；對中任 $5$ 碼，可得 $200000$ 元；對中全部的 $6$ 碼，可得 $100000000$
2. 先隨機由 $49$ 個數字中選取不重複的 $6$ 個，存到變數中作為開獎號碼
3. 隨機抽取 $49$ 個數字中不重複的 $6$ 個，比對總共對中幾個號碼。可利用 $\rm{for}$ 迴圈加上 $\rm {in}$ 來達成這項功能
4. 重複 $500$ 次 $2.$ 和 $3.$，用贏得的獎金總額扣掉付出的彩券總額，即為盈虧情形

### 字串方法
<br>

* 指的是字串這個$\color{orange}{型態專屬}$的功能
* 呼叫成其他型態的方法極有可能跳出錯誤；即便呼叫成功，功能也有很大機會不是原先預想的樣子
* 呼叫方法的時候，直接把方法名稱加到變數名稱後面，中間用點「.」分開

### $\rm{upper()}$ 與 $\rm{lower()}$
<br>

* 顧名思義，將字串全部轉為大寫或小寫
* 由於 Python 將同一字母的大小寫做嚴格認定，因此做字串解析時，經常是全部先轉為小寫再進行比對

In [None]:
word1 = 'banana'
word2 = 'BANANA'
print(word1 == word2)
word2 = word2.lower()
print(word1 == word2)
# print(word1 == word2.lower()) # 上面兩行可合併為一行

### $\rm{find()}$
<br>

* 用來找出字串中我們某字元或某字串的$\color{orange}{索引值位置}$
* 若字串中有一個以上符合搜尋條件的字元或字串，只會顯示索引值最小的那個；若完全沒有相符的搜尋結果，則會顯示 $\color{orange}{-1}$
* 此時，可以放進第二個參數，來指定尋找的起始位置

In [1]:
word = 'banana'
index = word.find('a')
print(index)
print(word.find('na'))
print(word.find('na', 3))

1
2
4


### $\rm{count()}$
<br>

* 用來計算某字元或某字串在一個字串中出現的次數
* 注意$\color{orange}{重疊}$的子集合只會被計算一次

In [2]:
s = 'This is a banana. That is a banana. They are bananas.'
banana_count = s.count('banana')
print(banana_count)
# print(s.count('an'))
# print(s.count('ana'))

0


### $\rm{startswith()}$ 與 $\rm{endswith()}$
<br>

* 顧名思義，用來偵測某字串是否以某字元或字串開頭 (結尾)
* 一樣需要注意，大小寫會被視為不同，因此最好先做大小寫轉換

In [2]:
line = 'Have a nice day'
print(line.startswith('Have'))
print(line.startswith('h'))

# line = line.lower()
# print(line.startswith('h'))
# print(line.lower().startswith('h')) # 上面兩行可合併為一行

True
False


### $\rm{strip()}$
<br>

* 用來刪除字串的開頭之前和結尾之後的空格，$\rm{tab}$ 或換行符號
* 處理純文字檔案時極為常用的功能

In [None]:
line = '  Here we go  '
print(line.strip())

### $\rm{split()}$
<br>

* 將字串中的某字元 (預設值為空格) 當作分隔符號，拆開該字串，並儲存於$\color{orange}{串列}$之中回傳
* 經常搭配 $\rm{strip()}$ 一起使用。可用來做為初級文字探勘問題的資料前處理手段

In [None]:
s1 = 'I love you. You complete me.'
s2 = 'Shut up. Just shut up. You had me at hello. You had me at hello.'
s3 = 'name,sex,id_no,birth_place,residency'
words1 = s1.split()
print(words1)
print(s2.split())
print(s3.split(','))

### $\rm{join()}$
<br>

* 將串列中的每個$\color{orange}{字串元素}$，經由指定的分隔字元，來結合成一個新的$\color{orange}{字串}$後回傳
    * 也就是說，這個要被拿來結合成新字串的串列中的所有元素，都必須是字串型態
* 與 $\rm{split()}$ 是一體的兩面，是非常常用的字串方法
* 語法為 $\color{orange}{分隔字元}$.$\rm{join(串列)}$

In [None]:
s1 = 'I love you. You complete me.'
words1 = s1.split()
print(words1)
s2 = ''.join(words1)
print(s2)
# k = ['11', '18', '99', '3']
# s3 = ' '.join(k)
# print(s3)