本課程將介紹基本的Python類型：**字串(String)**和**字典(Dictionaries)**。

# 字串 String
Python語言真正發揮作用的地方之一是對字符串的操作。 本節將介紹Python的一些內置字符串方法和格式化(formatting)操作。

這種字符串操作模式通常在數據科學工作的背景下出現，並且在這種情況下是Python的一大優勢。

# 字串語法
在上一課程中，已經看到了很多字串的示例，簡單回顧，我們可以使用單引號' '或雙引號" "定義Python中的字符串。 它們在功能上是等效的。

In [2]:
x = 'Pluto is a planet'
y = "Pluto is a planet"
x == y

True

如果您的字符串包含單引號字符（例如要表示apostrophe），則雙引號會很方便。<br>
同樣，如果將字符串用單引號引起來，則創建包含雙引號的字符串很容易：

In [4]:
print("Pluto's a planet!")
print('My dog is named "Pluto"')

Pluto's a planet!
My dog is named "Pluto"


如果我們嘗試將單引號字符放在單引號字符串中，Python會感到困惑：

In [6]:
'Pluto's a planet!'

SyntaxError: invalid syntax (<ipython-input-6-a43631749f52>, line 1)

我們可以通過用反斜杠“轉義”單引號來解決此問題。

下表總結了反斜杠字符的一些重要用法。<br><br>

| What you type... | What you get |	example	| print(example) |
| ------ | ------ | ------ | ------ |
| \' | ' | 'What\'s up?' |	What's up? |
| \" | " | "That's \"cool\"" |	That's "cool" |
| \\ | \ | "Look, a mountain: /\\" | Look, a mountain: /\ |
| \n |	 | "1\n2 3" | 1 <br> 2 3 |

最後一個範例 `\n` 代表換行符。 它使Python開始新的一行。

In [9]:
hello = "hello\nworld"
print(hello)

hello
world


此外，Python的字符串三重引號語法讓我們包括字面換行符（即通過只是按'Enter'於我們的鍵盤上，而不是使用特殊的'\ n'序列）。 我們已經在用來記錄函數的文檔字符串中看到了這一點，但是我們可以在想要定義字符串的任何地方使用它們。

In [10]:
triplequoted_hello = """hello
world"""
print(triplequoted_hello)
triplequoted_hello == hello

hello
world


True

除非我們為關鍵字參數end指定一個默認值' `\n` '以外的值，否則 `print()` 函數會自動添加換行符：

In [11]:
print("hello")
print("world")
print("hello", end='')
print("pluto", end='')

hello
world
hellopluto

字符串是序列
字符串可以被視為是字符序列。 我們幾乎可以看到的所有我們可以對列表執行的操作，也可以對字符串執行的操作。

In [13]:
# Indexing
planet = 'Pluto'
planet[0]

'P'

In [14]:
# Slicing
planet[-3:]

'uto'

In [15]:
# How long is this string?
len(planet)

5

In [16]:
# Yes, we can even loop over them
[char+'! ' for char in planet]

['P! ', 'l! ', 'u! ', 't! ', 'o! ']

但是它們與列表不同的一個主要方式是它們是不可變的。 我們無法修改它們。

In [17]:
planet[0] = 'B'

TypeError: 'str' object does not support item assignment

# 字串方法 String methods
像 `List` 一樣，類型 `str` 有很多非常好用的方法。 這裡顯示一些示例。

In [18]:
# ALL CAPS
claim = "Pluto is a planet!"
claim.upper()

'PLUTO IS A PLANET!'

In [19]:
# all lowercase
claim.lower()

'pluto is a planet!'

In [20]:
# Searching for the first index of a substring
claim.index('plan')

11

In [21]:
claim.startswith(planet)

True

In [22]:
claim.endswith('dwarf planet')

False

# 穿梭在字符串和列表之間：.split() 和.join()
`str.split()` 將字符串轉換為較小字符串的陣列，預設情況下會在空白處斷開。 這對於將您從一個大字符串帶到一個單詞列表非常有用。

In [23]:
words = claim.split()
words

['Pluto', 'is', 'a', 'planet!']

有時，您可能希望在除空格之外的其他內容上進行拆分：

In [25]:
datestr = '1956-01-31'
year, month, day = datestr.split('-')
print(year, month, day)

1956 01 31


`str.join()` 將我們給我們另一個方向，將一串字符串縫成一個長字符串，並使用它作為分隔符的字符串。

In [27]:
'/'.join([month, day, year])

'01/31/1956'

In [28]:
# Yes, we can put unicode characters right in our string literals :)
' 👏 '.join([word.upper() for word in words])

'PLUTO 👏 IS 👏 A 👏 PLANET!'

# 使用.format() 構建字符串
Python讓我們用 `+` 運算符連接字符串。

In [29]:
planet + ', we miss you.'

'Pluto, we miss you.'

如果我們要拋出任何非字符串對象，則必須先對它們調用str()。

In [30]:
position = 9
planet + ", you'll always be the " + position + "th planet to me."

TypeError: can only concatenate str (not "int") to str

In [31]:
position = 9
planet + ", you'll always be the " + str(position) + "th planet to me."

"Pluto, you'll always be the 9th planet to me."

這變得越來越不好閱讀和打字。 使用str.format() 進行救援。

In [32]:
"{}, you'll always be the {}th planet to me.".format(planet, position)

"Pluto, you'll always be the 9th planet to me."

乾淨許多了！ 我們在“格式字符串”上調用 `.format()` ，其中要插入的Python值用 `{}` 佔位符表示。

請注意，我們甚至不必調用 `str()` 即可將位置轉換為int。 `format()` 為我們解決了這一問題。

如果 `format()` 就能做到全部的事情，它將非常有用。 但事實證明，它可以做的更多。 以下只是一個範例：

In [33]:
pluto_mass = 1.303 * 10**22
earth_mass = 5.9722 * 10**24
population = 52910390
#         2 decimal points   3 decimal points, format as percent     separate with commas
"{} weighs about {:.2} kilograms ({:.3%} of Earth's mass). It is home to {:,} Plutonians.".format(
    planet, pluto_mass, pluto_mass / earth_mass, population,
)

"Pluto weighs about 1.3e+22 kilograms (0.218% of Earth's mass). It is home to 52,910,390 Plutonians."

In [34]:
# Referring to format() arguments by index, starting from 0
s = """Pluto's a {0}.
No, it's a {1}.
{0}!
{1}!""".format('planet', 'dwarf planet')
print(s)

Pluto's a planet.
No, it's a dwarf planet.
planet!
dwarf planet!


您可能只在 `str.format` 上寫了一本簡短的書，所以我就在這裡停止，並推薦去[pyformat.info](https://google.com)和[官方文檔](https://docs.python.org/3/library/string.html#formatstrings)以供進一步閱讀。

# 字典 Dictionaries
字典是內置的Python資料結構，用於將鍵映射到值。

In [35]:
numbers = {'one':1, 'two':2, 'three':3}

在這種情況下，“`one`”，“`two`”和“`three`”是**鍵keys**，而1、2和3是它們的對應**值values**。

通過方括號語法訪問值，類似於索引列表和字符串

In [36]:
numbers['one']

1

我們可以使用相同的語法添加另一對值鍵

In [37]:
numbers['eleven'] = 11
numbers

{'one': 1, 'two': 2, 'three': 3, 'eleven': 11}

或更改與現有鍵關聯的值

In [38]:
numbers['one'] = 'Pluto'
numbers

{'one': 'Pluto', 'two': 2, 'three': 3, 'eleven': 11}

Python具有字典表達式，其語法與我們在上一教程中看到的陣列表達式相似。

In [39]:
planets = ['Mercury', 'Venus', 'Earth', 'Mars', 'Jupiter', 'Saturn', 'Uranus', 'Neptune']
planet_to_initial = {planet: planet[0] for planet in planets}
planet_to_initial

{'Mercury': 'M',
 'Venus': 'V',
 'Earth': 'E',
 'Mars': 'M',
 'Jupiter': 'J',
 'Saturn': 'S',
 'Uranus': 'U',
 'Neptune': 'N'}

 `in` 運算符告訴我們字典中這個鍵是否存在

In [40]:
'Saturn' in planet_to_initial

True

In [41]:
'Betelgeuse' in planet_to_initial

False

字典的for循環將遍歷其鍵

In [42]:
for k in numbers:
    print("{} = {}".format(k, numbers[k]))

one = Pluto
two = 2
three = 3
eleven = 11


我們可以分別通過 `dict.keys()` 和 `dict.values()` 訪問所有鍵或所有值的集合。

In [43]:
# Get all the initials, sort them alphabetically, and put them in a space-separated string.
' '.join(sorted(planet_to_initial.values()))

'E J M M N S U V'

非常有用的 `dict.items()` 方法使我們可以同時迭代字典的鍵和值。 （在Python術語中，**item** 是指一對鍵值）

In [44]:
for planet, initial in planet_to_initial.items():
    print("{} begins with \"{}\"".format(planet.rjust(10), initial))

   Mercury begins with "M"
     Venus begins with "V"
     Earth begins with "E"
      Mars begins with "M"
   Jupiter begins with "J"
    Saturn begins with "S"
    Uranus begins with "U"
   Neptune begins with "N"


要閱讀完整的詞典方法清單，請單擊下面的“輸出”按鈕以閱讀完整的幫助頁面，或查閱[官方的在線文檔](https://docs.python.org/3/library/stdtypes.html#dict)。

In [45]:
help(dict)

Help on class dict in module builtins:

class dict(object)
 |  dict() -> new empty dictionary
 |  dict(mapping) -> new dictionary initialized from a mapping object's
 |      (key, value) pairs
 |  dict(iterable) -> new dictionary initialized as if via:
 |      d = {}
 |      for k, v in iterable:
 |          d[k] = v
 |  dict(**kwargs) -> new dictionary initialized with the name=value pairs
 |      in the keyword argument list.  For example:  dict(one=1, two=2)
 |  
 |  Methods defined here:
 |  
 |  __contains__(self, key, /)
 |      True if the dictionary has the specified key, else False.
 |  
 |  __delitem__(self, key, /)
 |      Delete self[key].
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __getitem__(...)
 |      x.__getitem__(y) <==> x[y]
 |  
 |  __gt__(self, value, /)
 |      Return self>value.
 |  
 |  __init__(self,