<a href="https://colab.research.google.com/github/MasakazuNaganuma/WhirlwindTourOfPython/blob/master/06-Built-in-Data-Structures.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<!--BOOK_INFORMATION-->
<img align="left" style="padding-right:10px;" src="https://github.com/MasakazuNaganuma/WhirlwindTourOfPython/blob/master/fig/cover-small.jpg?raw=1">
*This notebook contains an excerpt from the [Whirlwind Tour of Python](http://www.oreilly.com/programming/free/a-whirlwind-tour-of-python.csp) by Jake VanderPlas; the content is available [on GitHub](https://github.com/jakevdp/WhirlwindTourOfPython).*

*The text and code are released under the [CC0](https://github.com/jakevdp/WhirlwindTourOfPython/blob/master/LICENSE) license; see also the companion project, the [Python Data Science Handbook](https://github.com/jakevdp/PythonDataScienceHandbook).*


<!--NAVIGATION-->
< [Built-In Types: Simple Values](05-Built-in-Scalar-Types.ipynb) | [Contents](Index.ipynb) | [Control Flow](07-Control-Flow-Statements.ipynb) >

# 組み込みのデータ構造
# Built-In Data Structures


We have seen Python's simple types: ``int``, ``float``, ``complex``, ``bool``, ``str``, and so on.
Python also has several built-in compound types, which act as containers for other types.
These compound types are:

Pythonのシンプルな型を見てきました。``int``, ``float``, ``complex``, ``bool``, ``str`` などです。
Python にはいくつかの複合型が組み込まれており、他の型のコンテナとして機能します。
これらの複合型は以下の通りです。

| Type Name | Example                   |Description                            |
|-----------|---------------------------|---------------------------------------|
| ``list``  | ``[1, 2, 3]``             | Ordered collection                    |
| ``tuple`` | ``(1, 2, 3)``             | Immutable ordered collection          |
| ``dict``  | ``{'a':1, 'b':2, 'c':3}`` | Unordered (key,value) mapping         |
| ``set``   | ``{1, 2, 3}``             | Unordered collection of unique values |

As you can see, round, square, and curly brackets have distinct meanings when it comes to the type of collection produced.
We'll take a quick tour of these data structures here.

ご覧のように、丸括弧、四角括弧、中括弧は、生成されるコレクションの種類によって異なる意味を持っています。
ここでは、これらのデータ構造について簡単に説明します。

## リスト
## Lists
Lists are the basic *ordered* and *mutable* data collection type in Python.
They can be defined with comma-separated values between square brackets; for example, here is a list of the first several prime numbers:

リストは Python の基本的な *ordered* および *mutable* データ収集型です。
これらのリストは、角括弧の間にカンマで区切られた値で定義することができます; 例えば、以下は最初の数個の素数のリストです。

In [0]:
L = [2, 3, 5, 7]

Lists have a number of useful properties and methods available to them.
Here we'll take a quick look at some of the more common and useful ones:

リストには多くの便利なプロパティやメソッドがあります。
ここでは、より一般的で便利なプロパティを簡単に見てみましょう。

In [0]:
# Length of a list
len(L)

4

In [0]:
# Append a value to the end
L.append(11)
L

[2, 3, 5, 7, 11]

In [0]:
# Addition concatenates lists
L + [13, 17, 19]

[2, 3, 5, 7, 11, 13, 17, 19]

In [0]:
# sort() method sorts in-place
L = [2, 5, 1, 6, 3, 4]
L.sort()
L

[1, 2, 3, 4, 5, 6]

In addition, there are many more built-in list methods; they are well-covered in Python's [online documentation](https://docs.python.org/3/tutorial/datastructures.html).

While we've been demonstrating lists containing values of a single type, one of the powerful features of Python's compound objects is that they can contain objects of *any* type, or even a mix of types. For example:

Python の [オンラインドキュメント](https://docs.python.org/3/tutorial/datastructures.html) で十分に説明されています。

ここまでは単一の型の値を含むリストのデモをしてきましたが、Pythonの複合オブジェクトの強力な機能の一つは、*any*型のオブジェクトを含むことができること、あるいは型が混在しているオブジェクトを含むことができることです。例えば、以下のようになります。

In [0]:
L = [1, 'two', 3.14, [0, 3, 5]]

This flexibility is a consequence of Python's dynamic type system.
Creating such a mixed sequence in a statically-typed language like C can be much more of a headache!
We see that lists can even contain other lists as elements.
Such type flexibility is an essential piece of what makes Python code relatively quick and easy to write.

So far we've been considering manipulations of lists as a whole; another essential piece is the accessing of individual elements.
This is done in Python via *indexing* and *slicing*, which we'll explore next.

この柔軟性は Python の動的型システムの結果です。
C言語のような静的型付けされた言語でこのような混合シーケンスを作成するのは、頭の痛い問題です。
リストは他のリストを要素として含むこともできます。
このような型の柔軟性は、Python のコードを比較的速く簡単に書くための重要な要素です。

ここまではリスト全体の操作について考えてきましたが、もう一つの重要な要素は個々の要素へのアクセスです。
これは Python で *indexing* と *slicing* を介して行われます。

### リストのインデックス作成とスライス
### List indexing and slicing
Python provides access to elements in compound types through *indexing* for single elements, and *slicing* for multiple elements.
As we'll see, both are indicated by a square-bracket syntax.
Suppose we return to our list of the first several primes:

Pythonは、単一の要素に対しては*indexing*、複数の要素に対しては*slicing*で複合型の要素へのアクセスを提供しています。
見ての通り、両方とも角括弧の構文で示されています。
最初の数個の素数のリストに戻るとしましょう。

In [0]:
L = [2, 3, 5, 7, 11]

Python uses *zero-based* indexing, so we can access the first and second element in using the following syntax:

Pythonは*zero-based*インデックスを使用しているので、以下の構文を使用して1番目と2番目の要素にアクセスすることができます。

In [0]:
L[0]

2

In [0]:
L[1]

3

Elements at the end of the list can be accessed with negative numbers, starting from -1:

リストの最後にある要素は、-1から始まる負の数でアクセスできます。

In [0]:
L[-1]

11

In [0]:
L[-2]

7

You can visualize this indexing scheme this way:

このようにして、このインデックス化スキームを可視化することができます。

![List Indexing Figure](https://github.com/MasakazuNaganuma/WhirlwindTourOfPython/blob/master/fig/list-indexing.png?raw=1)

Here values in the list are represented by large numbers in the squares; list indices are represented by small numbers above and below.
In this case, ``L[2]`` returns ``5``, because that is the next value at index ``2``.

ここではリストの値は四角の中の大きな数字で表され、リストのインデックスは上下の小さな数字で表されます。
この場合、 ``L[2]``はインデックス ``2`` の次の値である ``5`` を返します。

Where *indexing* is a means of fetching a single value from the list, *slicing* is a means of accessing multiple values in sub-lists.
It uses a colon to indicate the start point (inclusive) and end point (non-inclusive) of the sub-array.
For example, to get the first three elements of the list, we can write:

*indexing*がリストから単一の値を取得する手段であるのに対し、*slicing*はサブリスト内の複数の値にアクセスする手段です。
部分配列の開始点(包含)と終了点(非包含)を示すためにコロンを使用します。
例えば、リストの最初の3つの要素を取得するには、次のように書きます。

In [0]:
L[0:3]

[2, 3, 5]

Notice where ``0`` and ``3`` lie in the preceding diagram, and how the slice takes just the values between the indices.
If we leave out the first index, ``0`` is assumed, so we can equivalently write:

上の図で ``0`` と ``3`` がどこにあるか、そしてスライスがどのようにインデックス間の値だけを取るかに注目してください。
最初のインデックスを省略すると ``0`` が仮定されるので、等価的に書くことができます。

In [0]:
L[:3]

[2, 3, 5]

Similarly, if we leave out the last index, it defaults to the length of the list.
Thus, the last three elements can be accessed as follows:

同様に、最後のインデックスを省略すると、リストの長さがデフォルトになります。
したがって、最後の3つの要素は以下のようにアクセスできます。

In [0]:
L[-3:]

[5, 7, 11]

Finally, it is possible to specify a third integer that represents the step size; for example, to select every second element of the list, we can write:

最後に、ステップサイズを表す3番目の整数を指定することができます。例えば、リストの2番目の要素をすべて選択するには、次のように書きます。

In [0]:
L[::2]  # equivalent to L[0:len(L):2]

[2, 5, 11]

A particularly useful version of this is to specify a negative step, which will reverse the array:

特に便利なのは、負のステップを指定して配列を反転させることです。

In [0]:
L[::-1]

[11, 7, 5, 3, 2]

Both indexing and slicing can be used to set elements as well as access them.
The syntax is as you would expect:

インデックス作成とスライスの両方とも、要素の設定とアクセスに使用することができます。
構文は期待通りです。

In [0]:
L[0] = 100
print(L)

[100, 3, 5, 7, 11]


In [0]:
L[1:3] = [55, 56]
print(L)

[100, 55, 56, 7, 11]


A very similar slicing syntax is also used in many data science-oriented packages, including NumPy and Pandas (mentioned in the introduction).

Now that we have seen Python lists and how to access elements in ordered compound types, let's take a look at the other three standard compound data types mentioned earlier.

非常に似たようなスライシング構文は、NumPyやPandasなどのデータサイエンス向けの多くのパッケージでも使用されています（紹介文でも触れました）。

さて、Pythonのリストと、順序付き複合型の要素へのアクセス方法を見てきましたが、先に述べた他の3つの標準的な複合型データ型を見てみましょう。

## タプル
## Tuples

Tuples are in many ways similar to lists, but they are defined with parentheses rather than square brackets:

タプルは多くの点でリストに似ていますが、角括弧ではなく括弧で定義されています。

In [0]:
t = (1, 2, 3)

They can also be defined without any brackets at all:

また、括弧を全く付けずに定義することもできます。

In [0]:
t = 1, 2, 3
print(t)

(1, 2, 3)


Like the lists discussed before, tuples have a length, and individual elements can be extracted using square-bracket indexing:

前に説明したリストと同様に、タプルは長さを持ち、個々の要素は角括弧インデックスを使って抽出することができます。

In [0]:
len(t)

3

In [0]:
t[0]

1

The main distinguishing feature of tuples is that they are *immutable*: this means that once they are created, their size and contents cannot be changed:

タプルの主な特徴は、*immutable*であるということです：これは、一度作成されたタプルはサイズや内容を変更できないことを意味します。

In [0]:
t[1] = 4

TypeError: 'tuple' object does not support item assignment

In [0]:
t.append(4)

AttributeError: 'tuple' object has no attribute 'append'

Tuples are often used in a Python program; a particularly common case is in functions that have multiple return values.
For example, the ``as_integer_ratio()`` method of floating-point objects returns a numerator and a denominator; this dual return value comes in the form of a tuple:

Pythonのプログラムではタプルがよく使われますが、特に一般的なのは複数の戻り値を持つ関数です。
例えば、浮動小数点オブジェクトの ``as_integer_ratio()`` メソッドは分子と分母を返します。

In [0]:
x = 0.125
x.as_integer_ratio()

(1, 8)

These multiple return values can be individually assigned as follows:

In [0]:
numerator, denominator = x.as_integer_ratio()
print(numerator / denominator)

0.125


The indexing and slicing logic covered earlier for lists works for tuples as well, along with a host of other methods.
Refer to the online [Python documentation](https://docs.python.org/3/tutorial/datastructures.html) for a more complete list of these.

先ほどリストのために説明したインデックス作成とスライスのロジックは、他の多くのメソッドと同様にタプルでも動作します。
これらのより完全なリストについては、オンラインの [Python documentation](https://docs.python.org/3/tutorial/datastructures.html) を参照してください。

## 辞書
## Dictionaries
Dictionaries are extremely flexible mappings of keys to values, and form the basis of much of Python's internal implementation.
They can be created via a comma-separated list of ``key:value`` pairs within curly braces:

辞書はキーと値の非常に柔軟なマッピングであり、Pythonの内部実装の多くの基礎を形成しています。
辞書は中括弧の中にある ``key:value`` のペアをカンマで区切ったリストで作成することができます。

In [0]:
numbers = {'one':1, 'two':2, 'three':3}

Items are accessed and set via the indexing syntax used for lists and tuples, except here the index is not a zero-based order but valid key in the dictionary:

リストやタプルに使用されるインデックス構文を使用してアイテムにアクセスしたり設定したりします。

In [0]:
# Access a value via the key
numbers['two']

2

New items can be added to the dictionary using indexing as well:

インデックスを使用して辞書に新しい項目を追加することもできます。

In [0]:
# Set a new key:value pair
numbers['ninety'] = 90
print(numbers)

{'three': 3, 'ninety': 90, 'two': 2, 'one': 1}


Keep in mind that dictionaries do not maintain any sense of order for the input parameters; this is by design.
This lack of ordering allows dictionaries to be implemented very efficiently, so that random element access is very fast, regardless of the size of the dictionary (if you're curious how this works, read about the concept of a *hash table*).
The [python documentation](https://docs.python.org/3/library/stdtypes.html) has a complete list of the methods available for dictionaries.

辞書は入力パラメータの順序を保持していないことを覚えておいてください。
このように順序がないため、辞書を非常に効率的に実装することができ、辞書のサイズに関係なく、ランダムな要素へのアクセスが非常に高速になります (これがどのように動作するのか興味がある場合は、*hash table*の概念を読んでください)。
The [python documentation](https://docs.python.org/3/library/stdtypes.html) に、辞書で利用可能なメソッドの完全なリストがあります。

## セット
## Sets

The fourth basic collection is the set, which contains unordered collections of unique items.
They are defined much like lists and tuples, except they use the curly brackets of dictionaries:

4 番目の基本的なコレクションはセットで、ユニークなアイテムの順序なしのコレクションを含みます。
これらは、辞書の中括弧を使用する以外は、リストやタプルとよく似て定義されています。

In [0]:
primes = {2, 3, 5, 7}
odds = {1, 3, 5, 7, 9}

If you're familiar with the mathematics of sets, you'll be familiar with operations like the union, intersection, difference, symmetric difference, and others.
Python's sets have all of these operations built-in, via methods or operators.
For each, we'll show the two equivalent methods:

集合の数学に精通している人ならば、和、交点、差、対称差などの演算に精通しているでしょう。
Pythonの集合には、メソッドや演算子を介してこれらの演算が組み込まれています。
それぞれについて、2つの等価なメソッドを紹介します。

In [0]:
# union: items appearing in either
primes | odds      # with an operator
primes.union(odds) # equivalently with a method

{1, 2, 3, 5, 7, 9}

In [0]:
# intersection: items appearing in both
primes & odds             # with an operator
primes.intersection(odds) # equivalently with a method

{3, 5, 7}

In [0]:
# difference: items in primes but not in odds
primes - odds           # with an operator
primes.difference(odds) # equivalently with a method

{2}

In [0]:
# symmetric difference: items appearing in only one set
primes ^ odds                     # with an operator
primes.symmetric_difference(odds) # equivalently with a method

{1, 2, 9}

Many more set methods and operations are available.
You've probably already guessed what I'll say next: refer to Python's [online documentation](https://docs.python.org/3/library/stdtypes.html) for a complete reference.

他にもたくさんのセットメソッドや操作が用意されています。
次に何を言おうとしているかはもうお分かりでしょう: Python の [オンラインドキュメント](https://docs.python.org/3/library/stdtypes.html) を参照してください。

## その他の特殊なデータ構造体
## More Specialized Data Structures

Python contains several other data structures that you might find useful; these can generally be found in the built-in ``collections`` module.
The collections module is fully-documented in [Python's online documentation](https://docs.python.org/3/library/collections.html), and you can read more about the various objects available there.

In particular, I've found the following very useful on occasion:

- ``collections.namedtuple``: Like a tuple, but each value has a name
- ``collections.defaultdict``: Like a dictionary, but unspecified keys have a user-specified default value
- ``collections.OrderedDict``: Like a dictionary, but the order of keys is maintained

Once you've seen the standard built-in collection types, the use of these extended functionalities is very intuitive, and I'd suggest [reading about their use](https://docs.python.org/3/library/collections.html).

Pythonは他にも便利なデータ構造をいくつか持っています; これらは一般的に組み込みの ``collections`` モジュールの中にあります。
これらは一般的に組み込みの ``collections`` モジュールで見つけることができます。collections モジュールは [Python のオンラインドキュメント](https://docs.python.org/3/library/collections.html) で完全に文書化されており、そこで利用可能な様々なオブジェクトについての詳細を読むことができます。

特に、以下のようなものが非常に便利だと感じたことがあります。

- ``collections.namedtuple``. タプルのようなものですが、それぞれの値に名前がついています。
- ``collections.defaultdict``. 辞書のようなものですが、指定されていないキーはユーザが指定したデフォルト値を持ちます。
- ``collections.OrderedDict``. 辞書のようなものですが、キーの順番は維持されます。

標準のビルトインコレクションタイプを見た後は、これらの拡張機能の使用は非常に直感的で、[その使用法](https://docs.python.org/3/library/collections.html)を読むことをお勧めします。

<!--NAVIGATION-->
< [Built-In Types: Simple Values](05-Built-in-Scalar-Types.ipynb) | [Contents](Index.ipynb) | [Control Flow](07-Control-Flow-Statements.ipynb) >