## 꼭 알아둬야 할 자료 구조: 배열 (Array)

- 데이터를 나열하고, 각 데이터를 인덱스에 대응하도록 구성한 데이터 구조
- 파이썬에서는 리스트 타입이 배열 기능을 제공함

### 1. 배열은 왜 필요할까?
- '같은 종류'의 데이터를 효율적으로 관리하기 위해 사용
- '같은 종류'의 데이터를 순차적으로 저장  
(흩어져 있기 보다는 연결되어 있는 것이 좋다!)
![title](img/20200215_184451.png)
- 장점: 
  + 빠른 접근 가능
    * 첫 데이터의 위치에서 상대적인 위치로 데이터 접근(인덱스 번호로 접근)
- 단점: 
  + 데이터 추가/삭제의 어려움  
    (데이터의 길이가 가변적이면 어렵다)
    * 미리 최대 길이를 지정해야 함
  
> 엑셀로 이해해보기

### 2. 파이썬과 C 언어의 배열 예제

#### * C 언어 예: 영어 단어 저장

- 본래의 배열: 배열의 길이를 미리 지정해야한다.

``` c
#include <stdio.h>

int main(int argc, char * argv[])
{
    char country[3] = "US";
    printf ("%c%c\n", country[0], country[1]);
    printf ("%s\n", country);    
    return 0;
}
```

#### * JAVA 언어 예: 영어 단어 저장

```java
public static void main(String[] args) { 
    char[] country = new char[3]; 
    country[0] = 'U';
    country[1] = 'S';
    country[2] = 'A';
    System.out.println(country[0]); 
    System.out.println(country[1]); 
    System.out.println(country[2]);
}
```

#### * 파이썬 언어 예: 영어 단어 저장

- 배열의 길이를 지정하지 않는다.
- 추가를 하더라도 알아서 파이썬은 알아서 된다.

In [1]:
country = 'US'
print (country)

country = 'USA'
print (country)

US
USA


### 3. 파이썬과 배열
- 파이썬에서는 리스트로 배열 구현 가능

In [3]:
# 1차원 배열: 리스트로 구현시
data_list = [1, 2, 3, 4, 5]
data_list

[1, 2, 3, 4, 5]

In [2]:
# 2차원 배열: 리스트로 구현시
data_list = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
data_list

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

In [3]:
print (data_list[0])

print (data_list[0][0])
print (data_list[0][1])
print (data_list[0][2])
print (data_list[1][0])
print (data_list[1][1])

[1, 2, 3]
1
2
3
4
5


### 4. 프로그래밍 연습 

<div class="alert alert-block alert-warning">
<strong><font color="blue" size="3em">연습1: 위의 2차원 배열에서 9, 8, 7 을 순서대로 출력해보기</font></strong><br>
</div>

In [6]:
print (data_list[2][2])
print (data_list[2][1])
print (data_list[2][0])

9
8
7


In [7]:
dataset = ['Braund, Mr. Owen Harris',
'Cumings, Mrs. John Bradley (Florence Briggs Thayer)',
'Heikkinen, Miss. Laina',
'Futrelle, Mrs. Jacques Heath (Lily May Peel)',
'Allen, Mr. William Henry',
'Moran, Mr. James',
'McCarthy, Mr. Timothy J',
'Palsson, Master. Gosta Leonard',
'Johnson, Mrs. Oscar W (Elisabeth Vilhelmina Berg)',
'Nasser, Mrs. Nicholas (Adele Achem)',
'Sandstrom, Miss. Marguerite Rut',
'Bonnell, Miss. Elizabeth',
'Saundercock, Mr. William Henry',
'Andersson, Mr. Anders Johan',
'Vestrom, Miss. Hulda Amanda Adolfina',
'Hewlett, Mrs. (Mary D Kingcome) ',
'Rice, Master. Eugene',
'Williams, Mr. Charles Eugene',
'Vander Planke, Mrs. Julius (Emelia Maria Vandemoortele)',
'Masselmani, Mrs. Fatima',
'Fynney, Mr. Joseph J',
'Beesley, Mr. Lawrence',
'McGowan, Miss. Anna "Annie"',
'Sloper, Mr. William Thompson',
'Palsson, Miss. Torborg Danira',
'Asplund, Mrs. Carl Oscar (Selma Augusta Emilia Johansson)',
'Emir, Mr. Farred Chehab',
'Fortune, Mr. Charles Alexander',
'Dwyer, Miss. Ellen "Nellie"',
'Todoroff, Mr. Lalio']

<div class="alert alert-block alert-warning">
<strong><font color="blue" size="3em">연습2: 위의 dataset 리스트에서 전체 이름 안에 M 은 몇 번 나왔는지 빈도수 출력하기</font></div>

In [13]:
# 이차원 배열이다. 왜냐하면 list안에 문자열들이 있는데
# 문자열도 배열이기 때문이다.
m_count = 0
for data in dataset:
    # print(data)
    for index in range(len(data)):
        # print(index)
        if data[index] == 'M':
            m_count += 1
print(m_count)

38


### 참고
* range(stop): range(10)은 0, 1, 2, 3, 4, 5, 6, 7, 8, 9
* range(start, stop): range(1, 11)은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10
* range(start, stop, step): range(0, 20, 2)은 0, 2, 4, 6, 8, 10, 12, 14, 16, 18
  - start, stop, step은 음수로 지정 가능