# **05 배열**

## **05-1 배열 개념** 

배열운 인덱스와 값을 일대일 대응해 관리하는 자료구조다. 데이터를 저장할 수 있는 모든 공간은 인덱스와 일대일 대응하므로 어떤 위치에 있는 데이터든 한 번에 접근할 수 있다. 이러한 접근 방식을 **임의 접근(random access)** 이라고 한다.

###  **배열 선언**

```py
# 일반적인 방법
arr = [0,0,0,0,0,0]
arr = [0] * 6

arr = list(range(6)) # 리스트 생성자를 사용하는 방법
arr = [0 for _ in range(6)] # 리스트 컴프리헨션을 활용하는 방법
```


###  **배열과 차원** 

 - #### **1차원 배열**

 1차원 배열은 가장 간단한 배열 형태를 가진다.  
![image.png](attachment:image.png)  
왼쪽 그림이 1차원 배열의 모습이고, 오른쪽 모습이 실제 메모리에 배열리 할당된 모습이다. 

 - #### **2차원 배열**

 ```py
# 2차원 배열을 리스트로 표현
arr = [[1,2,3,4],[5,6,7,8],[9,10,11,12]]
# arr[2][3]에 저장된 값을 15로 변경
arr[2][3] = 15
# 리스트 컴프리헨션을 활용한 3 * 4 크기인 리스트 선언
arr = [[i] * 4 for i in range(3)]
# 2행 3열 2차원 배열을 표현하는 리스트 선언
arr = [[1,2,3],[4,5,6]]
 ```
![image.png](attachment:image.png)  
왼쪽 그림이 2차원 배열의 모습이고, 오른쪽이 실제 메모리에 2차원 배열이 저장된 상태를 표헌한 것이다.


## **05-2 배열의 효율성** 

### **배열 연산의 시간 복잡도**

**<span style="color:yellow">배열은 접근이라는 방법으로 배열의 모든 위치에 있는 데이터에 단 한 번에 접근할 수 있다. 따라서 데이터에 접근하기 위한 시간 복잡도는 O(1) 이다.  </span>** 하지만 배열에 데이터를 추가하는 경우에는 데이터를 어디에 저장하느에 따라 추가 연산에 대한 시간복잡도가 달라진다.

- #### **맨 뒤에 삽입할 경우**

![image-2.png](attachment:image-2.png)   
맨 뒤에 삽입할 때는 arr[3]에 임의 접근을 바로 할 수 있으며 데이터를 삽입해도 다른 데이터의 영향을 주지 않는다. 따라서 시간복잡도는 O(1)이다.


- #### **맨 앞에 삽입할 경우**

![image.png](attachment:image.png)  

맨 앞에 데이터를 삽입 한다면 기존 데이터를 한 칸씩 뒤로 밀어야 한다. 즉 미는 연산이 필요하다. 데이터 개수를 N개로 일반화 하면 시간복잡도는 O(N)이다.

- #### **중간에 삽입할 경우**

![image.png](attachment:image.png)  
5 앞에 데이터를 삽입한다면 5 이후의 데이터를 뒤로 한 칸씩 밀어야 한다. **즉 현재 삽입한 데이터 뒤에 있는 데이터 개수만큼 미는 연산을 해야한다.** 밀어야 하는 데이터 개수가 N개라면 시간복잡도는 O(N)이다.

### **배열을 선택할 때 고려할 점**

데이터에 자주 접근하거나 읽어야 하는 경우 배열을 사용할 경우 좋은 성능을 낼 수 있다. 하지만 배열은 메모리 공간을 충분히 확보해야 한다는 단점도 있다. 즉 배열은 임의 접근이라는 특징이 있어 데이터에 인덱스로 바로 접근할 수 있어 데이터에 빈번하게 접근하는 경우 효율적이지만 메모리 낭비가 발생할 수 있다.  
 1. **할당할 수 있는 메모리 크기를 확인해야 한다.** 배열로 표현하려는 데이터가 너무 많으면 런타임에서 배열 할당에 실패할 수 있다.  
 
 2. **중간에 데이터 삽입이 많은지 확인헤야 한다.** 배열은 선형 자료구조이기 때문에 중간이나 처음에 데이터를 비번하게 삽입하면 시간 복잡도가 높아져 실제 시험에서 시간 초과가 발생할 수 있다.

## **05-3 자주 활용하는 리스트 기법** 

#### **리스트에 데이터 추가**



```py
# append()메서드로 데이터 추가
my_list = [1,2,3]
my_list.append(4)

# '+' 연산자로 데이터 추가
my_list = [1,2,3]
my_list = my_list + [4,5]

# insert()메서드로 데이터 삽입
my_list = [1,2,3,4,5]
my_list.insert(2,99999)
```

#### **리스트에 데이터 삭제**

```py
# pop()메서드로 특정 위치의 데이터 팝
my_list = [1,2,3,4,5]
popped_element = my_list.pop(2) # [1,2,4,5]

# remove() 메서드로 특정 데이터 삭제
my_list = [1,2,3,2,4,5]
my_list.renove(2) # [1,3,2,4,5]

```

#### **리스트 컴프리헨션으로 데이터에 특정 연산 적용 **

```py
numbers = [1,2,3,4,5]
squares = [num ** 2 for num in numbers] # [1,4,9,16,25]

```

## **합격자가 되는 모의 테스트** 

### **문제1) 두개 뽑아서 더하기**

In [12]:
numbers = [2,1,3,4,1]
result= []

for i in range(len(numbers)):
    for j in range(i+1,len(numbers)):
        result.append(numbers[i] + numbers[j])
        
print(set(result))
    

{2, 3, 4, 5, 6, 7}


### **문제2) 모의고사**

enumerate() 함수 -> 인댁스와 원소를 동시에 접근하면서 루프를 돌릴수 있게 한다. 

```py
for i,answer in enumerate(answers): 을 살펴 보면 i와 answer이 있는데 i는 answer의 인덱스이고 answer은 해당 인덱스의 실제값이다. 
```
![image.png](attachment:image.png)

In [2]:
answers = [1,2,3,4,5]

patterns = [[1,2,3,4,5],[2,1,2,3,2,4,2,5],[3,3,1,1,2,2,4,4,5,5]] # 수포자들의 패턴

scores = [0] * 3 # 수포자들의 점수를 저장할 리스트

# 각 수포자의 패턴과 정답이 얼마나 일치하는지 확인
for i,answer in enumerate(answers):
    for j,pattern in enumerate(patterns):
        if answer == pattern[i % len(patterns)]:
            scores[j] += 1
            
# 가장 높은 점수 저장
m_score = max(scores)

# 가장 높은 점수를 가진 수포자들의 번호를 찾아서 리스트에 담음
h_score = []
for i,score in enumerate(scores):
    if score == m_score:
        h_score.append(i+1)
        
print(h_score)

[1]


### **문제3) 행렬의 곱셈**

![image.png](attachment:image.png)

In [8]:
arr1 = [[1,4],[3,2],[4,1]]
arr2 = [[3,3],[3,3]]

r1,c1 = len(arr1), len(arr1[0])
r2,c2 = len(arr2),len(arr2[0])


result = [[0] * c2 for _ in range(r1)]

for i in range(r1):
    for j in range(c2):
        for k in range(c1):
            result[i][j] += arr1[i][k] * arr2[k][j]
            
print(result)

[[15, 15], [15, 15], [15, 15]]


### **문제4) 실패율**

실패율 = 해당 스테이지에 도달한 적이 있는 사용자 중 아직 클리어하지 못한 사용자의 비율을 얘기한다.  
![image.png](attachment:image.png)  
stages가 20만까지 입력될 수 있으므로 시간 초과를 방지하려면 정렬 알고리즘의 시간 복잡도는 O(NlogN)이여야 한다.  만약 정렬 알고리즘의 시간 복잡도가 $O(N^2)$이라면 시간 초과가 발생할 수 있다.   

리스트의 크기를 N+2로 정한 이유는 나름의 문제를 풀기 위한 전략이다. N번쨰 스체이지를 클리어한 사용자는 스테이지가  N+1이다.  그러면 challenger 배열에서 N+1 위치에 데이터를 저장해야 하는데 배열의 인덱스는 0부터 시작하므로 N+1 인덱스에 저장하려면 N+2크기의 배열이 필요하기 때문이다. 물론 이렇게 하면 0번째 인덱스는 사용하지 않아서 낭비라고 생각할 수 있지만, 이렇게 하면 득보다 실이 크다. 반복문을 보면 각 stages 데아터의 값을 challenger의 인덱스로 사용할 수 있게 된다. 이렇게 하면 값 자체를 인덱스로 활용할 수 있어 매우 편리하다. 메모리 공간 1칸만 비우고 편리함을 취헀다고 할 수 있다.

![image-2.png](attachment:image-2.png)  

 - **시간 복잡도 분석**

 N은 스테이지의 개수이고 M은 stages의 길이이다. challenger 배열을 초기화하고 각 스테이지 도전다 수를 계산할 때 시간 복잡도는 O(N+M)이다. 이후 스테이지 별로 실패율을 계산 하는데 필요한 시간 복잡도는 O(N)이고 실패율을 기준으로 스테이지를  정렬할 때의 시간 복잡도는 O(NlogN)이다. 이연산들을 모두 고려하면 시간 복잡도는 O(2*N + M + NlogN)이므로 최종 시간 복잡도는 O(M + NlogN)이다.

In [5]:
stages = [2,1,2,6,2,4,3,3] # 현재 멈춰 있는 스테이지 번호
n = 5 # 전체 스테이지 수 

# 스테이지별 도전자 수를 구함
challenger = [0] * (n+2)

for stage in stages:
    challenger[stage] += 1
    
# 스테이지별 실패한 사용자 수 계산
fails = {}
total = len(stages)

# 각 스데이지를 순화하며 실패율 계산
for i in range(1,n+1):
    if challenger[i] == 0: # 도전한 사람이 없는 경우, 실패율 0
        fails[i] = 0
    else:
        fails[i] = challenger[i] / total # 실패율 구함
        total -= challenger[i] # 다음 스테이지 실패율을 구하기 위해 현재 스테이지의 인원을 뺌

# 실패율이 높은 스테이지 부터 내림차순으로 정렬     
result = sorted(fails, key=lambda x: fails[x],reverse= True)

print(result)

[3, 4, 2, 1, 5]


### **문제5) 방문 길이**

![image.png](attachment:image.png)

In [6]:
def is_valid_move(nx,ny):
    return 0 <= nx < 11 and 0 <= ny < 11

def update_location(x,y,dir):
    if dir == 'U':
        nx,ny = x,y +1
    elif dir == 'D':
        nx,ny = x,y-1
    elif dir == 'R':
        nx,ny = x+1,y
    elif dir == 'L':
        nx,ny = x-1,y
    
    return nx,ny

def solution(dirs):
    x,y = 5,5
    
    ans = set()
    
    for dir in dirs:
        nx,ny = update_location(x,y,dir)
        if not is_valid_move(nx,ny):
            continue
        
        ans.add(x,y,nx,ny)
        ans.add((nx,ny,x,y))
        
        x,y = nx,ny
        
    return len(ans)/2

# **추가 문제**

#### **1. N개의 데이터가 채워진 리스트를 아래 조건을 기준으로 정렬하는 코드를 구현해라**
 - 홀수보다 짝수가 앞에 온다.
 - 홀수 혹은 짝수 간에는 값이 적을수록 앞에 온다. 



In [4]:
N = int(input())

l = [i for i in range(N)]
result = []
l_o = []
l_e = []

for i in range(len(l)):
    if l[i] % 2 == 0:
        l_e.append(l[i])
    else:
        l_o.append(l[i])
        
l_e.sort()
l_o.sort()

result = l_e + l_o

print(result)

[0, 2, 4, 6, 8, 1, 3, 5, 7, 9]


#### **2. 아래의 요구조건에 맞는 함수를 구현해 줘라 nums와 k는 인자로 받고 함수이름은 solution()으로 해줘라**
 - 프로토 타입 : solution(nums,k)
 - 길이가 N인 정수 리스트 nums와 정수 k를 가지고 있다. 여기서 k는 회전 횟수를 나타낸다. 목표는 리스트의 모든 요소를 오른쪽으로 k번 회전시키는 것이다. 이때 회전은 리스트의 마지막 요소가 첫 번째 위치로 이동하고 나머지 요소들이 오른쪽으로 하나씩 이동하는 것을 의미한다.

 ex) nums = [1,2,3,4,5]이고 k =2 일 때 리스트는 다음과 같이 변해야 한다.

 1. [5,1,2,3,4]
 2. [4,5,1,2,3]

 **요구 사항**
 리스트는 nums와 k를 입력으로 받는 파이썬 함수를 작성해라. 함수는 리스트를 k번 회전시킨 결과를 반환해야 한다. 모듈러 연산을 사용하여 호율적으로 문제를 해결해라

In [26]:
nums = [1,2,3,4,5]
k = 2
a = -1

for _ in range(k):
    l =[]
    for i in range(len(nums)):
        l.append(nums[a + i])
    a -=1
    print(l)


[5, 1, 2, 3, 4]
[4, 5, 1, 2, 3]


In [27]:
def solution(nums,k):
    a = -1
    for _ in range(k):
        l =[]
        for i in range(len(nums)):
            l.append(nums[a + i])
        a -=1
    return l

#### **3. N개의 데이터가 채워진 리스트를 아래 조건을 기준으로 정렬하는 코드를 구현해라**

M x N 크기의 2차원 배열 grid를 가지고 있다. 이 배열은 0(지뢰가 없음)과 -1(지뢰가 있음)의 두가지 숫자로 구성되어 있다. 당신의 목표는 각 0 위치에 대해 입접한 8개의 셀(수평,수직,대각선)중 지뢰(-1)의 개수를 계산하여 해당 위치를 기롤하는 것이다. 예를 들어 grid가 [[-1,0,0],[0,0,-1],[0,-1,0]] 처럼 주어질떄 지뢰 찾기 보다의 모양은 아래와 같다.

-1 0 0  
0 0 -1  
0 -1 0 

In [6]:
M,N = map(int,input().split())

matrix = [[0 for _ in range(M+1)]for _ in range(N+1)]

for i in range(3):
    a = list(map(int,input().split()))
    for j in range(3):
        matrix[i+1][j+1] = a[j]
        

for i in range(1,M+1):
    for j in range(1,N+1):
        print(matrix[i][j],end=' ') 
    print('')

-1 0 0 
0 0 -1 
0 -1 0 
