A non-empty array A consisting of N integers is given. The array contains an odd number of elements, and each element of the array can be paired with another element that has the same value, except for one element that is left unpaired.

For example, in array A such that:

  A[0] = 9  A[1] = 3  A[2] = 9
  A[3] = 3  A[4] = 9  A[5] = 7
  A[6] = 9
the elements at indexes 0 and 2 have value 9,
the elements at indexes 1 and 3 have value 3,
the elements at indexes 4 and 6 have value 9,
the element at index 5 has value 7 and is unpaired.
Write a function:

def solution(A)

that, given an array A consisting of N integers fulfilling the above conditions, returns the value of the unpaired element.

For example, given array A such that:

  A[0] = 9  A[1] = 3  A[2] = 9
  A[3] = 3  A[4] = 9  A[5] = 7
  A[6] = 9
the function should return 7, as explained in the example above.

Write an efficient algorithm for the following assumptions:

N is an odd integer within the range [1..1,000,000];
each element of array A is an integer within the range [1..1,000,000,000];
all but one of the values in A occur an even number of times.
Copyright 2009–2024 by Codility Limited. All Rights Reserved. Unauthorized copying, publication or disclosure prohibited.

In [None]:
# 시도 1 : Score : 100
# you can write to stdout for debugging purposes, e.g.
# print("this is a debug message")

def solution(A):
    # 제한사항 확인
    # 홀수를 원소로 하는 배열 A. A의 원소 개수는 1 ~ 1,000,000 개 사이.
    # 각 원소는 1 ~ 1,000,000,000 사이의 값을 가짐
    # 페어를 이루지 못하는 원소의 "값"을 반환
    
    # 평가 기준
    # 효율적인 코드를 구축해야 함
    
    # 알고리즘
    # (1) 값 : 개수 dictionary 구축
    # (2) 이 중 개수가 홀수인 값을 반환
    # 예상 복잡도 : O(2n) + O(unique(n))

    pair_dictionary = dict()
    for i, num in enumerate(A):
        if num in pair_dictionary.keys():
            pair_dictionary[num] += 1
        else:
            pair_dictionary[num] = 1

    for key in pair_dictionary.keys():
        if int(pair_dictionary[key]) % 2 != 0:
            return key

In [None]:
# 실제 복잡도 : O(N) or O(N*log(N))

In [4]:
# 와 근데 더 좋은 방법이 있다고 한다.
def solution(A):
    result = 0
    for num in A:
        result ^= num  # XOR 연산
    return result

개선된 알고리즘: XOR 활용
XOR의 성질을 활용하면 배열의 모든 요소를 한 번씩 순회하면서 비효율적인 딕셔너리를 사용하지 않고도 문제를 해결할 수 있습니다. XOR의 주요 성질은 다음과 같습니다:

1. A⊕A=0 (같은 값끼리 XOR하면 0이 됨)  
2. A⊕0=A (0과 XOR하면 자기 자신이 됨)  
3. XOR은 교환법칙과 결합법칙을 만족 (A⊕B⊕A=B)  
따라서 배열의 모든 요소를 XOR하면, 짝을 이루는 값들은 모두 소거되고, 홀수로 남아있는 값만 남게 됩니다.



In [5]:
solution([9, 3, 9, 3, 9, 7, 9])

7

In [12]:
result = 0
result ^=9
print(result)
print(bin(result)[2:] + '\n')
result ^=3
print(f'+{bin(3)[2:]}')
print(result)
print(bin(result)[2:] + '\n')
result ^=9
print(f'+{bin(9)[2:]}')
print(result)
print(bin(result)[2:] + '\n')
result ^=3
print(f'+{bin(3)[2:]}')
print(result)
print(bin(result)[2:] + '\n')
result ^=9
print(f'+{bin(9)[2:]}')
print(result)
print(bin(result)[2:] + '\n')
result ^=7
print(f'+{bin(7)[2:]}')
print(result)
print(bin(result)[2:] + '\n')
result ^=9
print(f'+{bin(9)[2:]}')
print(result)
print(bin(result)[2:] + '\n')
result

9
1001

+11
10
1010

+1001
3
11

+11
0
0

+1001
9
1001

+111
14
1110

+1001
7
111



7