[Algorithm] 최단 경로 알고리즘
Posted: Updated:
최단 경로 문제
한 지점에서 다른 지점까지의 최단 경로, 한 지점에서 다른 모든 지점까지의 최단 경로 등과 같이 최단 경로를 찾아야 하는 다양한 문제 상황이 존재할 수 있다.
일반적으로 최단 경로 문제에서는 그래프를 활용하여 각 지점은 노드로 표현하고, 연결된 도로는 간선으로 표현한다.
다익스트라 최단 경로 알고리즘
특정 노드에서 출발하여 다른 모든 노드로 가는 최단 경로를 계산한다.
음의 간선이 없을 때 정상적으로 동작하며, 현실 세계의 길찾기 문제를 해결할 때 사용할 수 있는 알고리즘이다.
일반적으로 최단 경로 문제는 다이나믹 프로그래밍 문제로 분류되기도 하지만, 다익스트라 최단 경로 알고리즘은 그리디 알고리즘 으로 분류된다.
매 상황에서 가장 비용이 적은 노드를 선택한다.
동작 과정
- 출발 노드를 설정한다.
- 최단 거리 테이블을 초기화한다.
- 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택한다.
- 해당 노드를 거쳐 다른 노드로 가는 비용을 계산하여 최단 거리 테이블을 갱신한다.
- 3번과 4번 과정을 반복한다.
최단 거리 테이블은 각 노드에 대한 현재까지의 최단 거리 정보를 가지고 있으며, 처리 과정에서 더 짧은 경로를 찾으면 정보를 갱신한다.
특징
매 상황에서 방문하지 않은 가장 비용이 적은 노드를 선택하므로 그리디 알고리즘에 속한다.
각 단계를 거치면서 한 번 방문 처리된 노드의 최단 거리값은 고정되어 바뀌지 않는다.
따라서 한 단계 당 하나의 노드에 대한 최단 거리를 확실하게 찾을 수 있게 된다.
간단한 구현
방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택하기 위해 매 단계마다 1차원 테이블의 모든 원소를 순차 탐색한다.
import sys
input = sys.stdin.readline
INF = int(1e9) # int 최댓값 설정
n, m = map(int, input().split())
start = int(input())
graph = [[] for i in range(n + 1)] # 그래프에서 각 노드에 연결된 노드에 대한 정보
visited = [False] * (n + 1) # 방문 여부 체크
distance = [INF] * (n + 1) # 최단 거리 테이블 초기화
for _ in range(m): # 간선 정보 입력
a, b, c = map(int, input().split())
graph[a].append((b, c))
def get_smallest_node(): # 최단 거리가 가장 짧은 노드 인덱스 찾기
min_value = INF
index = 0
for i in range(1, n + 1):
if distance[i] < min_value and not visited[i]:
min_value = distance[i]
index = i
return index
def dijkstra(start): # 다익스트라 알고리즘
distance[start] = 0
visited[start] = True
for j in graph[start]:
distance[j[0]] = j[1]
for i in range(n - 1):
now = get_smallest_node()
visited[now] = True
for j in graph[now]:
cost = distance[now] + j[1]
if cost < distance[j[0]]:
distance[j[0]] = cost
dijkstra(start)
for i in range(1, n + 1): # 최단 거리 출력
if distance[i] == INF:
print("INFINITY")
else:
print(distance[i])
간단한 구현 방법의 성능
총 $O(V)$ 번에 걸쳐 최단 거리가 짧은 노드를 매번 선형 탐색해야 한다.
따라서 전체 시간 복잡도는 $O(V^2)$ 이다.
일반적으로 코딩 테스트 최단 경로 문제에서 전체 노드의 개수가 5,000개 이하라면 사용할 수 있다.
개선된 구현 방법
단계마다 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택하기 위해 힙(Heap) 자료구조를 사용한다.
현재 가까운 노드를 저장하기 위해 힙 자료구조를 추가적으로 이용하는 것이다.
현재의 최단 거리가 가장 짧은 노드를 선택해야 하므로 최소 힙을 사용한다.
- 그래프를 준비하고 출발 노드를 설정하여 우선순위 큐에 삽입한다.
- 우선순위 큐에서 원소를 꺼내고, 아직 방문하지 않았다면 방문 처리한다.
- 해당 노드에서 인접 노드로 거쳐가는 최단 거리 값을 갱신한다.
- 최단 거리 값이 갱신된 노드를 우선순위 큐에 넣는다.
- 모든 노드를 방문할 때 까지 2, 3, 4번을 반복한다.
- 소스코드
import heapq
import sys
input = sys.stdin.readline
INF = int(1e9)
n, m = map(int, input().split())
start = int(input())
graph = [[] for i in range(n + 1)]
distance = [INF] * (n + 1)
for _ in range(m):
a, b, c = map(int, input().split())
graph[a].append((b, c))
def dijkstra(start):
q = []
heapq.heappush(q, (0, start))
distance[start] = 0
while q:
dist, now = heapq.heappop(q)
if distance[now] < dist:
continue
for i in graph[now]:
cost = dist + i[1]
if cost < distance[i[0]]:
distance[i[0]] = cost
heapq.heappush(q, (cost, i[0]))
dijkstra(start)
for i in range(1, n + 1):
if distance[i] == INF:
print("INFINITY")
else:
print(distance[i])
개선된 구현 방법의 성능
힙을 사용하면 시간 복잡도는 $O(ElogV)$ 이다.
노드를 하나씩 꺼내 검사하는 반복문은 V 이상의 횟수로는 처리되지 않는다.
따라서 간선의 개수(E)만큼 다른 노드들을 확인하는 연산이 수행된다.
전체 과정은 E개의 원소를 우선순위 큐에 넣었다가 모두 빼내는 연산과 유사하다.
플로이드 워셜 알고리즘
플로이드 워셜 알고리즘은 모든 노드에서 모든 다른 노드까지의 최단 경로를 모두 계산하는 방법이다.
다익스트라 알고리즘과 마찬가지로 단계별로 거쳐가는 노드를 기준으로 알고리즘을 수행한다.
그러나 매 단계마다 방문하지 않은 노드 중 최단 거리를 갖는 노드를 찾는 과정은 필요 없다.
플로이드 워셜은 2차원 테이블에 최단 거리 정보를 저장하며, 다이나믹 프로그래밍 유형에 속한다.
점화식을 통해 3중 반복문을 사용하기 때문에 시간 복잡도는 $O(n^3)$ 으로, 실제 문제 풀이 과정에서는 노드 개수가 적은 상황에서 효과적으로 사용할 수 있다.
점화식
\[D_{ab} = min(D_{ab}, D{ak} + D{kb})\]각 단계마다 특정 노드 $k$ 를 거쳐 가는 경우를 확인한다.
예를 들어 $a$ 에서 $b$ 로 가는 최단 거리보다 $a$ 에서 $k$ 를 거쳐 $b$ 로 가는 거리가 더 짧은지 검사한다.
동작 과정
- 그래프를 준비하고 각 노드를 기준으로 현재 노드와 인접한 노드를 확인해 최단 거리 테이블을 초기화한다.
- 각 노드 $k$ 를 거쳐 가는 경우를 고려하여 테이블을 갱신한다.
- 모든 노드의 경우를 고려할 때까지 2번을 반복한다.
구현
- 소스코드
INF = int(1e9)
n = int(input())
m = int(input())
graph = [[INF] * (n + 1) for _ in range(n + 1)]
for i in range(1, n + 1): # 자기 자신에서 자기 자신으로 가는 비용 0으로 초기화
graph[i][i] = 0
for _ in range(m): # 간선에 대한 정보 초기화
a, b, c = map(int, input().split())
graph[a][b] = c
for k in range(1, n + 1): # 플로이드 워셜 알고리즘
for a in range(1, n + 1):
for b in range(1, n + 1):
graph[a][b] = min(graph[a][b], graph[a][k] + graph[k][b])
for a in range(1, n + 1): # 출력
for b in range(1, n + 1):
if graph[a][b] == INF:
print("INFINITY", end=" ")
else:
print(graph[a][b], end=" ")
print()
플로이드 워셜 알고리즘 성능
노드 개수가 $N$ 개일 때 알고리즘 상으로 $N$ 번의 단계를 수행한다.
각 단계마다 $O(N^2)$ 의 연산을 통해 현재 노드를 거쳐 가는 모든 경로를 고려한다.
따라서 총 시간 복잡도는 $O(N^3)$ 이다.
플로이드 워셜 알고리즘이 사용되어야 하는 문제에서는 노드의 개수가 500개 이하로 작은 값으로 구성된 경우가 많다.
노드의 개수가 500개인 경우에도 시간 초과 판정을 받을 수 있으므로, 최단 거리 문제를 해결할 때는 어떤 알고리즘을 사용해야 할 지 고민해보고 적절한 알고리즘을 선택할 수 있어야 한다.
댓글남기기