데드락이란 일련의 프로세스들이 서로 가진 자원을 기다리며 block 되어 더 이상 진행될 수 없는 상태를 의미한다.
(앞서 세마포어에서 발생할 수 있던 문제)
데드락은 모든 프로세스가 Request 상태가 되어있는 상황
Deadlock이 발생하기 위해선 다음 4가지 조건을 만족해야 한다.
Resource-Allocation Graph로 자원이 어느 프로세스에 할당되고 어느 자원을 얻으려하는지 나타냄
💡 그래프에 사이클(Cycle)이 없다면 Deadlock이 아니다. 반면 사이클이 있다면 Deadlock이 발생할 '수' 있다.
- 정확히 말하면,
자원 당 하나의 인스턴스
만 있는 경우엔 Deadlock이고, 여러 인스턴스가 존재하는 경우엔 Deadlock일 수도 있고 아닐 수도 있다.- 자원당 하나의 인스턴스만 있는 경우에는 데드락
- 여러 인스턴스가 있는 경우에는 데드릭일 수도 있고 아닐 수도 있음
- 위 그림에서 왼쪽은 데드락이지만, 오른쪽은 데드락이 아님
이 각각의 방법에 대해서는 아래에서 자세히 설명하겠다.
자원을 할당할 때 데드락의 4가지 필요조건 중 어느 하나가 만족되지 않도록 하는 방식이다.
공유 가능한 파일은 Mutual Exclusion이 필요가 없다.
예를 들어, Read-Only 파일은 언제나 공유가 가능한 자원이다.
하지만 모든 자원이 공유 가능한 상황은 불가능하다. 어떠한 자원들은 그 자체로 공유가 불가능하다.
예를 들어, Mutex Lock은 여러 스레드가 동시에 공유할 수 없다.
Hold and Wait를 방지하려면 스레드가 특정 자원을 요구할 때, 다른 자원을 점유하고 있지 않음을 보장해야 한다.
이를 해결하기 위해 두 가지 방식을 생각해볼 수 있다.
위 방식은 자원 사용 효율성이 낮고 Starvation 확률이 커진다.
따라서 현실성이 낮다.
Preemption을 보장하기 위해 아래와 같은 프로토콜을 사용할 수 있다.
이러한 프로토콜은 CPU의 레지스터나 데이터베이스의 트랜잭션처럼 자원의 저장과 복구가 용이할 때 많이 사용된다.
하지만 데드락이 자주 발생하는 뮤텍스 락이나 세마포어가 많이 사용되는 환경에는 적합하지 않다.
4가지 방식 중 가장 실용적이다.
하지만 Total Ordering과 Partial Ordering 방식 모두 복잡한 시스템에서 우선 순위를 매기는 것이 쉽지 않고, 조건이 추가되는 경우 전부 새로 번호를 다시 지정해야 한다.
💡 미리 데드락을 방지하는 방법은 효율성과 처리량을 감소시키고 Starvation이 발생할 수 있음
스케줄링을 이용하여 데드락을 방지하는 방법으로, 데드락이 발생할 가능성이 있는 경우에 아예 자원을 할당하지 않는 방식이다.
데드락의 발생 가능성 알기 위해서 세 가지 정보와 한 가지 가정을 전제로 해야함
가정
프로세스는 필요한 자원을 모두 사용하고 한 번에 해제한다*
정보
1. 각 자원의 가용 인스턴스 개수
2. 모든 프로세스마다 보유하고 있는 자원 개수
3. 모든 프로세스마다 필요한 자원의 총 개수
예를 들어 프로세스 A가 현재 세 개의 자원을 사용하고 있고 필요한 자원의 개수가 5개라면, 두 개의 자원을 추가로 할당받아야 다섯 개의 자원을 해제할 수 있다는 것
위 가정을 바탕으로 Safe State와 Unsafe State라는 개념이 사용됨
💡 Safe state
- 시스템 내의 프로세스들에 대한 Safe Sequence가 존재하는 상태
- 데드락이 발생하지 않는 경우가 단 하나라도 없는 상태
💡 Safe Sequence
- 프로세스의 sequence <P1, P2, …, Pn>이 있을 때, Pi의 자원 요청이 가용 자원 +모든 Pj의 보유자원에 의해 충족되는 경우 sequence를 safe하다고 말함.
- 데드락이 없는 프로세스 실행 순서
시스템이 Safe state
에 있으면 데드락이 발생하지 않고 Unsafe state
에 잇으면 데드락이 발생할 수 있어 시스템이
Unsafe state에 들어가지 않는 것을 보장하는 것이 Avoidance의 핵심이다
자원의 필요한 인스턴스의 개수에 따라 두 경우의 Avoidance 알고리즘이 존재
Deadlock를 피하는 방법은, Request edge가 Assignment edge로 변경될 때 점선을 포함하여 사이클이 생기지 않는 경우에만 요청된 자원을 할당한다.
💡 사이클이 없으면 데드락도 없음이 보장된다. 하지만 사이클이 있으면, 데드락은 있을 수도 있고 없을 수도 있다.
모든 프로세스가 필요로 하는 자원의 최대치를 미리 파악하고, 이를 고려하여 자원 할당한다.
Banker's Algorithm은 dijkstra가 고안한 알고리즘이며, 이는 프로세스가 자원을 요청할 때마다 수행한다.
이때, Safe state를 유지할 수 있는 요구만을 구락하고 불안정한 상태를 초래할 사용자의 요구는 나중에 만족될 수 있을 때까지 거절한다.
가정
- 모든 프로세스는 자원의 최대 사용량을 미리 명시한다.
- 프로세스가 요청 자원을 모두 할당받은 경우 유한 시간 안에 자원들을 다시 반납한다.
기본적인 개념은, 자원을 요청할 때 safe 상태를 유지하는 경우에만 할당
단점
데드락 Detection을 통해서 데드락을 감지하고 Recovery 알고리즘으로 데드락을 회복하는 방식이다.
Wait-for-Graph
데드락을 회복하는 방법은 다음과 같다.
1. 데드락에 걸린 프로세스를 모두 종료한다.
- 데드락을 확실히 없앨 수 있지만 손실이 크다.
2.데드락 사이클이 깨질 때까지 프로세스를 하나씩 종료한다.
💡 프로세스 종료시 고려 사항
- 프로세스의 중요도
- 프로세스가 얼마나 오래 실행됐는가
- 얼마나 많은 자원을 사용했는가
- 프로세스가 작업을 마치기 위해 얼마나 많은 자원이 필요한가
- 프로세스가 종료되기 위해 얼마나 많은 자원이 필요한가
- 프로세스가 batch인가 interactive인가
- 프로세스가 작업을 완료하기 위해 자원을 얼마나 더 사용해야하는지
- 얼마나 더 많은 프로세스가 종료되어야 하는지
프로세스의 자원을 뺏어 선점하는 방식으로 세가지 이슈가 있음
💡 기아현상(Starvation situation)
우선순위 기반의 스케줄링에서 특정 프로세스가 계속해서 낮은 우선순위로 스케줄되어 실행 기회를 얻지 못하고 기아 상태에 빠지는 상황이다.
Deadlock이 일어나지 않는다고 생각하고 아무런 조치도 취하지 않는 방식이다.
따라서 만약 시스템에 Deadlock이 발생한 경우, 시스템이 비정상적으로 작동하는 것을 사람이 느낀 후 직접 프로세스를 죽이는 등의 방법으로 대처한다.
이 방식은 UNIX, Windows 등 대부분의 범용 운영체제가 채택하는 방식이다.
💡Volatile 키워드
- 동시성 프로그래밍에서 발생할 수 있는 문제 중 하나인 가시성 문제를 해결하기 위해 사용되는 키워드이다. 가시성 문제는 여러 개의 스레드가 사용됨에 따라, CPU Cache Memory와 RAM의 데이터가 서로 일치하지 않아 생기는 문제를 의미한다.
- volatile 키워드를 붙인 공유 자원은 RAM에 직접 읽고 쓰는 작업을 수행할 수 있도록 해준다
💡라이브락(Livelock)
- 라이브락은 두 스레드가 락의 해제와 획득을 무한 반복하는 상태이다.
- 라이브락은 데드락을 피하려는 의도에서 수정한 코드가 불완전할 때 발생하곤 한다
- 라이브락 vs 데드락
- 라이브락은 모든 프로세스가 계속해서 작업을 수행하지만 전체적으로는 진행이 멈추어 있는 상황이고, 데드락은 모든 프로세스가 작업을 수행하지 못하고 멈춰있는 상황