[OS] 동기화 문제

Jay·2021년 3월 9일
0

Computer Science

목록 보기
31/50
post-thumbnail

동기화 !?

  • 한정적인 시스템 자원에 여러 스레드가 동시에 접근해서 사용하면 문제가 발생할 수 있다.
  • 이 문제를 방지하기 위해 여러 스레드에게 하나의 자원에 대한 처리 권한을 주거나 순서를 조정하는 기법.

스레드 동기화

  1. 실행 순서의 동기화
  • 스레드의 실행 순서를 정의하고, 이 순서를 반드시 따르도록 하는 것.
  1. 메모리 접근에 대한 동기화
  • 메모리 접근에 있어서 동시 접근을 막는 것.
  • 실행의 순서가 중요한 것이 아니라 한 순간에 하나의 스레드만 해당 자원에 접근하도록 하는 것.

동기화 기법

  • 유저 모드의 동기화
    • 커널의 힘을 빌리지 않는 동기화 기법 (커널의 코드가 실행되지 않는다.)
    • 성능상 이점이 있으나, 기능상의 제한점이 존재한다.
    • 임계 구역 기반의 동기화, 인터락 함수 기반의 동기화.
  • 커널 모드의 동기화
    • 커널에서 제공하는 동기화 기능을 이용하는 방법
    • 커널 모드로의 변경이 필요하고 이는 성능 저하로 이어진다. 그러나 다양한 기능을 활용할 수 있다.
    • 세마포어, 뮤텍스, 모니터 등등

유저 모드 동기화

1. 임계 구역 기반의 동기화

  • 열쇠를 얻은 프로세스만 임계 구역에 들어갈 수 있다. 즉, 한번에 하나의 스레드만 접근이 가능하다.
  • 임계 구역 진입을 위해 Critical Section Object를 얻는다.
  • 다른 스레드가 열쇠를 가지고 있을 시에는 반환할 때까지 블로킹된다. 열쇠가 반환되면 블로킹 상태에서 빠져나와 열쇠를 얻고 임계 구역에 접근한다.

2. 인터락 함수 기반 동기화

  • 함수 내부적으로 한 순간에 하나의 스레드에 의해서만 실행되도록 동기화된다.
  • 임계 구역 기반의 동기화도 내부적으로 인터락 함수를 기반으로 구현된다.
  • 유저 모드 기반으로 동작해서 속도가 빠르다.

커널 모드의 동기화

1. 세마포어 (Semaphore)

  • 공유된 자원의 데이터를 여러 프로세스, 스레드가 접근하는 것을 막는다.
  • 동시에 접근 할 수 있는 '허용 가능 갯수'를 갖고 있는 Counter (공유자원에 접근할 수 있는 스레드 혹은 프로세스 수를 나타내는 값 -> 공통으로 관리하는 하나의 값)
  • ex) 화장실을 예로 보자. 세마포어는 1개 이상의 열쇠라고 할 수 있다. 화장실 칸이 4개이고 열쇠가 4개라면, 4명까지는 대기없이 이용 가능하다. 그 다음부터는 대기해야 한다. 이게 세마포어다.
  • 세마포어 Counter의 갯수에 따라 다음과 같이 나뉜다.
    • 1개 : Binary Semaphore(뮤텍스)
    • 2개 이상 : Counting Semaphore
  • 세마포어는 소유할 수 없다.
    • 세마포어를 소유하지 않은 스레드가 세마포어를 해제할 수 있는 문제가 발생한다.

2. 뮤텍스 (Mutal Exclusion)

  • 공유된 자원의 데이터를 여러 프로세스, 스레드가 접근하는 것을 막는 것이다.
  • 임계 구역을 가진 스레드들의 Running time이 서로 겹치지 않게 각각 단독으로 실행되게 하는 기술이다.
  • 뮤텍스 객체를 두 스레드가 동시에 사용할 수 없다.
  • 일종의 Locking 매커니즘으로 공유 자원에 대한 접근을 조율하기 위해 locking과 unlocking을 사용한다.
  • Lock에 대한 소유권이 있으며 lock을 가지고 있을 경우에만 공유 자원에 접근할 수 있고, Lock을 가진 사람만 반납할 수 있다.
  • 뮤텍스는 무조건 1개의 열쇠만 가질 수 있다. 열쇠를 가진 사람만이 화장실에 갈 수 있고, 다음 사람이 화장실에 가기 위해서는 앞 사람이 열쇠를 반납해야 한다.

3. 모니터 (Monitor)

  • Mutex(Lock)와 Condition Variables를 가지고 있는 Synchronization 매커니즘이다.

🤚 임계 구역 관점에서 뮤텍스, 모니터, 세마포어
뮤텍스와 모니터는 상호 배제를 함으로써 임계 구역에 하나의 스레드만 들어 갈 수 있다.
반면, 세마포어는 하나의 스레드만 들어가거나 혹은 여러 개의 스레드가 들어갈 수 있다.


임계구역 !?

  • 둘 이상의 스레드가 동시에 접근해서는 안되는 공유 자원을 접근하는 코드의 일부를 말한다.
  • 임계 영역에서 동기화를 진행하지 못하면 치명적인 문제가 발생한다.
  • 따라서 임계 구역 문제를 해결하기 위해서는 3가지 필수조건이 있다.
    1. 상호 배제(Mutual Exclusion)
    : 프로세스 P1이 공유자원을 접근하는 임계구역 코드를 수행하고 있다면 다른 프로세스들은 공유자원을 접근하는 임계 구역 코드를 수행할 수 없다. 즉, 한 순간에 하나의 스레드만 실행 될 수 있다.
    2. 진행 (Progress)
    : 임계 구역에서 실행중인 프로세스가 없고 별도의 동작이 없는 프로세스들만 임계 구역 진입 후보로서 참여 될 수 있다.
    3. 한정된 대기 (Bounded Waiting)
    : P1이 임계 구역에 진입 신청 후부터 받아들여질때까지, 다른 프로세스들이 임계 구역에 진입하는 횟수는 제한이 있어야 한다.

🧐 Q&A

1. 뮤텍스와 모니터의 차이?

  • 뮤텍스는 다른 프로세스나 스레드 간 동기화를 위해 사용한다.
  • 모니터는 하나의 프로세스내에서 다른 스레드 간 동기화 할 때 사용한다.
  • 뮤텍스는 운영체제 커널에 의해 제공된다.
    - 무겁고 느리다.
  • 모니터는 프레임워크나 라이브러리 그 자체에서 제공된다.
    - 가볍고 빠르다.

2. 세마포어와 모니터의 차이?

  • 자바에서 모니터를 모든 객체에게 기본적으로 제공하지만 C에서는 사용이 불가하다.
  • 세마포어는 카운터라는 변수 값으로 프로그래머가 상호 배제나 정렬의 목적으로 사용시 매번 값을 따로 지정해줘야 하는 번거로움이 있다.
  • 반면, 모니터는 이러한 일들이 캡슐화되어 있어 개발자가 카운터 값을 0 또는 1로 주어야 하는 고민을 할 필요가 없어 synchronized, wait(), notify() 등의 키워드를 이용해 좀 더 편하게 동기화 할 수 있다.

3. 세마포어와 뮤텍스의 차이?

  • 세마포어는 뮤텍스가 될 수 있지만, 뮤텍스는 세마포어가 될 수 없다.
  • 세마포어는 소유할 수 없으며, 뮤텍스는 소유할 수 있고 소유주가 그 책임을 진다.
  • 뮤텍스의 경우, 뮤텍스를 소유하고 있는 스레드가 이 뮤텍스를 해제할 수 있지만 세마포어는 소유하지 않고 있는 다른 스레드가 세마포어를 해제할 수 있다.
  • 뮤텍스는 동기화 대상이 1개일때 사용하고 세마포어는 동기화 대상이 여러개 일 때 사용한다.

동시성 프로그래밍의 가장 큰 숙제 = "공유자원 관리"

공유자원 관리를 위해 상호배제를 달성하는 기법이 필요하고 이를 위해 고안된게 세마포어, 뮤텍스이다. 둘은 서로 다른 방식으로 상호배제를 달성한다.

뮤텍스는 1개의 화장실 키로 이용하고 나오면 다른 스레드가 가져갈 수 있고
세마포어는 정해진 Counter 갯수만큼의 키를 가지고 여러 스레드가 나눠 쓰게 된다.

뮤텍스

  • 한 스레드, 프로세스에 의해 소유 될 수 있는 key를 기반으로 한 상호배제 기법

세마포어

  • 현재 공유자원에 접근 할 수 있는 스레드, 프로세스의 수를 나타내는 값을 두어 상호배제를 달성하는 기법

뮤텍스와 세마포어의 목적은 특정 동기화 대상이 이미 특정 스레드나 프로세스에 의해 사용 중일 경우, 다른 스레드가 해당 동기화 대상에 접근하는 것을 제한 하는 것으로 동일하지만, 관리하는 동기화 대상이 몇 개인지에 따라 차이가 난다.

물론 두 기법 모두 완벽히 데이터 무결성을 보장할 수 없고 데드락이 발생할 수 있다.
하지만 상호배제를 위한 기본적인 방법이며 좀 더 복잡한 매커니즘을 적용해서 더 좋은 프로그램을 만들 수 있다.

Reference

profile
developer

0개의 댓글