Thread-level Parallelism (TLP)
- Fine-grained Multithreading: Fine 1 cycle 1 thread
- Simultaneous Multithreading (SMT): 1 cycle 여러 thread
Hyper threading이 SMT를 의미
- Chip Multi Processors (CMP): 코어가 여러개
Data-level Parallelism (DLP)
- Vector processors: Issues a single instruction that operats on multiple pieces of data: 벡터 Register를 사용
메모리 접근 방식들
-
Symmetric multi-processor : 메모리 access가 sync
-
Non-uniform memory access (NUMA) : 다른 소켓에 접근하려면 더 멀리가야한다.
-
Message-Passing Architectures : 데이터를 직접 줌 (각자 자기만의 공간이 있음)
MPI가 있음
DP Arch

PE마다 Array Controller가 있는게 아니다.
Dataflow Arch
본노이만: Instruction 이 순서대로 실행된다고 가정
Dataflow Arch: 실행한 방식이 실행할 준비가 되면 바로 실행
데이터가 흘러오면 바로 통과한다.