Các kiến trúc song song cuu duong than cong... Phân loại kiến trúc máy tính 9.2.. Bộ xử lý đồ họa đa dụng Nội dung của chương 9 cuu duong than cong... Phân loại kiến trúc máy tínhPhân lo
Trang 2Nội dung học phần
Chương 1 Giới thiệu chung
Chương 2 Cơ bản về logic số
Chương 9 Các kiến trúc song song
cuu duong than cong com
Trang 39.1 Phân loại kiến trúc máy tính 9.2 Đa xử lý bộ nhớ dùng chung 9.3 Đa xử lý bộ nhớ phân tán
9.4 Bộ xử lý đồ họa đa dụng
Nội dung của chương 9
cuu duong than cong com
Trang 49.1 Phân loại kiến trúc máy tính
Phân loại kiến trúc máy tính (Michael Flynn -1966)
n SISD - Single Instruction Stream, Single Data Stream
n SIMD - Single Instruction Stream, Multiple Data Stream
n MISD - Multiple Instruction Stream, Single Data Stream
n MIMD - Multiple Instruction Stream, Multiple Data Stream
cuu duong than cong com
Trang 5cuu duong than cong com
Trang 6.
Trang 7SIMD (tiếp)
đơn vị xử lý PUs
riêng LM (local memory)
Trang 8cuu duong than cong com
Trang 9cuu duong than cong com
Trang 10MIMD - Shared Memory
Đa xử lý bộ nhớ dùng chung
(shared memory mutiprocessors)
.
IS
IScuu duong than cong com
Trang 11MIMD - Distributed Memory
Đa xử lý bộ nhớ phân tán (distributed memory mutiprocessors or multicomputers)
.
.
Mạng liên kết hiệu năng cao IS
IS
cuu duong than cong com
Trang 12Phân loại các kỹ thuật song song
Trang 139.2 Đa xử lý bộ nhớ dùng chung
(SMP-Symmetric Multiprocessors)
(NUMA – Non-Uniform Memory Access)
cuu duong than cong com
Trang 14SMP hay UMA (Uniform Memory Access)
cuu duong than cong com
Trang 16NUMA (Non-Uniform Memory Access)
Trang 17Bộ xử lý đa lõi (multicores)
Execution units and queues L1 instruction cache
L2 cache
(a) Superscalar
L1 data cache Single-thread register file
Instruction fetch unit
Trang 18Các dạng tổ chức bộ xử lý đa lõi
CPU Core 1
L1-D
L2 cache L2 cache L1-I
L3 cache
L2 cache L1-I
Trang 19Intel - Core Duo
Thermal control Thermal control
Trang 20Intel Core i7-990X
Core 0
32 kB L1-I
32 kB L1-D
32 kB L1-I
32 kB L1-D
32 kB L1-I
32 kB L1-D
32 kB L1-I
32 kB L1-D
32 kB L1-I
32 kB L1-D
32 kB L1-I
32 kB L1-D
256 kB L2 Cache
Core 1
256 kB L2 Cache
Core 2
256 kB L2 Cache
Core 3
256 kB L2 Cache
Core 4
256 kB L2 Cache
Core 5
256 kB L2 Cache
12 MB L3 Cache DDR3 Memory
Controllers
QuickPath Interconnect
3 ! 8B @ 1.33 GT/scuu duong than cong com4 ! 20B @ 6.4 GT/s
Trang 219.3 Đa xử lý bộ nhớ phân tán
or Massively Parallel Processors – MPP)
Local interconnect
Disk and I/O
…
Local interconnect
Disk and I/O
High-performance interconnection network
cuu duong than cong com
Trang 23Massively Parallel Processors
toán có số phép toán và dữ liệu rất lớn
cuu duong than cong com
Trang 24IBM Blue Gene/P
Board Card
Trang 25song song theo nhóm (cluster)
tính song song
Trang 26PC Cluster của Google
128-port Gigabit Ethernet switch
128-port Gigabit Ethernet switch
Two gigabit Ethernet links
80-PC rack
OC-48 Fiber OC-12 Fiber
cuu duong than cong com
Trang 279.4 Bộ xử lý đồ họa đa dụng
Processing Unit) hỗ trợ xử lý đồ họa 2D và 3D: xử lý dữ liệu song song
Processing Unit
n CPU là host: thực hiện theo tuần tự
n GPGPU: tính toán song songcuu duong than cong com
Trang 28Bộ xử lý đồ họa trong máy tính
cuu duong than cong com
Trang 29GPGPU: NVIDIA Tesla
n Streaming multiprocessor
cuu duong than cong com
Trang 30GPGPU: NVIDIA Fermi
cuu duong than cong com
Trang 31NVIDIA Fermi
Dispatch Unit Warp Scheduler
Instruction Cache
Dispatch Unit Warp Scheduler
Core Core Core Core Core Core Core Core Core Core Core Core Core Core Core
Core Core Core Core Core Core Core Core Core Core Core Core Core Core Core Core
Trang 32Hết
cuu duong than cong com