Một tập dữ liệu cùng được truyền đến một tập các bộ xử lý Mỗi bộ xử lý thực hiện một dãy lệnh khác nhau Không tồn tại máy tính thực tế Có thể có trong tương lai... SMP- Symmertr
Trang 1CHƯƠNG 18
KIẾN TRÚC SONG
SONG
Giảng viên hướng dẫn:ts Trần Hùng
Bộ môn Khoa học máy tính
Trang 218.1 Phân loại kiến trúc máy tính
18.2 Một số kiến trúc song song thông dụng18.4 Cụm
18.5 Bộ nhớ chính không đồng dạng
Trang 3 Phân loại của Michael Flynn (1966)
• SISD – Single Instruction Stream, Single Data Stream
(Cấu trúc đơn, dòng lưu chuyển dữ liệu đơn)
• SIMD - Single Instruction Stream, Multiple Data
Stream
(Cấu trúc đơn, nhiều dòng lưu chuyển dữ liệu)
• MISD – Multiple Instruction Stream, Single Data
Stream
(Cấu trúc đa lệnh, dòng lưu chuyển dữ liệu đơn)
• MIMD - Multiple Instruction, Multiple Data Stream
(Cấu trúc đa lệnh, nhiều dòng lưu chuyển dữ liệu)
tính
Trang 4* Sơ đồ tổ chức
Processor Organization
Shared Memory (tighly couple)
Distributed Memory (losesly coupled)
Clusters Symmetric
Multiprocess
or (SMP)
Nonumifor
n Memory Access (NUMA)
Trang 5• CU: Control Unit
• PU: Processing Unit
• MU: Memory Unit
Trang 6DS IS
Trang 7 Đơn dòng lệnh điều khiển đồng thời các phần
Trang 8 Một tập dữ liệu cùng được truyền đến một tập các bộ xử lý
Mỗi bộ xử lý thực hiện một dãy lệnh khác nhau
Không tồn tại máy tính thực tế
Có thể có trong tương lai
Trang 9SMP- Symmertric multiprocessor (đa đối xứng)
• Xử lý chia sẻ bộ nhớ
• Chia sẻ bộ nhớ xử lý
• Đa xử lý đối xứng
- Chia sẻ bộ nhớ đơn giản hay vùng nhớ
- Chia sẻ bus để truy cập bộ nhớ
- Tập trung bộ nhớ để khu vực nhất định của bộ nhớ là
khoảng lành mạnh cho mỗi bộ vi xử lý
Trang 11 Tập các bộ xử lý
Các bộ xử lý đồng thời thực hiện các dãy lệnh khác nhau
Các mô hình MIMD
• Multiprocessors (Shared Memory)
• Multicomputers (Distributed memory)
Trang 12* MIMD – Share Memory
D S
D S
.
Trang 13D S
D S
.
LM
LM
LM
.
.
Trang 14• Máy tính có nhiều hơn 2 bộ xử lý giống nhau
• Các bộ xử lý dùng chung bộ nhớ và hệ thống I/O
• Thời gian truy cập bộ nhớ là bằng nhau với các bộ xử lý
• Tất cả các bộ xử lý chia sẻ truy nhập vào ra
• Các bộ xử lý có thể thể hiện chức năng giống nhau
• Hệ thống được điều khiển bởi 1 hệ điều hành phân tán
Trang 16* Sơ đồ khối của đa xử lý
…
Trang 18• Hình thức đơn giản
• Cấu trúc và giao diện tương tự như hệ thống xử lý đơn
• Tính năng sau đây được cung cấp:
- Giải quyết vấn đề - phân biệt các module trên
• Ngày nay có nhiều bộ xử lý cũng như nhiều I/O
Trang 19o Đơn giản
• Giao diện vật lý và giải quyết vấn đề, sự phân
chia và chia sẻ thời gian vẫn giữ nguyên như trong một hệ thống xử lý đơn
o Linh hoạt
• Dễ dàng mở rộng
o Sản phẩm
Sự thất bại của bất kỳ thiết bị kèm theo không gây
ra sự thất bại nào cho toàn bộ hệ thống
Trang 20• Hiệu suất bị giới hạn bởi thời gian chu kì bus
• Mỗi bộ xử lý nên có bộ nhớ cache của
địa phương
- Giảm số lượng truy cập bus
• Dẫn đến các vấn đề gắn kết với bộ nhớ cache
- Giải quyết trong phần cứng
điểm
Trang 21 Truy cập độc lập trực tiếp của các module
bộ nhớ của mỗi bộ xử lý
Logic cần thiết để giải quyết xung đột
Ít hoặc không có sửa đổi để xử lý hoặc
module cần thiết
memory)
Trang 22.
.
Trang 23• 1 Hiệu suất tốt hơn
- mọi bộ xử lý dành cho mọi module
• 2 Có thể cấu hình các phần cùng bộ nhớ tới 1 hoặc nhiều bộ vi xử lý
- tăng cường an ninh
cổng
(Multiport Memory - Advantages)
Trang 24• 1 Viết thông qua chính sách bộ nhớ cache
- không có phương tiện thuận lợi khác
Trang 25• Luồng dữ liệu riêng biệt giữa các thành phần độc lập
• Có thể đệm yêu cầu thực hiện trọng tài và thời gian
• Vượt qua tình trạng và kiểm soát, thực hiện bộ nhớ
cache cập nhật cảnh báo
• Giao diện đến các module vẫn như cũ
• Nhược điểm:
- Bộ điều khiển khá phức tạp
- Tiềm năng hiệu suất nút cổ chai
Unit)
Trang 26• Đồng thời các quá trình xảy ra
Trang 27• Bộ vi xử lý PU
- Bộ vi xử lý CISC
- Thường được sử dụng hướng dẫn cứng có dây
- 64k L1 thốn nhất với thời gian truy cập 1 chu kì
• L2 cache
-348k
• Bus chuyển đổi mạng chuyển mạch
- Bao gồm 2M của L3 cache
• Thẻ nhớ
- 8G
chính
Trang 28• 1 nhóm toàn bộ máy tính kết nói với nhau
• Làm việc cùng nhau là nguồn tài nguyên thống nhất
• Tưởng tượng toàn bộ là 1 máy
• Mỗi máy được gọi là một nút
Trang 29• Khả năng mở rộng tuyệt đối
• Khả năng mở rộng gia tăng
• Tính sẵn sàng cao
• Giá superior/ hiệu suất
Trang 30+ Khôi phục lại các ứng dụng và dữ liệu của hệ thống ban đầu
+ Sau đó vấn đề được cố định
hành
Trang 31• Cân bằng tải
- Khả năng mở rộng của hệ thống ban đầu gia tăng
- Tự động kết nối các máy tính trong lịch
- Có thể chuyển đổi giữa các máy
(tiếp)
Trang 32• Ứng dụng đơn thi hành song song bên một số
- Ứng dụng được viết từ đầu là song song
- Truyền thông điệp để di chuyển dữ liệu giữa nút
- Khó khăn chương trình
- Kết quả cuối cùng tốt nhất
Trang 33 Tính toán tham số
- Nếu một vấn đề được thực hiện lặp đi lặp lại trên các thuật toán bộ nhớ khavs nhau của dữ liệu
- Xây dựng mô phỏng sử dụng bản khác nhau
- Cần công cụ hiệu quả để tổ chức và chạy
Trang 34• Ảnh thống nhất cho người sử dụng
• Hệ thống hình ảnh duy nhất
• Điểm duy nhất của mục
• Hệ thống phân cấp tập tin đơn
• Điểm kiểm soát đơn
• Nối mạng ảo duy nhất
• Một không gian bộ nhớ
• Một hệ thống quản lý việc
• Giao diện một người dùng
• Một không gian I/O
• Không gian của một quy trình
• Dịch chuyển quy trình
gian
Trang 35• Cả hai cung cấp hỗ trợ bộ đa xử lý cho ứng dụng yêu cầu cao
• Cả hai sẵn có về mặt thương mại
- SMP lâu hơn
• SMP
- Dễ dàng quản lý và điều khiển
- Gần gũi hơn với các hệ thống xử lý đơn
- Lập kế hoạch khác
- Không gian vật lý ít
- Tiêu thụ điện năng thấp hơn
• Cluster:
- Khả năng nâng cấp tuyệt đối và gia tăng nhanh hơn
- Khởi động nhanh hơn
Trang 36• Thay thế cho SMP và phân nhóm
Trang 38• SMP có giới hạn thự tế có số bộ xử lý
- Lưu lượng bus giới hạn cho bộ xử lý từ 16 đến 64
• Trong cụm mỗi bus có bộ nhớ riêng
- Các ứng dụng không thấy bộ nhớ toàn cầu lớn
- Gắn hết duy nất bằng phần mền không cần phần
trong khi cho phép nút bộ đọc xử lý với mỗi bus
riêng hay hệ thống liên kết bên trong
Trang 39• Mỗi nút duy trì vị trí của phần bộ nhớ trong thư mục
- Nút 2 thư mục yêu cầu thư mục của nút 1
- Nút 1 thư mục yêu cầu nội dung của 789
- Nút nhớ 1 đặt dữ liệu trên bus (nút 1 địa phương)
- Nút 1 thư mục được lấy dữ liệu trên bus
- Dữ liệu được chuyển vào thư mục của nút 2
- Nút 2 thư mục được đặt dữ kiệu trên bus
- Dữ liệu chọn đặt trong P2 của bộ nhớ cache và
chuyển đến bộ xử lý
* Memory Access Sequence(trình tự truy cập
bộ nhớ)
Trang 40• Nút 1 được đặt giữa thư mục, nút 2 có bản sao
• Số thư mục cục bộ hết nếu vị trí bộ hớ theo yêu cầu của một bộ xử lý
cache)
Trang 41• Hoạt động hiệu quả ở mức cao hơn song song với SMP
• Không có thay đổi phần mềm lớn
• Hiệu năng có thể phân tách nếu quá nhiều truy cập vào bbọ nhớ từ xa
Trang 42Thank you for watching…
The end….