Vi xử lý Intel xeon 6000 silde
Trang 1Chủ đề: Tìm hiểu kiến trúc dòng vi xử lý
Intel Xeon 6000BÁO CÁO
Trang 3I Giới thiệu
Xeon bắt đầu sự nghiệp của nó khi còn là lớp con của Pentium II Ngày nay, Intel đã xếp Xeon vào lớp Pentium III BXL Xeon được thiết kế nhằm đáp ứng yêu cầu của dòng máy chủ cao cấp và tầm trung chuyên cung cấp dịch vụ Internet, lưu trữ dữ liệu, tạo nội dung kĩ thuật số thiết kế tự động Sử dụng Xeon , hệ thống có thể kết hợp 4 hoặc 8 BXL với nhau
- Intel Xeon Proceser 6000 được thiết kế theo các khối công việc bộ nhớ hạn chế Intel Xeon Proceser 6000 với máy chủ đa lõi 64 bit là sự lựa chọn hợp lý nhất
Xeon : là một thương hiệu đa xử lý- đa socket của Tập đoàn Intel nhằm mục tiêu vào
người tiêu dùng máy chủ ,máy trạm và hệ thống nhúng thị trường
Trang 4Đặc điểm
Với lên đến 8 core và 16 threads cho mỗi socket với Intel
® Hyper-Threading Technology Intel Xeon đã tăng hiệu suất xử lý với công nghệ sản xuất 45nm và tăng khoảng không cho các ứng dụng đòi hỏi xử lý đa luồng
Với lên đến 8 core và 16 threads cho mỗi socket với Intel
® Hyper-Threading Technology Intel Xeon đã tăng hiệu suất xử lý với công nghệ sản xuất 45nm và tăng khoảng không cho các ứng dụng đòi hỏi xử lý đa luồng
Với vi kiến trúc Nahalem được sản xuất với công nghệ 45nm hi-k cho phép thúc đẩy hiệu suất bộ nhớ cache trên nhiều ứng dụng / môi trường của người sử dụng và dữ liệu đòi hỏi khối lượng công việc lớn, cho phép triển khai dữ liệu với mật độ cao
Với vi kiến trúc Nahalem được sản xuất với công nghệ 45nm hi-k cho phép thúc đẩy hiệu suất bộ nhớ cache trên nhiều ứng dụng / môi trường của người sử dụng và dữ liệu đòi hỏi khối lượng công việc lớn, cho phép triển khai dữ liệu với mật độ cao
Với bộ nhớ cache L3 18 MB làm tăng hiệu quả truyền dữ liệu cache - to – core , tối đa hóa băng thông để xử lý bộ
nhớ chính
Với bộ nhớ cache L3 18 MB làm tăng hiệu quả truyền dữ liệu cache - to – core , tối đa hóa băng thông để xử lý bộ
nhớ chính
Intel ® QuickPath Interconnect (Intel ® QPI) cung cấp tốc
độ cao (lên đến 25,6 GB / s), kết nối point – to - point giữa các bộ xử lý, cũng như giữa các bộ vi xử lý và I / O hub
Intel ® QuickPath Interconnect (Intel ® QPI) cung cấp tốc
độ cao (lên đến 25,6 GB / s), kết nối point – to - point giữa các bộ xử lý, cũng như giữa các bộ vi xử lý và I / O hub
Trang 5II Kiến trúc vi xử lý.
CPU Intel Xeon 6000 hoạt động dựa trên kiến trúc Nahalem
1 Sơ đồ khối
Trang 6Khối thực thi
Trang 7III Kiến trúc tập lệnh
1 Khái quát chung về tập lệnh (Instructions Set):
Lệnh của máy tính (Computer Instructions) là một từ nhị phân (Binary Word) được lưu trữ trong bộ nhớ Mỗi lệnh thực hiện một nhiệm vụ cụ thể Lệnh được đọc từ bộ nhớ vào CPU để giải mã và thực hiện lệnh Các lệnh được mô tả bằng các ký hiệu gợi nhớ chính
Nhóm lệnh
số học và logic
Nhóm lệnh điều khiển
Nhóm lệnh điều khiển Nhóm lệnh vào / ra
Nhóm lệnh vào / ra
Nhóm lệnh
so sánh Nhóm lệnh
so sánh
Trang 9Chức năng các khối
* FPU : Floating - Point Unit Khối này chịu trách nhiệm cho việc thực thi các biểu thức toán học floating-point và cũng cả các chỉ lệnh MMX và SSE
* Load : khối này dùng để xử lý các chỉ lệnh yêu cầu dữ liệu được đọc từ bộ nhớ RAM
* Store Address : Khối xử lý các chỉ lệnh hỏi địa chỉ để được ghi tại bộ nhớ RAM Khối này cũng có tên gọi là AGU (Address Generator Unit ) Kiểu chỉ lệnh này sử dụng cả hai khối Store Address và Store Data tại cùng một thời điểm
* Store Data: Khối này xử lý các chỉ lệnh yêu cầu dữ liệu được ghi vào bộ nhớ RAM ) Kiểu chỉ lệnh này sử dụng cả hai khối Store Address và Store Data tại cùng một thời điểm
* Branch Unit : Khối xử lý rẽ nhánh hay còn gọi là JEU (Jump Execution Unit)
Trang 101.1 Tập lệnh x86
Tập lệnh này gồm 111 lệnh , chiều dài của lệnh từ 1 byte đến vài byte
Tập lệnh hỗ trợ các nhóm thao tác căn bản sau :
+ Các lệnh trao đổi dữ liệu
+ Các lệnh số học và logic
+ Các lệnh điều khiển, rẽ nhánh và lặp
Mã ghi nhớ Chức năng JMP Nhảy không điều kiện
JA Nhảy nếu lớn hơn JAE(JNB) Nhảy nếu lớn hơn hoặc bằng JB(JNAE) Nhảy nếu bé hơn
Các câu lệnh thuộc nhóm này cho phép thay đổi trật tự thực hiện các câu lệnh bên trong chương trình
Trang 111.2 Tập lệnh MMX ( MultiMedia eXtensions)
Trang 12Gồm 57 lệnh hỗ trợ đồ họa được xây dựng nhằm mục đích giúp hệ thống xử lý các tác
vụ đa phương tiện (multimedia operation) như âm thanh, phim, hình ảnh và modem (truyền nhận dữ liệu) Công nghệ MMX bao gồm 8 thanh ghi từ MM0 đến MM7, tích hợp 4 kiểu dữ liệu kiểu bye kiểu word, kiểu doubleword và quadword và các tập lệnh MMX
Trang 131.3 Tập lệnh SSE (Streaming SIMD Extensions)
Không những chiếm không gian giống như các thanh ghi FPU bình thường, mà SSE bổ3 sung thêm một không gian riêng biệt để bộ vi xử lý
SSE có thêm 8 thanh ghi 128-bit Các thanh ghi được gọi từ XMM0 - XMM7 Một thanh ghi được khiển bổ sung được gọi là MXCSR tồn tại trong hệ thống để kiểm tra tình trạng của các tập lệnh SSE.(MXCSR là 1 thanh ghi 32-bit chứa các cờ điều khiển và thông tin liên quan đến các lệnh của SSE, chỉ các bit từ 0 – 15 được xác định.)
Các tập lệnh của SSE đều giống với MMX nhưng SSE còn có thêm Các lệnh trạng
thái , Các lệnh Shuffle, Các lệnh cache control
Trang 141.4 Tập lệnh SSE2 (Streaming SIMD Extensions 2)
Là tập lệnh được tăng cường thêm 144 lệnh hỗ trợ đồ họa, truyền thông đa phương tiện và kết nối mạng trực tuyến (true multimedia and online Internet) Các lệnh mới này làm tối ưu hóa khả năng thực hịên các ứng dụng như phim video, xử lý âm thanh - hình ảnh, mã hóa, tài chính, thiết kế và nghiên cứu khoa học, kết nối mạng trực tuyến
Đây là 1 số lệnh trong 144 lệnh được bổ xung: ADDPD,
ADDSD, SUBPD, SUBSD, MULPD, MULSD, DIVPD, DIVSD, MAXPD, MAXSD, MINPD,MINSD, PADDB, PADDW, PADDD…
1.5.Tập lệnh SSE3
Phiên bản hỗ trợ cho SSE3, cho phép xử lý thanh ghi 64-bit MMX hoặc 128-bit
XMM, bao gồm 16 lệnh hoàn toàn mới là : PSIGND, PSIGNW, PSIGNB, PHADDD,
PHADDW, PHADDSW, PHSUBD, PHSUBW, PHSUBSW, PMADDUBSW,
PABSD - ABS(), PABSW - ABS(),PABSB - ABS(), PMULHRSW, PSHUFB,
PALIGNR
Trang 151.6 Tập lệnh SSE4
Tập lệnh phát hành năm 2006
Trang 16I.V Công nghệ mới của dòng vi xử lý Intel Xeon 6000
4.1 :Công nghệ siêu phân luồng HyperThreading
Trang 17Nguyên lý hoạt động : Về bản chất, một nhân xử lý không thể xử lý hai luồng thông
tin vào cùng một thời điểm Nếu chúng ta muốn cùng một lúc có được nhiều ứng dụng chạy song song, hệ điều hành của chúng ta phải ra lệnh cho nhân xử lý liên tục và
chuyển qua chuyển lại tác vụ xử lý cho từng thread Quá trình này diễn ra rất-rất nhanh
và hoàn toàn không thể nhận biết bằng mắt thường, tạo cảm giác như CPU của chúng
ta xử lý tất cả các khối lượng công việc đó song song cùng một thời điểm
Công nghệ siêu luồng cho phép các phần mềm ứng dụng được viết cho những máy chủ đa luồng có thể thực hiện các chỉ thị song song đồng thời trên mỗi bộ xử lý riêng, bằng cách này sẽ cải thiện tức thì tốc độ giao dịch cũng như thời gian đáp ứng và các yêu cầu đặc thù khác của phần mềm nghiệp vụ và thương mại điện tử Công nghệ này tương thích với các phần mềm ứng dụng và hệ điều hành sẵn có trên các máy chủ, nó cho phép hỗ trợ nhiều người dùng hơn và tăng khối lượng công việc được xử lý trên một máy chủ Với các máy trạm cao cấp, công nghệ siêu phân luồng cũng sẽ tăng đáng
kể tốc độ các phần mềm ứng dụng đòi hỏi năng lực tính toán cao, ví dụ như phần mềm thiết kế 3 chiều, xử lý ảnh hay video
Cải tiến của công nghệ siêu phân luồng (Hyper-Threading ) so với công nghệ cũ :
Mỗi ứng dụng trên máy tính khi thực hiện sẽ chạy nhiều tiến trình, mỗi tiến trình lại gồm nhiều luồng xử lý (gọi là thread)
Trang 184.2 :BUS ngoài mới QPI ( QuickPath Interconnect )
QPI có liên kết của kết cấu tạo thành độ rộng trong giao diện với 03 kiểu :
+ Full-Width với liên kết 20–bit + Hafl-Width với liên kết 10-bit + Quarter-Width với liên kết 5-bit
Thực tế đều sử dụng liên kết chuẩn trong kết nối bên trong của CPU là Full-Width với 20-bit
Mỗi tín hiệu dữ liệu dùng hai dây dẫn cho hệ thống tín hiệu Vi phân , cùng với hai dây cho Xung đồng
hồ tổng cộng là 42 dây dẫn ( 20 x 2 + 2 ) cho kiểu Full-Width Mỗi thiết bị có bộ phận Thu và Phát riêng biệt vì thế một liên kết sẽ là 84 chân kết nối
So với 150 chân của FSB 64-bit của Intel cũ khi
QPI gần như giảm đi hơn một nửa Như vậy độ
phức tạp của dây dẫn kết nối giữa những liên kết giảm đi đáng kể
Cấu trúc của QPI:
Trang 19Intel cũng đưa vào kiến trúc Nehalem bộ đệm cấp ba L3 Bộ đệm L3 có dung lượng 8MB và được tất cả các core dùng chung Ưu điểm của thiết kế cache L3 này là giúp việc trao đổi dữ liệu giữa các nhân hiệu quả hơn mà không cần thông qua các cache bên trong của mỗi nhân
Giao thức truy xuất dữ liệu trong cache của các nhân cũng có sự chuyển biến thành giao thức MESIF (Modified, Exclusive, Shared, Invalid and Forward) Sự phối hợp của những bit đánh dấu và MESIF giúp giảm bớt tần suất truy cập cache của các nhân nên
sẽ giải phóng nhiều băng thông hơn cho những dữ liệu thật sự cần thiết trong các
cache Đây là một cải tiến rất quan trọng giúp nâng cao hiệu quả của tính toán song song
4.3: Bộ nhớ Cache
Trang 204.4 : Mạch điều khiển tích hợp bộ nhớ (IMC)
- Khi CPU cần truy cập đến bộ nhớ hệ thống (RAM) nó phải chờ chipset lấy dữ liệu về cho nó Cách làm việc “nhiều cửa, nhiều dấu” này có ưu điểm là thiết kế và chế tạo CPU đơn giản hơn nhiều, nhược điểm của cách làm việc này là băng thông bộ nhớ bị hạn chế và độ trễ truy cập bộ nhớ hệ thống cao (do phải thông qua chip bắc) Những bộ vi
xử lí mới dựa trên lõi Nehalem sẽ tích hợp Bộ phận điều khiển bộ nhớ bên trong CPU
và như vậy sẽ cung cấp hai Bus ngoài : Bus bộ nhớ để nối CPU tới bộ nhớ(Ram) và Bus I/O để nối CPU với thiết bị ngoài
- Việc thay đổi này sẽ nâng cao hiệu suất làm việc của hệ thống vì hai lý do:
+ Có hai đường dữ liệu riêng biệt cho việc truy cập những thiết bị I/O và bộ nhớ
+ Truy cập bộ nhớ nhanh hơn vì CPU không cần trao đổi thông tin với bất kì những linh kiện bên ngoài CPU
Trang 214.5 : Bộ điều khiển năng lượng
- Những Transistor bên trong CPU làm việc như một cái Công tắc ( Switch ) với hai trạng thái :
+ Dẫn điện, khi ấy nó làm việc như Công tắc được đóng để cho phép dòng điện đi qua + Không dẫn điện , Công tắc mở không cho phép dòng điện đi qua
Để tránh trường hợp Switch làm việc ở trạng thái không dẫn điện thì toàn bộ cấu trúc quản lý điện được đưa vào một bộ phận riêng trong CPU gọi là PCU (Bộ phận Quản lý Điện năng – Power Control Unit ) Nó có vai trò như một bộ xử lý thô sơ bên trong
một bộ xử lý
Bộ xử lý Mini này hỗ trợ một quy trình quản lý phức tạp hơn nhiều so với các bộ xử lý khác của Intel: xung nhịp và điện áp của mỗi nhân được điều khiển riêng biệt dựa trên thông tin về nhiệt độ và lượng điện tiêu thụ Do đó mỗi nhân có thể chuyển riêng sang mức tiêu thụ điện thấp Mạch điều khiển bộ nhớ và Bus QPI sẽ chuyển sang chế độ điện năng thấp khi tất cả các nhân đều nghỉ
Trang 224.6 : Công Nghệ Intel® Turbo Boost
- Turbo Boost là công nghệ nâng hiệu suất máy tính lên thêm 20%, giúp hệ thống hoạt động nhanh hơn
và kéo dài thời lượng pin, bằng cách
tự động điều chỉnh xung nhịp của từng nhân độc lập cho phù hợp với nhu cầu xử lý
4.7 : Công nghệ Enhanced Intel SpeedStep (EIST)
- Công nghệ Enhanced Intel SpeedStep cho phép hệ thống tự động điều chỉnh xử lý điện áp và tần số lõi, có thể dẫn đến tiêu thụ giảm công suất trung bình và giảm sản xuất nhiệt trung bình
-Ngoài EIST được phát triển trước đó thì hiện nay Intel còn có công nghệ Enhanced Halt State (C1E) Về mặt lợi ích thì hai cái này đều giống nhau là nhằm giảm tải điện năng cho CPU, giảm độ ồn cho hệ thống
Trang 232.8: Công nghệ ảo hóa (virtualization technology)
- Những con chip mới cũng có hiệu suất cao nhất trong công nghệ ảo hóa khi cải thiện đến 25% tốc độ những ứng dụng trên máy ảo
Công nghệ ảo hóa giúp máy chủ chạy đồng thời nhiều môi trường hệ điều hành trên một
bộ xử lý duy nhất, cho phép chia một chiếc máy tính thành nhiều máy tính “ảo”
- Ưu điểm của ảo hóa là : trên 1 máy thật ảo hóa nhiều "máy ảo" nó thuận tiện , tận dụng tài nguyên tối ưu hơn so với dùng nhiều máy thật
Trang 24Thanks for your listening