Tìm hiểu kiến trúc vi xử lý Intel xeon 6000 silde

Vi xử lý Intel xeon 6000 silde

Trang 1

Chủ đề: Tìm hiểu kiến trúc dòng vi xử lý

Intel Xeon 6000BÁO CÁO

Trang 3

I Giới thiệu

Xeon bắt đầu sự nghiệp của nó khi còn là lớp con của Pentium II Ngày nay, Intel đã xếp Xeon vào lớp Pentium III BXL Xeon được thiết kế nhằm đáp ứng yêu cầu của dòng máy chủ cao cấp và tầm trung chuyên cung cấp dịch vụ Internet, lưu trữ dữ liệu, tạo nội dung kĩ thuật số thiết kế tự động Sử dụng Xeon , hệ thống có thể kết hợp 4 hoặc 8 BXL với nhau

- Intel Xeon Proceser 6000 được thiết kế theo các khối công việc bộ nhớ hạn chế Intel Xeon Proceser 6000 với máy chủ đa lõi 64 bit là sự lựa chọn hợp lý nhất

Xeon : là một thương hiệu đa xử lý- đa socket của Tập đoàn Intel nhằm mục tiêu vào

người tiêu dùng máy chủ ,máy trạm và hệ thống nhúng thị trường

Trang 4

Đặc điểm

Với lên đến 8 core và 16 threads cho mỗi socket với Intel

® Hyper-Threading Technology Intel Xeon đã tăng hiệu suất xử lý với công nghệ sản xuất 45nm và tăng khoảng không cho các ứng dụng đòi hỏi xử lý đa luồng

Với lên đến 8 core và 16 threads cho mỗi socket với Intel

® Hyper-Threading Technology Intel Xeon đã tăng hiệu suất xử lý với công nghệ sản xuất 45nm và tăng khoảng không cho các ứng dụng đòi hỏi xử lý đa luồng

Với vi kiến trúc Nahalem được sản xuất với công nghệ 45nm hi-k cho phép thúc đẩy hiệu suất bộ nhớ cache trên nhiều ứng dụng / môi trường của người sử dụng và dữ liệu đòi hỏi khối lượng công việc lớn, cho phép triển khai dữ liệu với mật độ cao

Với bộ nhớ cache L3 18 MB làm tăng hiệu quả truyền dữ liệu cache - to – core , tối đa hóa băng thông để xử lý bộ

nhớ chính

Với bộ nhớ cache L3 18 MB làm tăng hiệu quả truyền dữ liệu cache - to – core , tối đa hóa băng thông để xử lý bộ

nhớ chính

Intel ® QuickPath Interconnect (Intel ® QPI) cung cấp tốc

độ cao (lên đến 25,6 GB / s), kết nối point – to - point giữa các bộ xử lý, cũng như giữa các bộ vi xử lý và I / O hub

Intel ® QuickPath Interconnect (Intel ® QPI) cung cấp tốc

độ cao (lên đến 25,6 GB / s), kết nối point – to - point giữa các bộ xử lý, cũng như giữa các bộ vi xử lý và I / O hub

Trang 5

II Kiến trúc vi xử lý.

CPU Intel Xeon 6000 hoạt động dựa trên kiến trúc Nahalem

1 Sơ đồ khối

Trang 6

Khối thực thi

Trang 7

III Kiến trúc tập lệnh

1 Khái quát chung về tập lệnh (Instructions Set):

Lệnh của máy tính (Computer Instructions) là một từ nhị phân (Binary Word) được lưu trữ trong bộ nhớ Mỗi lệnh thực hiện một nhiệm vụ cụ thể Lệnh được đọc từ bộ nhớ vào CPU để giải mã và thực hiện lệnh Các lệnh được mô tả bằng các ký hiệu gợi nhớ chính

Nhóm lệnh

số học và logic

Nhóm lệnh điều khiển

Nhóm lệnh điều khiển Nhóm lệnh vào / ra

Nhóm lệnh vào / ra

Nhóm lệnh

so sánh Nhóm lệnh

so sánh

Trang 9

Chức năng các khối

* FPU : Floating - Point Unit Khối này chịu trách nhiệm cho việc thực thi các biểu thức toán học floating-point và cũng cả các chỉ lệnh MMX và SSE

* Load : khối này dùng để xử lý các chỉ lệnh yêu cầu dữ liệu được đọc từ bộ nhớ RAM

* Store Address : Khối xử lý các chỉ lệnh hỏi địa chỉ để được ghi tại bộ nhớ RAM Khối này cũng có tên gọi là AGU (Address Generator Unit ) Kiểu chỉ lệnh này sử dụng cả hai khối Store Address và Store Data tại cùng một thời điểm

* Store Data: Khối này xử lý các chỉ lệnh yêu cầu dữ liệu được ghi vào bộ nhớ RAM ) Kiểu chỉ lệnh này sử dụng cả hai khối Store Address và Store Data tại cùng một thời điểm

* Branch Unit : Khối xử lý rẽ nhánh hay còn gọi là JEU (Jump Execution Unit)

Trang 10

1.1 Tập lệnh x86

Tập lệnh này gồm 111 lệnh , chiều dài của lệnh từ 1 byte đến vài byte

Tập lệnh hỗ trợ các nhóm thao tác căn bản sau :

+ Các lệnh trao đổi dữ liệu

+ Các lệnh số học và logic

+ Các lệnh điều khiển, rẽ nhánh và lặp

Mã ghi nhớ Chức năng JMP Nhảy không điều kiện

JA Nhảy nếu lớn hơn JAE(JNB) Nhảy nếu lớn hơn hoặc bằng JB(JNAE) Nhảy nếu bé hơn

Các câu lệnh thuộc nhóm này cho phép thay đổi trật tự thực hiện các câu lệnh bên trong chương trình

Trang 11

1.2 Tập lệnh MMX ( MultiMedia eXtensions)

Trang 12

Gồm 57 lệnh hỗ trợ đồ họa được xây dựng nhằm mục đích giúp hệ thống xử lý các tác

vụ đa phương tiện (multimedia operation) như âm thanh, phim, hình ảnh và modem (truyền nhận dữ liệu) Công nghệ MMX bao gồm 8 thanh ghi từ MM0 đến MM7, tích hợp 4 kiểu dữ liệu kiểu bye kiểu word, kiểu doubleword và quadword và các tập lệnh MMX

Trang 13

1.3 Tập lệnh SSE (Streaming SIMD Extensions)

Không những chiếm không gian giống như các thanh ghi FPU bình thường, mà SSE bổ3 sung thêm một không gian riêng biệt để bộ vi xử lý

SSE có thêm 8 thanh ghi 128-bit Các thanh ghi được gọi từ XMM0 - XMM7 Một thanh ghi được khiển bổ sung được gọi là MXCSR tồn tại trong hệ thống để kiểm tra tình trạng của các tập lệnh SSE.(MXCSR là 1 thanh ghi 32-bit chứa các cờ điều khiển và thông tin liên quan đến các lệnh của SSE, chỉ các bit từ 0 – 15 được xác định.)

Các tập lệnh của SSE đều giống với MMX nhưng SSE còn có thêm Các lệnh trạng

thái , Các lệnh Shuffle, Các lệnh cache control

Trang 14

1.4 Tập lệnh SSE2 (Streaming SIMD Extensions 2)

Là tập lệnh được tăng cường thêm 144 lệnh hỗ trợ đồ họa, truyền thông đa phương tiện và kết nối mạng trực tuyến (true multimedia and online Internet) Các lệnh mới này làm tối ưu hóa khả năng thực hịên các ứng dụng như phim video, xử lý âm thanh - hình ảnh, mã hóa, tài chính, thiết kế và nghiên cứu khoa học, kết nối mạng trực tuyến

Đây là 1 số lệnh trong 144 lệnh được bổ xung: ADDPD,

ADDSD, SUBPD, SUBSD, MULPD, MULSD, DIVPD, DIVSD, MAXPD, MAXSD, MINPD,MINSD, PADDB, PADDW, PADDD…

1.5.Tập lệnh SSE3

Phiên bản hỗ trợ cho SSE3, cho phép xử lý thanh ghi 64-bit MMX hoặc 128-bit

XMM, bao gồm 16 lệnh hoàn toàn mới là : PSIGND, PSIGNW, PSIGNB, PHADDD,

PHADDW, PHADDSW, PHSUBD, PHSUBW, PHSUBSW, PMADDUBSW,

PABSD - ABS(), PABSW - ABS(),PABSB - ABS(), PMULHRSW, PSHUFB,

PALIGNR

Trang 15

1.6 Tập lệnh SSE4

Tập lệnh phát hành năm 2006

Trang 16

I.V Công nghệ mới của dòng vi xử lý Intel Xeon 6000

4.1 :Công nghệ siêu phân luồng HyperThreading

Trang 17

Nguyên lý hoạt động : Về bản chất, một nhân xử lý không thể xử lý hai luồng thông

tin vào cùng một thời điểm Nếu chúng ta muốn cùng một lúc có được nhiều ứng dụng chạy song song, hệ điều hành của chúng ta phải ra lệnh cho nhân xử lý liên tục và

chuyển qua chuyển lại tác vụ xử lý cho từng thread Quá trình này diễn ra rất-rất nhanh

và hoàn toàn không thể nhận biết bằng mắt thường, tạo cảm giác như CPU của chúng

ta xử lý tất cả các khối lượng công việc đó song song cùng một thời điểm

Công nghệ siêu luồng cho phép các phần mềm ứng dụng được viết cho những máy chủ đa luồng có thể thực hiện các chỉ thị song song đồng thời trên mỗi bộ xử lý riêng, bằng cách này sẽ cải thiện tức thì tốc độ giao dịch cũng như thời gian đáp ứng và các yêu cầu đặc thù khác của phần mềm nghiệp vụ và thương mại điện tử Công nghệ này tương thích với các phần mềm ứng dụng và hệ điều hành sẵn có trên các máy chủ, nó cho phép hỗ trợ nhiều người dùng hơn và tăng khối lượng công việc được xử lý trên một máy chủ Với các máy trạm cao cấp, công nghệ siêu phân luồng cũng sẽ tăng đáng

kể tốc độ các phần mềm ứng dụng đòi hỏi năng lực tính toán cao, ví dụ như phần mềm thiết kế 3 chiều, xử lý ảnh hay video

Cải tiến của công nghệ siêu phân luồng (Hyper-Threading ) so với công nghệ cũ :

Mỗi ứng dụng trên máy tính khi thực hiện sẽ chạy nhiều tiến trình, mỗi tiến trình lại gồm nhiều luồng xử lý (gọi là thread)

Trang 18

4.2 :BUS ngoài mới QPI ( QuickPath Interconnect )

QPI có liên kết của kết cấu tạo thành độ rộng trong giao diện với 03 kiểu :

+ Full-Width với liên kết 20–bit + Hafl-Width với liên kết 10-bit + Quarter-Width với liên kết 5-bit

Thực tế đều sử dụng liên kết chuẩn trong kết nối bên trong của CPU là Full-Width với 20-bit

Mỗi tín hiệu dữ liệu dùng hai dây dẫn cho hệ thống tín hiệu Vi phân , cùng với hai dây cho Xung đồng

hồ tổng cộng là 42 dây dẫn ( 20 x 2 + 2 ) cho kiểu Full-Width Mỗi thiết bị có bộ phận Thu và Phát riêng biệt vì thế một liên kết sẽ là 84 chân kết nối

So với 150 chân của FSB 64-bit của Intel cũ khi

QPI gần như giảm đi hơn một nửa Như vậy độ

phức tạp của dây dẫn kết nối giữa những liên kết giảm đi đáng kể

Cấu trúc của QPI:

Trang 19

Intel cũng đưa vào kiến trúc Nehalem bộ đệm cấp ba L3 Bộ đệm L3 có dung lượng 8MB và được tất cả các core dùng chung Ưu điểm của thiết kế cache L3 này là giúp việc trao đổi dữ liệu giữa các nhân hiệu quả hơn mà không cần thông qua các cache bên trong của mỗi nhân

Giao thức truy xuất dữ liệu trong cache của các nhân cũng có sự chuyển biến thành giao thức MESIF (Modified, Exclusive, Shared, Invalid and Forward) Sự phối hợp của những bit đánh dấu và MESIF giúp giảm bớt tần suất truy cập cache của các nhân nên

sẽ giải phóng nhiều băng thông hơn cho những dữ liệu thật sự cần thiết trong các

cache Đây là một cải tiến rất quan trọng giúp nâng cao hiệu quả của tính toán song song

4.3: Bộ nhớ Cache

Trang 20

4.4 : Mạch điều khiển tích hợp bộ nhớ (IMC)

- Khi CPU cần truy cập đến bộ nhớ hệ thống (RAM) nó phải chờ chipset lấy dữ liệu về cho nó Cách làm việc “nhiều cửa, nhiều dấu” này có ưu điểm là thiết kế và chế tạo CPU đơn giản hơn nhiều, nhược điểm của cách làm việc này là băng thông bộ nhớ bị hạn chế và độ trễ truy cập bộ nhớ hệ thống cao (do phải thông qua chip bắc) Những bộ vi

xử lí mới dựa trên lõi Nehalem sẽ tích hợp Bộ phận điều khiển bộ nhớ bên trong CPU

và như vậy sẽ cung cấp hai Bus ngoài : Bus bộ nhớ để nối CPU tới bộ nhớ(Ram) và Bus I/O để nối CPU với thiết bị ngoài

- Việc thay đổi này sẽ nâng cao hiệu suất làm việc của hệ thống vì hai lý do:

+ Có hai đường dữ liệu riêng biệt cho việc truy cập những thiết bị I/O và bộ nhớ

+ Truy cập bộ nhớ nhanh hơn vì CPU không cần trao đổi thông tin với bất kì những linh kiện bên ngoài CPU

Trang 21

4.5 : Bộ điều khiển năng lượng

- Những Transistor bên trong CPU làm việc như một cái Công tắc ( Switch ) với hai trạng thái :

+ Dẫn điện, khi ấy nó làm việc như Công tắc được đóng để cho phép dòng điện đi qua + Không dẫn điện , Công tắc mở không cho phép dòng điện đi qua

Để tránh trường hợp Switch làm việc ở trạng thái không dẫn điện thì toàn bộ cấu trúc quản lý điện được đưa vào một bộ phận riêng trong CPU gọi là PCU (Bộ phận Quản lý Điện năng – Power Control Unit ) Nó có vai trò như một bộ xử lý thô sơ bên trong

một bộ xử lý

Bộ xử lý Mini này hỗ trợ một quy trình quản lý phức tạp hơn nhiều so với các bộ xử lý khác của Intel: xung nhịp và điện áp của mỗi nhân được điều khiển riêng biệt dựa trên thông tin về nhiệt độ và lượng điện tiêu thụ Do đó mỗi nhân có thể chuyển riêng sang mức tiêu thụ điện thấp Mạch điều khiển bộ nhớ và Bus QPI sẽ chuyển sang chế độ điện năng thấp khi tất cả các nhân đều nghỉ

Trang 22

4.6 : Công Nghệ Intel® Turbo Boost

- Turbo Boost là công nghệ nâng hiệu suất máy tính lên thêm 20%, giúp hệ thống hoạt động nhanh hơn

và kéo dài thời lượng pin, bằng cách

tự động điều chỉnh xung nhịp của từng nhân độc lập cho phù hợp với nhu cầu xử lý

4.7 : Công nghệ Enhanced Intel SpeedStep (EIST)

- Công nghệ Enhanced Intel SpeedStep cho phép hệ thống tự động điều chỉnh xử lý điện áp và tần số lõi, có thể dẫn đến tiêu thụ giảm công suất trung bình và giảm sản xuất nhiệt trung bình

-Ngoài EIST được phát triển trước đó thì hiện nay Intel còn có công nghệ Enhanced Halt State (C1E) Về mặt lợi ích thì hai cái này đều giống nhau là nhằm giảm tải điện năng cho CPU, giảm độ ồn cho hệ thống

Trang 23

2.8: Công nghệ ảo hóa (virtualization technology)

- Những con chip mới cũng có hiệu suất cao nhất trong công nghệ ảo hóa khi cải thiện đến 25% tốc độ những ứng dụng trên máy ảo

Công nghệ ảo hóa giúp máy chủ chạy đồng thời nhiều môi trường hệ điều hành trên một

bộ xử lý duy nhất, cho phép chia một chiếc máy tính thành nhiều máy tính “ảo”

- Ưu điểm của ảo hóa là : trên 1 máy thật ảo hóa nhiều "máy ảo" nó thuận tiện , tận dụng tài nguyên tối ưu hơn so với dùng nhiều máy thật

Trang 24

Thanks for your listening

Tiêu đề	Tìm hiểu kiến trúc dòng vi xử lý Intel Xeon 6000
Trường học	Trường Đại Học Công Nghệ Thông Tin
Chuyên ngành	Công Nghệ Thông Tin
Thể loại	Báo cáo

Định dạng
Số trang	24
Dung lượng	645,8 KB