1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tìm Hiểu Kiến trúc vi xử lý tiên tiến NAHELEM

52 466 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 52
Dung lượng 4,18 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Các cải tiến và công nghệ tiên tiến sử dụng trong Nehalem • Công nghệ 45nm • Hệ thống cache cải tiến • Bộ nhớ ram DDR3 • Công nghệ Intel QuickPath • Công nghệ Siêu phân luồng Hyper Thear

Trang 1

Giáo viên hướng dẫn:

GV Võ Thanh Tú

Trang 2

Kiến trúc NEHALEM

 I Sơ lược kiến trúc Nehalem

 II Các cải tiến và công nghệ tiên tiến sử dụng trong Nehalem

• Công nghệ 45nm

• Hệ thống cache cải tiến

• Bộ nhớ ram DDR3

• Công nghệ Intel QuickPath

• Công nghệ Siêu phân luồng (Hyper Thearding)

• Công nghệ Turbo Boost

• Công nghệ Extended Page Tables (EPT)

• Một số cải tiến khác

Trang 3

 III Một số VXL dựa trên kiến trúc Nehalem

trúc Core

Trang 5

Đặc trưng công nghệ

Trang 6

Hệ thống Cache

. Hệ thống bộ nhớ đệm (cache) chính là một trong những thay đổi mạnh mẽ nhất trong kiến trúc Nehalem so với kiến trúc “tiền bối” Core

Trang 7

Hệ thống cache

Trang 8

Hệ thống cache

. Bộ nhớ đệm L3 trong các BXL nền Nehalem hoạt động với tần số độc lập và có hệ thống cấp nguồn riêng biệt với các nhân để đảm bảo độ ổn định và giảm xác suất lỗi

Cache L3 lưu lại bản sao của Cache L1,L2 giúp tối ưu hoá việc trao đổi dữ liệu giữa các nhân mà không cần thông qua các cache bên trong của mỗi nhân

Mỗi dòng lệnh trong cache L3 chứa 4 bit đánh dấu,đánh dấu nhân nào có chứa bản sao của dòng lệnh đó trong

những cache riêng của mình =>

Trang 9

Bộ nhớ Ram DDR3Một số thông số quan trọng của Ram

Tần số :là tốc độ của xung nhịp thanh nhớ Tần số càng cao , thanh nhớ càng nhanh và có thể truyền được nhiều dữ liệu

Timing (Độ trễ) Là thời gian bộ nhớ trì hoãn cung cấp dữ liệu lại với những yêu cầu của CPU Độ trễ càng cao thì hiệu suất làm việc của CPU càng thấp.

Khi nói đến thanh nhớ , thông thường những Timing của nó có thể định dạng kiểu như 2-2-2-5 1T Dãy số này là xếp theo thứ tự CAS-tRCD-tRP- tRAS và tRC của những thanh nhớ

( Dữ liệu được lưu trữ trong những ô nhớ sắp xếp theo hàng và cột )

+ CAS Latency

+tRCD ( RAS-to-CAS Delay)

+tRP (Row Precharge Time )

+tRAS (Row Active Time

+tRC ( Row Cycle Time)

Trang 10

Bộ nhớ Ram DDR3

DDR3 SDRAM (Synchronous Dynamic Random Access

Memory)

Là một cải tiến của thế hệ trước nó DDR2 SDRAM .

• Khả năng chuyển dữ liệu gấp đôi DDR2

• Tiêu chuẩn DDR3 cho phép sử dụng chíp có hiệu năng từ 512 megabits tới 8 gigabits và dung lượng Modul tối đa lên tới 16 gigabyte

• DDR3 có điện năng tiêu thụ giảm 30% so với DDR2

 Nehalem chỉ hỗ trợ bộ nhớ DDR3 và với thiết kế tích hợp khối điều khiển bộ nhớ vào CPU.

Trang 11

Bộ nhớ Ram DDR3

Trang 12

Bộ nhớ Ram DDR3

Mặc dù DDR3 có đến 8 bit truyền dữ liệu (gấp đôi DDR2)

Trang 13

Công nghệ Intel QuickPath

QuickPath.

nhớ vào CPU và cải thiện việc liên lạc giữa các thành phần của hệ thống

Cấu trúc dùng trong những CPU

Intel

hiện thời

Cấu trúc dùng trong những CPU Intel

mà tích hợp Bộ phận điều khiển bộ nhớ

Trang 14

Bộ điều khiển bộ nhớ tích hợp

Bộ phận điều khiển bộ nhớ tích hợp trong những bộ vi xử lí

Nehalem có thể thiết lập theo cấu hình Triple-Channel , có nghĩa

là nó có khả năng truy cập ba thanh nhớ cùng một lúc , nhờ vậy

đã giải quyết được độ trễ của DDR3.

Điều này cho phép cải thiện hiệu suất làm việc trong toàn bộ hệ

thống

Theo lí thuyết cấu trúc Triple-Channel cung cấp băng thông tăng thêm 50% so với cấu trúc Dual-Channel trước kia với cùng một tốc độ xung nhịp

Trang 15

Intel QuickPath

QPI cung cấp hai đường truyền ( Lane ) riêng biệt để trao đổi thông tin giữa CPU với Chipset Điều này cho phép CPU truyền ( Ghi – Write ) và nhận ( Đọc – Read ) dữ liệu I/O cùng một lúc

QPI cung cấp đường dữ liệu Vào / Ra riêng biệt Việc mở rộng tuyến bus nói trên đã góp phần làm tăng số lượng chân (pin) giao tiếp trên BXL Do đó, việc sử dụng socket LGA775 với 775 chân không còn phù hợp Vì vậy, trên các bo mạch chủ hỗ trợ các BXL nền Nehalem đều được trang bị socket LGA1366 (1366 chân).

Trang 16

Công nghệ 45nm của Intel

 Chíp VXL mới của Intel được

cỗng kim loại sử dụng hafnium

100% không chì và halogen giúp

bộ VXL tiết kiệm điện năng cao

hơn và tốt hơn cho môi trường.

Trang 17

Công nghệ xử lý cổng kim loại 45nm

High-k

 Tiến trình xử lý 45nm thu nhỏ kích

thướt nhân , tạo ra VXL có hiệu năng

cao,giảm điện thế hoặt động của VXL

do đó toả nhiệt ít hơn cho phép nâng

cao xung nhịp.

 Vât liệu sản xuất bóng bán dẫn là

Oxit Silic được thay thế bằng đóng

gói kim loại làm từ polysilicon

(NMOS + PMOS) và chất điện môi

High-k dựa trên chất Hafnium

 Tăng gấp đôi mật độ bóng bán dẫn

trên die, tăng tốc độ đảo mạch lên

20% , giảm điện năng cần hoặt động

là 30%.

 Việc sử dụng nguyên liệu cho phép

giảm bớt thất thoát điện năng ở nguồn

5 lần và cổng dioxit là 10 lần

 Sử dụng liên kết đồng , đĩa bán dẫn

300mm , kỹ thuật in 192nm.

Trang 18

Ưu điểm công nghệ 45nm

 Bộ vi xử lý dựa trên nền tảng công nghệ “high-k metal gate” với hiệu năng tăng 20%, giá thàh hạ ,tiêu thụ ít năng lượng.

 Đây là một bước đột phá mang lại hiệu suất tiết kiệm năng lượng cao giúp kéo dài thời gian sử dụng pin.

 Kỹ thuật này cho phép nhà sản xuất thu nhỏ hơn nữa vòng mạch trên con

chip VXL.Mạch trên con chíp có độ dày bằng 1/3 so với mạch của chíp có trên thị trường.

 Kỹ thuật cho phép Intel tích hợp nhiều chíp hơn trên một miếng silicon qua đó tăng năng suất sản xuất.

Trang 19

Các dòng VXL mới của Intel trên nền công

nghệ 45nm.

Trang 21

Công nghệ siêu phân luồng

 Công nghệ siêu phân luồng là công nghệ cho phép giả lập thêm 1 CPU luận lý trong cùng 1 CPU vật

lý, giúp cho CPU có thể xử lý được nhiều ứng

dụng hơn.

 Với sự hổ trợ công nghệ siêu phân luồng, CPU sẽ chia ra làm hai luồng để sử lý các công việc trong cùng một tác vụ, thay vì phải sắp xếp hàng chờ đợi

để được xử lý.

Trang 22

Với bộ xử lý đa luồng Có thể thực hiện song song

2 luồng xử lý, tận dụng tối đa tài nguyên hệ thống và

Trang 23

• Với bộ xử lý đơn luồng, tại một thời điểm chỉ có một luồng xử lý được thực hiện

• Nếu có nhiều luồng cùng muốn thực hiện thì các luồng này thực hiện tuần tự, cái sau tiếp nối cái trước.

Trang 24

• Công nghệ này tương thích với các phần mềm ứng dụng và hệ điều hành sẵn có trên các máy chủ, nó cho phép hỗ trợ nhiều người dùng hơn và tăng khối

lượng công việc được xử lý trên một máy chủ

• Với các máy trạm cao cấp, công nghệ siêu phân luồng cũng sẽ tăng đáng kể tốc độ các phần mềm ứng dụng đòi hỏi năng lực tính toán cao, ví dụ như phần mềm thiết kế 3 chiều, xử lý ảnh hay video

Công nghệ siêu phân luồng (tt)

Trang 25

Công nghệ Turbo Boost

 Công nghệ Turbo Boost giúp nâng cao hiệu suất hoạt động cho phù hợp với nhu cầu và khối lượng công việc của người sử dụng máy tính

 Thông qua thiết bị kiểm soát điện năng và sử dụng các bóng bán dẫn “cổng điện năng” mới dựa trên công nghệ sản xuất 45 nanomet high-k công nghệ này sẽ tự động điều

chỉnh xung nhịp đồng hồ của một hay nhiều nhân xử lý

trong số 4 nhân xử lý độc lập nó làm tăng cường hiệu suất hoạt động

 Một nhân có thể đẩy hiệu năng của mình lên bằng cách

ép xung

 Các nhân có thể tận dụng năng lượng thừa của các nhân không sử dụng, đây là giải pháp tiết kiệm điện năng

Trang 26

Ví dụ Core i7-965 với bộ vi xử lý tần

số mặc định 3.2GHz

Trang 27

Công nghệ Extended Page Tables

(EPT)

dung lượng lớn để chuyển đổi địa chỉ ảo của các máy ảo sang địa chỉ vật lý của hệ thống

(Address Space ID),nhờ cách thiết kế này, việc chuyển đổi giữa các máy ảo không cần thiết phải xóa đi các entry trong TLB

máy ảo trở nên dễ dàng và nhanh chóng hơn, tăng hiệu năng hoạt

động của các hệ thống máy ảo.

Trang 28

Công nghệ siêu phân luồng(tt)

Trang 29

M ột số bộ vi xử lý sử dụng công

nghệ Nehalem

Trang 30

 Core i5 trước đây có tên mã là Lynnfield, được phát triển trên nền vi kiến trúc Nehalem của Intel, phục vụ nhu cầu hiệu suất hoạt động cao như ứng dụng đa phương tiện, nội dung số,

game…

 Core i5-750

Trang 31

 Với công nghệ Turbo Boost có thể nâng hiệu suất máy tính lên thêm 20%, giúp hệ thống hoạt động

nhanh hơn bằng cách tự động điều chỉnh xung nhịp của từng nhân độc lập cho phù hợp với nhu cầu xử lý

 Tuy nhiên Intel đã không đưa công nghệ Hyper

Threading, khiến cho Core i5-750 chỉ có đúng 4 core

4 thread

 Cấu trúc lõi tứ tăng hiệu năng đa nhiệm đến 28%, có thể làm nhiều việc khác cùng một lúc

Trang 32

Core i7

 Vi xử lý core i7 có những cải tiến

so với core i5: công nghệ tăng tốc Turbo Boost có thể đẩy xung nhịp của CPU lên thêm 75%; đồng thời đạt được hiệu suất hoạt động cao hơn trên các ứng dụng đa luồng

với sức mạnh của công nghệ siêu phân luồng Hyper-Threading

Trang 34

 Cải tiến nổi trội nhất của 2 bộ vi xử lý core i5 và core i7 tăng khả năng tính toán song song so với các sản phẩm đi trước (khoảng 33% hiệu suất).

 Core i7 và i5 tích hợp cả một cổng đồ họa 16 làn PCI Express 2 lẫn hệ thống điều khiển bộ nhớ 2 kênh, cho phép tất cả các dữ liệu vào/ra và các chức năng điều khiển được xử lý bằng một chipset Intel P55 Express duy nhất

 Chipset này hỗ trợ 8 cổng PCI Express 2.0 x1 mang lại khả năng hỗ trợ linh hoạt cho các thiết bị

Trang 35

 Tất cả các chip nói trên đều không sử dụng chì và

halogen, được tích hợp công nghệ Turbo Boost, vi xử

lý Core i7 hỗ trợ công nghệ siêu phân luồng Intel

Hyper-Threading Kết hợp lại, những tính năng trên mang đến cho người sử dụng máy tính một hiệu suất hoạt động “thông minh” khi cần thiết và mức độ tiêu thụ điện năng tối ưu khi máy tính hoạt động không hết công suất với những ứng dụng nhẹ nhàng

Trang 37

 Trong Core, bộ nhớ đệm (cache) cao nhất mà một BXL có

là dung lượng cache L2 được đem chia sẻ giữa hai nhân.

Bộ nhớ Cache

Trang 39

Bộ nhớ Cache(tt)

động với tần số độc lập và có hệ thống cấp nguồn riêng biệt với các nhân để đảm bảo độ ổn định và giảm xác suất lỗi

quả hơn mà không cần thông qua các cache bên trong của mỗi nhân

hiệu quả của tính toán song song

Trang 40

Bộ phận điều khiển bộ nhớ tích hợp

 Ngay từ khi bắt đầu những CPU của Intel sử dụng Bus ngoài

có tên gọi FSB ( Front Side Bus ) để chia xẻ việc truyền thông tin giữa Bộ nhớ và những yêu cầu I/O

 Những bộ vi xử lí mới dựa trên lõi Nehalem sẽ tích hợp Bộ

phận điều khiển bộ nhớ bên trong và như vậy sẽ cung cấp hai Bus ngoài : Bus bộ nhớ để nối CPU tới bộ nhớ và Bus I/O để nối CPU với thiết bị bên ngoài

 Việc thay đổi này sẽ nâng cao hiệu suất làm việc của hệ thống

vì hai lí do :

bộ nhớ

kì những linh kiện bên ngoài CPU

Trang 41

Cấu trúc dùng với những

CPU Intel hiện tại

Cấu trúc được dùng với những CPU mà có tích hợp Bộ phận điều khiển bộ nhớ

Bộ phận điều khiển bộ nhớ tích

Trang 42

Cải tiến quản lý công suất

gia tăng dòng điện rò khi thu nhỏ kích thước công nghệ sản xuất BXL.

transitor theo công nghệ Clock Gates sử dụng trên hầu hết các BXL Intel hiện nay bằng thiết kế mới theo công nghệ

Power Gates giúp loại bỏ dòng điện rò trên những nhân đang

“nghỉ” để đưa điện áp trên các nhân ấy về mức gần như bằng

0

Nehalem có Bộ phận điều khiển năng lượng PCU ( Power

phận này làm giảm lượng điện rò và cũng cho phép “Turbo Mode” mới

Trang 43

Cải tiến quản lý công suất(tt)

 Những CPU trước kia của Intel , tất cả lõi

phải chạy cùng một tốc độ xung nhịp nhưng trong Nehalem mõi lõi có thể được lập trình

để chạy những tốc độ xung nhịp khác nhau để tiết kiệm năng lượng

 Vì tích hợp PCU nên bây giờ nó có thể tắt bất

kì lõi nào bên trong CPU , đó là một đặc điểm

mà những CPU Core 2 không làm được

Trang 44

Xử lý dòng lệnh

phát hiện dòng lặp (Loop Stream Detector) về cơ bản nó

là bộ nhớ Cache chứa 18 lệnh nằm ở giữa Bộ phận Lấy

dữ liệu ( Fetch ) và Bộ phận Giải mã ( Decode ) từ CPU.

lệnh trong vòng lặp từ bộ đệm L1 mà lấy trực tiếp từ bộ phát hiện dòng lặp Do đó, BXL sẽ tắt tạm thời hai thành phần đưa lệnh và dự đoán rẽ nhánh, giúp BXL tiết kiệm điện năng.

đôi chút với việc đưa bộ phát hiện dòng lặp ra sau bộ giải mã.

Trang 45

Xử lý dòng lệnh(tt)

Vị trí của LSD trong những CPU Core và Nehalem

Trang 46

 Vi cấu trúc Nehalem cũng thêm hai bộ đệm phụ : TLB

suất làm việc của CPU tăng lên

mà CPU mô phỏng nhiều bộ nhớ RAM thành những File nằm trên ổ cứng (Swap File ) để cho phép máy tính tiếp tục hoạt

động ngay cả khi không có đủ bộ nhớ RAM

hướng tiến về phía trước , tải vào bên trong CPU những lệnh

mà nó nghĩ rằng CPU sẽ tải theo bước tiếp theo

Trang 47

Cải thiện hiệu suất xử lý dòng lệnh

bên trong BXL

 Trong vi kiến trúc Core, Intel đã giới thiệu một tính năng mới là Macro Fusion có khả năng dịch hai lệnh x86 vào thành

một vi lệnh để thực thi trong BXL Điều này giúp cải thiện đáng

kể hiệu suất hoạt động của BXL cũng như giảm bớt điện năng

tiêu thụ.

 Vi cấu trúc Nehalem cái tiến Macro-Fusion bằng hai cách :

 Thêm sự hỗ trợ một số lệnh rẽ nhánh (những CPU Core 2 trước kia không làm được ).

 Những lệnh Macro-Fusion trong CPU dựa vào Nehalem được dùng cả hai kiểu 32-bit và 64-bit Trong khi đó Macro-Fusion dùng trong CPU Core 2 chỉ làm việc khi CPU sử dụng Mode 32-bit.

.

Trang 48

Công nghệ siêu phân luồng (Hyper

Threading)

phân luồng” (Hyper-Threading ) Nếu so với các BXL Intel Pentium thì thiết kế của vi kiến trúc Nehalem

đem lại lợi thế hơn cho công nghệ siêu phân luồng khi

có băng thông bộ nhớ và dung lượng cache lớn hơn, vì thế dữ liệu được cung cấp cho các nhân rất nhanh và

dễ dàng để chia vào hai luồng xử lý trên mỗi nhân

Trang 49

 Trong các bộ xử ly Core,sử dụng phần mềm.

phần mềm hay trình điều khiển thiết bị trên hệ thống đang chạy.

(Intel Virtualization Technology for Directed

I/O) cho phép người dùng gán trực tiếp thiết bị vật lý trong hệ thống (thay vì phải giả lập).

Công nghệ ảo hóa(giả lập các thiết bị ngoại vi cho các máy ảo)

Trang 50

Tập lệnh SSE 4.2 mới với

07 lệnh mới

một tập lệnh con SSE4.2 với 7 lệnh gồm CRC32 (dùng cho việc tính toán thông số checksum

dùng trong lưu trữ hay mạng), PCMPESTRI,

PCMPESTRM, PCMPISTRI và PCMPISTRM (dùng so sánh chuỗi), PCMPCTQ (so sánh dữ

liệu), và POPCNT (thao tác trên bit dữ liệu để đếm số lượng bit được gán lên 1)

Trang 51

Một số tài liệu tham khảo

 Giáo trình Kỹ thuật VXL - Võ Thanh Tú

Trang 52

Cảm ơn Thầy và các bạn đã lắng nghe

Ngày đăng: 11/04/2015, 13:59

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w