Các cải tiến và công nghệ tiên tiến sử dụng trong Nehalem • Công nghệ 45nm • Hệ thống cache cải tiến • Bộ nhớ ram DDR3 • Công nghệ Intel QuickPath • Công nghệ Siêu phân luồng Hyper Thear
Trang 1Giáo viên hướng dẫn:
GV Võ Thanh Tú
Trang 2Kiến trúc NEHALEM
I Sơ lược kiến trúc Nehalem
II Các cải tiến và công nghệ tiên tiến sử dụng trong Nehalem
• Công nghệ 45nm
• Hệ thống cache cải tiến
• Bộ nhớ ram DDR3
• Công nghệ Intel QuickPath
• Công nghệ Siêu phân luồng (Hyper Thearding)
• Công nghệ Turbo Boost
• Công nghệ Extended Page Tables (EPT)
• Một số cải tiến khác
Trang 3 III Một số VXL dựa trên kiến trúc Nehalem
trúc Core
Trang 5Đặc trưng công nghệ
Trang 6Hệ thống Cache
. Hệ thống bộ nhớ đệm (cache) chính là một trong những thay đổi mạnh mẽ nhất trong kiến trúc Nehalem so với kiến trúc “tiền bối” Core
Trang 7Hệ thống cache
Trang 8Hệ thống cache
. Bộ nhớ đệm L3 trong các BXL nền Nehalem hoạt động với tần số độc lập và có hệ thống cấp nguồn riêng biệt với các nhân để đảm bảo độ ổn định và giảm xác suất lỗi
Cache L3 lưu lại bản sao của Cache L1,L2 giúp tối ưu hoá việc trao đổi dữ liệu giữa các nhân mà không cần thông qua các cache bên trong của mỗi nhân
Mỗi dòng lệnh trong cache L3 chứa 4 bit đánh dấu,đánh dấu nhân nào có chứa bản sao của dòng lệnh đó trong
những cache riêng của mình =>
Trang 9Bộ nhớ Ram DDR3Một số thông số quan trọng của Ram
Tần số :là tốc độ của xung nhịp thanh nhớ Tần số càng cao , thanh nhớ càng nhanh và có thể truyền được nhiều dữ liệu
Timing (Độ trễ) Là thời gian bộ nhớ trì hoãn cung cấp dữ liệu lại với những yêu cầu của CPU Độ trễ càng cao thì hiệu suất làm việc của CPU càng thấp.
Khi nói đến thanh nhớ , thông thường những Timing của nó có thể định dạng kiểu như 2-2-2-5 1T Dãy số này là xếp theo thứ tự CAS-tRCD-tRP- tRAS và tRC của những thanh nhớ
( Dữ liệu được lưu trữ trong những ô nhớ sắp xếp theo hàng và cột )
+ CAS Latency
+tRCD ( RAS-to-CAS Delay)
+tRP (Row Precharge Time )
+tRAS (Row Active Time
+tRC ( Row Cycle Time)
Trang 10Bộ nhớ Ram DDR3
DDR3 SDRAM (Synchronous Dynamic Random Access
Memory)
Là một cải tiến của thế hệ trước nó DDR2 SDRAM .
• Khả năng chuyển dữ liệu gấp đôi DDR2
• Tiêu chuẩn DDR3 cho phép sử dụng chíp có hiệu năng từ 512 megabits tới 8 gigabits và dung lượng Modul tối đa lên tới 16 gigabyte
• DDR3 có điện năng tiêu thụ giảm 30% so với DDR2
Nehalem chỉ hỗ trợ bộ nhớ DDR3 và với thiết kế tích hợp khối điều khiển bộ nhớ vào CPU.
Trang 11Bộ nhớ Ram DDR3
Trang 12Bộ nhớ Ram DDR3
Mặc dù DDR3 có đến 8 bit truyền dữ liệu (gấp đôi DDR2)
Trang 13Công nghệ Intel QuickPath
QuickPath.
nhớ vào CPU và cải thiện việc liên lạc giữa các thành phần của hệ thống
Cấu trúc dùng trong những CPU
Intel
hiện thời
Cấu trúc dùng trong những CPU Intel
mà tích hợp Bộ phận điều khiển bộ nhớ
Trang 14Bộ điều khiển bộ nhớ tích hợp
Bộ phận điều khiển bộ nhớ tích hợp trong những bộ vi xử lí
Nehalem có thể thiết lập theo cấu hình Triple-Channel , có nghĩa
là nó có khả năng truy cập ba thanh nhớ cùng một lúc , nhờ vậy
đã giải quyết được độ trễ của DDR3.
Điều này cho phép cải thiện hiệu suất làm việc trong toàn bộ hệ
thống
Theo lí thuyết cấu trúc Triple-Channel cung cấp băng thông tăng thêm 50% so với cấu trúc Dual-Channel trước kia với cùng một tốc độ xung nhịp
Trang 15Intel QuickPath
QPI cung cấp hai đường truyền ( Lane ) riêng biệt để trao đổi thông tin giữa CPU với Chipset Điều này cho phép CPU truyền ( Ghi – Write ) và nhận ( Đọc – Read ) dữ liệu I/O cùng một lúc
QPI cung cấp đường dữ liệu Vào / Ra riêng biệt Việc mở rộng tuyến bus nói trên đã góp phần làm tăng số lượng chân (pin) giao tiếp trên BXL Do đó, việc sử dụng socket LGA775 với 775 chân không còn phù hợp Vì vậy, trên các bo mạch chủ hỗ trợ các BXL nền Nehalem đều được trang bị socket LGA1366 (1366 chân).
Trang 16Công nghệ 45nm của Intel
Chíp VXL mới của Intel được
cỗng kim loại sử dụng hafnium
100% không chì và halogen giúp
bộ VXL tiết kiệm điện năng cao
hơn và tốt hơn cho môi trường.
Trang 17Công nghệ xử lý cổng kim loại 45nm
High-k
Tiến trình xử lý 45nm thu nhỏ kích
thướt nhân , tạo ra VXL có hiệu năng
cao,giảm điện thế hoặt động của VXL
do đó toả nhiệt ít hơn cho phép nâng
cao xung nhịp.
Vât liệu sản xuất bóng bán dẫn là
Oxit Silic được thay thế bằng đóng
gói kim loại làm từ polysilicon
(NMOS + PMOS) và chất điện môi
High-k dựa trên chất Hafnium
Tăng gấp đôi mật độ bóng bán dẫn
trên die, tăng tốc độ đảo mạch lên
20% , giảm điện năng cần hoặt động
là 30%.
Việc sử dụng nguyên liệu cho phép
giảm bớt thất thoát điện năng ở nguồn
5 lần và cổng dioxit là 10 lần
Sử dụng liên kết đồng , đĩa bán dẫn
300mm , kỹ thuật in 192nm.
Trang 18Ưu điểm công nghệ 45nm
Bộ vi xử lý dựa trên nền tảng công nghệ “high-k metal gate” với hiệu năng tăng 20%, giá thàh hạ ,tiêu thụ ít năng lượng.
Đây là một bước đột phá mang lại hiệu suất tiết kiệm năng lượng cao giúp kéo dài thời gian sử dụng pin.
Kỹ thuật này cho phép nhà sản xuất thu nhỏ hơn nữa vòng mạch trên con
chip VXL.Mạch trên con chíp có độ dày bằng 1/3 so với mạch của chíp có trên thị trường.
Kỹ thuật cho phép Intel tích hợp nhiều chíp hơn trên một miếng silicon qua đó tăng năng suất sản xuất.
Trang 19Các dòng VXL mới của Intel trên nền công
nghệ 45nm.
Trang 21Công nghệ siêu phân luồng
Công nghệ siêu phân luồng là công nghệ cho phép giả lập thêm 1 CPU luận lý trong cùng 1 CPU vật
lý, giúp cho CPU có thể xử lý được nhiều ứng
dụng hơn.
Với sự hổ trợ công nghệ siêu phân luồng, CPU sẽ chia ra làm hai luồng để sử lý các công việc trong cùng một tác vụ, thay vì phải sắp xếp hàng chờ đợi
để được xử lý.
Trang 22Với bộ xử lý đa luồng Có thể thực hiện song song
2 luồng xử lý, tận dụng tối đa tài nguyên hệ thống và
Trang 23• Với bộ xử lý đơn luồng, tại một thời điểm chỉ có một luồng xử lý được thực hiện
• Nếu có nhiều luồng cùng muốn thực hiện thì các luồng này thực hiện tuần tự, cái sau tiếp nối cái trước.
Trang 24• Công nghệ này tương thích với các phần mềm ứng dụng và hệ điều hành sẵn có trên các máy chủ, nó cho phép hỗ trợ nhiều người dùng hơn và tăng khối
lượng công việc được xử lý trên một máy chủ
• Với các máy trạm cao cấp, công nghệ siêu phân luồng cũng sẽ tăng đáng kể tốc độ các phần mềm ứng dụng đòi hỏi năng lực tính toán cao, ví dụ như phần mềm thiết kế 3 chiều, xử lý ảnh hay video
Công nghệ siêu phân luồng (tt)
Trang 25Công nghệ Turbo Boost
Công nghệ Turbo Boost giúp nâng cao hiệu suất hoạt động cho phù hợp với nhu cầu và khối lượng công việc của người sử dụng máy tính
Thông qua thiết bị kiểm soát điện năng và sử dụng các bóng bán dẫn “cổng điện năng” mới dựa trên công nghệ sản xuất 45 nanomet high-k công nghệ này sẽ tự động điều
chỉnh xung nhịp đồng hồ của một hay nhiều nhân xử lý
trong số 4 nhân xử lý độc lập nó làm tăng cường hiệu suất hoạt động
Một nhân có thể đẩy hiệu năng của mình lên bằng cách
ép xung
Các nhân có thể tận dụng năng lượng thừa của các nhân không sử dụng, đây là giải pháp tiết kiệm điện năng
Trang 26Ví dụ Core i7-965 với bộ vi xử lý tần
số mặc định 3.2GHz
Trang 27Công nghệ Extended Page Tables
(EPT)
dung lượng lớn để chuyển đổi địa chỉ ảo của các máy ảo sang địa chỉ vật lý của hệ thống
(Address Space ID),nhờ cách thiết kế này, việc chuyển đổi giữa các máy ảo không cần thiết phải xóa đi các entry trong TLB
máy ảo trở nên dễ dàng và nhanh chóng hơn, tăng hiệu năng hoạt
động của các hệ thống máy ảo.
Trang 28Công nghệ siêu phân luồng(tt)
Trang 29M ột số bộ vi xử lý sử dụng công
nghệ Nehalem
Trang 30 Core i5 trước đây có tên mã là Lynnfield, được phát triển trên nền vi kiến trúc Nehalem của Intel, phục vụ nhu cầu hiệu suất hoạt động cao như ứng dụng đa phương tiện, nội dung số,
game…
Core i5-750
Trang 31 Với công nghệ Turbo Boost có thể nâng hiệu suất máy tính lên thêm 20%, giúp hệ thống hoạt động
nhanh hơn bằng cách tự động điều chỉnh xung nhịp của từng nhân độc lập cho phù hợp với nhu cầu xử lý
Tuy nhiên Intel đã không đưa công nghệ Hyper
Threading, khiến cho Core i5-750 chỉ có đúng 4 core
4 thread
Cấu trúc lõi tứ tăng hiệu năng đa nhiệm đến 28%, có thể làm nhiều việc khác cùng một lúc
Trang 32Core i7
Vi xử lý core i7 có những cải tiến
so với core i5: công nghệ tăng tốc Turbo Boost có thể đẩy xung nhịp của CPU lên thêm 75%; đồng thời đạt được hiệu suất hoạt động cao hơn trên các ứng dụng đa luồng
với sức mạnh của công nghệ siêu phân luồng Hyper-Threading
Trang 34 Cải tiến nổi trội nhất của 2 bộ vi xử lý core i5 và core i7 tăng khả năng tính toán song song so với các sản phẩm đi trước (khoảng 33% hiệu suất).
Core i7 và i5 tích hợp cả một cổng đồ họa 16 làn PCI Express 2 lẫn hệ thống điều khiển bộ nhớ 2 kênh, cho phép tất cả các dữ liệu vào/ra và các chức năng điều khiển được xử lý bằng một chipset Intel P55 Express duy nhất
Chipset này hỗ trợ 8 cổng PCI Express 2.0 x1 mang lại khả năng hỗ trợ linh hoạt cho các thiết bị
Trang 35 Tất cả các chip nói trên đều không sử dụng chì và
halogen, được tích hợp công nghệ Turbo Boost, vi xử
lý Core i7 hỗ trợ công nghệ siêu phân luồng Intel
Hyper-Threading Kết hợp lại, những tính năng trên mang đến cho người sử dụng máy tính một hiệu suất hoạt động “thông minh” khi cần thiết và mức độ tiêu thụ điện năng tối ưu khi máy tính hoạt động không hết công suất với những ứng dụng nhẹ nhàng
Trang 37 Trong Core, bộ nhớ đệm (cache) cao nhất mà một BXL có
là dung lượng cache L2 được đem chia sẻ giữa hai nhân.
Bộ nhớ Cache
Trang 39Bộ nhớ Cache(tt)
động với tần số độc lập và có hệ thống cấp nguồn riêng biệt với các nhân để đảm bảo độ ổn định và giảm xác suất lỗi
quả hơn mà không cần thông qua các cache bên trong của mỗi nhân
hiệu quả của tính toán song song
Trang 40Bộ phận điều khiển bộ nhớ tích hợp
Ngay từ khi bắt đầu những CPU của Intel sử dụng Bus ngoài
có tên gọi FSB ( Front Side Bus ) để chia xẻ việc truyền thông tin giữa Bộ nhớ và những yêu cầu I/O
Những bộ vi xử lí mới dựa trên lõi Nehalem sẽ tích hợp Bộ
phận điều khiển bộ nhớ bên trong và như vậy sẽ cung cấp hai Bus ngoài : Bus bộ nhớ để nối CPU tới bộ nhớ và Bus I/O để nối CPU với thiết bị bên ngoài
Việc thay đổi này sẽ nâng cao hiệu suất làm việc của hệ thống
vì hai lí do :
bộ nhớ
kì những linh kiện bên ngoài CPU
Trang 41Cấu trúc dùng với những
CPU Intel hiện tại
Cấu trúc được dùng với những CPU mà có tích hợp Bộ phận điều khiển bộ nhớ
Bộ phận điều khiển bộ nhớ tích
Trang 42Cải tiến quản lý công suất
gia tăng dòng điện rò khi thu nhỏ kích thước công nghệ sản xuất BXL.
transitor theo công nghệ Clock Gates sử dụng trên hầu hết các BXL Intel hiện nay bằng thiết kế mới theo công nghệ
Power Gates giúp loại bỏ dòng điện rò trên những nhân đang
“nghỉ” để đưa điện áp trên các nhân ấy về mức gần như bằng
0
Nehalem có Bộ phận điều khiển năng lượng PCU ( Power
phận này làm giảm lượng điện rò và cũng cho phép “Turbo Mode” mới
Trang 43Cải tiến quản lý công suất(tt)
Những CPU trước kia của Intel , tất cả lõi
phải chạy cùng một tốc độ xung nhịp nhưng trong Nehalem mõi lõi có thể được lập trình
để chạy những tốc độ xung nhịp khác nhau để tiết kiệm năng lượng
Vì tích hợp PCU nên bây giờ nó có thể tắt bất
kì lõi nào bên trong CPU , đó là một đặc điểm
mà những CPU Core 2 không làm được
Trang 44Xử lý dòng lệnh
phát hiện dòng lặp (Loop Stream Detector) về cơ bản nó
là bộ nhớ Cache chứa 18 lệnh nằm ở giữa Bộ phận Lấy
dữ liệu ( Fetch ) và Bộ phận Giải mã ( Decode ) từ CPU.
lệnh trong vòng lặp từ bộ đệm L1 mà lấy trực tiếp từ bộ phát hiện dòng lặp Do đó, BXL sẽ tắt tạm thời hai thành phần đưa lệnh và dự đoán rẽ nhánh, giúp BXL tiết kiệm điện năng.
đôi chút với việc đưa bộ phát hiện dòng lặp ra sau bộ giải mã.
Trang 45Xử lý dòng lệnh(tt)
Vị trí của LSD trong những CPU Core và Nehalem
Trang 46 Vi cấu trúc Nehalem cũng thêm hai bộ đệm phụ : TLB
suất làm việc của CPU tăng lên
mà CPU mô phỏng nhiều bộ nhớ RAM thành những File nằm trên ổ cứng (Swap File ) để cho phép máy tính tiếp tục hoạt
động ngay cả khi không có đủ bộ nhớ RAM
hướng tiến về phía trước , tải vào bên trong CPU những lệnh
mà nó nghĩ rằng CPU sẽ tải theo bước tiếp theo
Trang 47Cải thiện hiệu suất xử lý dòng lệnh
bên trong BXL
Trong vi kiến trúc Core, Intel đã giới thiệu một tính năng mới là Macro Fusion có khả năng dịch hai lệnh x86 vào thành
một vi lệnh để thực thi trong BXL Điều này giúp cải thiện đáng
kể hiệu suất hoạt động của BXL cũng như giảm bớt điện năng
tiêu thụ.
Vi cấu trúc Nehalem cái tiến Macro-Fusion bằng hai cách :
Thêm sự hỗ trợ một số lệnh rẽ nhánh (những CPU Core 2 trước kia không làm được ).
Những lệnh Macro-Fusion trong CPU dựa vào Nehalem được dùng cả hai kiểu 32-bit và 64-bit Trong khi đó Macro-Fusion dùng trong CPU Core 2 chỉ làm việc khi CPU sử dụng Mode 32-bit.
.
Trang 48Công nghệ siêu phân luồng (Hyper
Threading)
phân luồng” (Hyper-Threading ) Nếu so với các BXL Intel Pentium thì thiết kế của vi kiến trúc Nehalem
đem lại lợi thế hơn cho công nghệ siêu phân luồng khi
có băng thông bộ nhớ và dung lượng cache lớn hơn, vì thế dữ liệu được cung cấp cho các nhân rất nhanh và
dễ dàng để chia vào hai luồng xử lý trên mỗi nhân
Trang 49 Trong các bộ xử ly Core,sử dụng phần mềm.
phần mềm hay trình điều khiển thiết bị trên hệ thống đang chạy.
(Intel Virtualization Technology for Directed
I/O) cho phép người dùng gán trực tiếp thiết bị vật lý trong hệ thống (thay vì phải giả lập).
Công nghệ ảo hóa(giả lập các thiết bị ngoại vi cho các máy ảo)
Trang 50Tập lệnh SSE 4.2 mới với
07 lệnh mới
một tập lệnh con SSE4.2 với 7 lệnh gồm CRC32 (dùng cho việc tính toán thông số checksum
dùng trong lưu trữ hay mạng), PCMPESTRI,
PCMPESTRM, PCMPISTRI và PCMPISTRM (dùng so sánh chuỗi), PCMPCTQ (so sánh dữ
liệu), và POPCNT (thao tác trên bit dữ liệu để đếm số lượng bit được gán lên 1)
Trang 51Một số tài liệu tham khảo
Giáo trình Kỹ thuật VXL - Võ Thanh Tú
Trang 52Cảm ơn Thầy và các bạn đã lắng nghe