Tìm hiểu kiến trúc vi xử lý CORE i5 i7 ivy bridge
Trang 1MÔN : KĨ THUẬT VI XỬ LÝ
GIẢNG VIÊN:HOÀNG XUÂN DẬU
Trang 3I.GIỚI THIỆU VỀ VXL CORE I5/I7 Ivy Bridge
II TỔNG QUAN VỀ KIẾN TRÚC
III SƠ ĐỒ KHỐI & TẬP LỆNH.
V.KẾT LUẬN.
IV.CÔNG NGHỆ MỚI VÀ TÍNH NĂNG NỔI BẬT
Trang 4Đội hình Ivy Bridge ban đầu gồm 13 bộ xử lý bốn nhân cho máy tính xách tay, máy tính để bàn cao cấp
và máy tính tất-cả-trong-một (AIO).
Ivy Bridge là kiến trúc xử lý rơi vào giai đoạn “ Tick " theo ngôn ngữ của Intel, tức nó là một sự nâng cấp
so với Sandy Bridge chứ không phải sử dụng kiến trúc xử lý thế hệ mới
Ivy Bridge được sản xuất trên công nghệ 22nm tiên tiến hơn hẳn các sản phẩm trước đó
Bên cạnh đó, IVB cũng sử dụng bóng bán dẫn Gate và tương thích với socket sử dụng trên SNB, điều này đồng nghĩa người dùng sẽ không cần tới một
Tri-bo mạch chủ hoàn toàn mới - mà đơn giản chỉ là nâng
cấp BIOS
Trang 71 : Kiến trúc chíp :
Giống như Sandy Bridge, Ivy Bridge có tối đa 4 lõi xử lý, được hợp nhất với một con chip
xử lý đồ hoạ, bộ nhớ 8 MB L3 cache, và tích hợp các hệ thống kết nối khác (ví dụ như
các cổng kết nối màn hình, DMI, các thiết bị vào ra I/O) Vòng bus 256-bit có nhiệm vụ kết
nối tất cả các thành phần với nhau
Trang 8Tổng quan về các thông số kỹ thuật quan trọng nhất:
• Xử lý Tri-Gate 22-nanometer
• 1,4 tỷ bóng bán dẫn
• Mật độ 160 mm2
• 32 + 32 KB L1 cache cho xử lý dữ liệu và kết nối (mỗi lõi)
• 256 Kbyte L2 cache (mỗi lõi)
• 8 MB L3 cache (sử dụng cho các lõi và GPU)
• Bộ xử lý đồ hoạ Intel HD 4000 (GT2, DirectX 11, 16 EUs)
• DDR3 (L) điều khiển bộ nhớ lên đến 800 MHz (PC3-12800)
• PCIe 3.0 với 16 luồng dữ liệu
• Hỗ trợ MMX, SSE, (1, 2, 3, 3S, 4.1, 4.2), AVX, AES-NI
• Điện năng tiêu thụ 35, 45 hoặc 55 watt.
Trang 92: Bộ Vi Xử Lý
Bộ vi xử lý của Ivy Bridge về cơ bản dựa trên người tiền nhiệm Sandy Bridge, do đó nó bao gồm các
tính năng đã được biết đến như Hyper Threading và Turbo Boost 2.0
Tiến trình mới cho phép tăng chỉ 4-6% năng lực xử lý khi xét trên 2 CPU Ivy và Sandy cùng xung
nhịp và cùng dòng sản phẩm (clock to clock) Thật sự thì mức tăng này là rất nhỏ nhưng Intel cũng
phải thực hiện rất khá nhiều thay đổi trong kiến trúc để đạt con số đó Hơn nữa, do Ivy có xung nhịp
cao hơn mà hiệu năng tổng thể của CPU tăng lên khoảng 10%
Một thay đổi đáng giá khác liên quan đến đơn vị phân chia (có tác dụng làm tăng thông lượng), các
tập lệnh AVX và SSE được tăng cường nhờ việc bổ xung 6 thanh ghi chia và tải dữ liệu Intel cũng
đã sửa đổi các dữ liệu trong bộ nhớ cache được điều chỉnh tự động và ưu tiên cho các ứng dụng
cần băng thông lớn, khai thác bộ nhớ cache hiệu quả hơn, đặc biệt là trong các nhiệm vụ đa luồng
Trang 10Lần đầu tiên, Intel sử dụng thuật toán điền số ngẫu nhiên (Digital Random Number Generator,
DRNG) cho phép tăng cường hiệu suất tính toán và xử lý các thuật toán mã hoá lên tới 2-3Gbit/s
Trang 114 Bộ Xử Lý Đồ Hoạ
Có rất nhiều sự thay đổi thú vị cho GPU ở Ivy Bridge, điều mà có lẽ là lý do quan trọng nhất để Intel
trao tặng dạnh hiệu “Tick +” cho Ivy Bridge
Một trong những sáng kiến quan trọng nhất là có thể nhìn thấy đó là việc hỗ trợ DirectX 11, Shader
Model 5.0 (Sandy Bridge: DirectX 10.1 / SM 4.1), bên cạnh đó là việc hỗ trợ OpenGL 3.1 và OpenCL 1,1 Trước kia, chip đồ họa của Intel thường chậm hơn 1 thế hệ so với CPU (CPU tiến trình 32nm thì GPU mới chỉ 45nm) Sandy Bridge đã hợp nhất 2 con chip này trên một đế, chế tạo chung ở tiến trình 32nm và giờ đây Ivy Bridge tiếp tục làm điều đó ở tiến trình 22nm, Tuy vậy, có vẻ như lần này Intel
cũng quyết tâm đầu tư khá nhiều vào GPU, nâng số EU (execution units) từ 12 lên 16 để nâng cao
hiệu năng xử lý Do vậy, có thể kích thước đế Ivy cũng sẽ không thay đổi nhiều vì CPU nhỏ hơn như GPU lại to hơn Với 16 EU, Ivy đã có thể hỗ trợ 3 màn hình thay vì chỉ tối đa 2 màn hình như trước
đây, và độ phân giải tối đa hỗ trợ lên tới 4K
Trang 123D là những gì mà Ivy chứng tỏ chúng mạnh mẽ hơn Sandy Intel chia chip đồ họa trên Ivy thành 2 phiên bản khác nhau, 1 phiên bản GT2 chứa 16EU trong khi GT1 có thể chỉ là 8EU Năm ngoái, con số này trên Sandy là 12 và 6 EU Ngoài ra, phiên bản GT2 cũng đồng thời hỗ trợ 2 bộ lấy mẫu còn GT1 chỉ có 1
Nâng cao sức mạnh cũng chẳng để làm gì nếu không hỗ trợ các thư viện đồ họa như DirectX hay
OpenGL, CL
Nói gì thì nói, chúng ta cần 1 con số để biết Ivy mạnh hơn Sandy thế nào Mỗi 1 EU trên Ivy mạnh gần
gấp đôi 1 EU trên Sandy, tức là năng lực xử lý GFLOPS sẽ tăng gần gấp đôi trên mỗi EU Tính trung bình thì GPU của Ivy mạnh hơn Sandy khoảng 60% xét về tổng thể, một số thử nghiệm đổ bóng kết hợp của CPU và GPU thì nó còn mạnh hơn khoảng 32 lần!
Trang 135 : Công Suất Tiêu Thụ
Nếu muốn tìm 1 con chip tiết kiệm điện thì Ivy Bridge chính là dòng chip mà bạn nên chờ đợi Như đã nói ở trên, cùng mức xung nhịp xử lý thì Ivy Bridge mạnh hơn Sandy khoảng 4-6% đồng thời chỉ sử
dụng khoảng 75-80% lượng năng lượng mà Sandy tiêu thụ Tuy vậy, đây vẫn chưa phải là phần thú vị nhất về khả năng tiêu thụ điện năng của Ivy, bên cạnh việc tối ưu hóa hơn các giải pháp đã xuất hiện trên Sandy như System Agent Voltages hay Power Aware Interrupt Routing, Intel đưa ra 1 giải pháp mới là TDP có thể cấu hình (Configurable TDP-cTDP)
Đây là một bước tiến mới của Intel nhằm giúp các nhà sản xuất giới thiệu nhiều giải pháp linh hoạt hơn cho khách hàng Tất cả các bộ xử lý hiện tại đều đòi hỏi phải sử dụng các hệ thống tản nhiệt khác
nhau để làm mát nó và người ta đo nó bằng TDP (thermal design point) Hệ thống nào có TDP cao
hơn thì sẽ đòi hỏi tản nhiệt tốt hơn, TDP thấp thì tỏa nhiệt ít hơn Trước đây, Intel đã tận dụng TDP
cao trong thời gian ngắn nhằm kích hoạt tính năng Turbo Boost nhưng hiện tại thì cTDP là một giải
pháp xuất sắc hơn nữa
Trang 141 SƠ ĐỒ KHỐI
Trang 15 Bộ nhớ Cache:
Cache L1 gồm: 32 kB dữ liệu + 32 kB hướng dẫn bộ nhớ
cache L1 (3 đồng hồ)
Cache L2: 256 kB L2 cache (8 đồng hồ) cho mỗi lõi
Cache L3 chia sẻ bao gồm bộ xử lý đồ họa (LGA 1155)
Pre decode : Trước khi giải mã
Intruction queue: dữ liệu được đưa vào hàng đợi
Decoder: Bộ giải mã lệnh
Giải mã vi hoạt động, bộ nhớ cache và dự đoán tối ưu dành cho
chi nhánh mở rộng
Trang 16Load buffers: Tải vào bộ đệm, phân bổ (allocate).
Store buffers: Cửa hàng bộ đệm
Reorder buffers: Sắp xếp lại bộ đệm
Khối store address và store data
Khối xử lý các chỉ lệnh hỏi dữ liệu để được ghi tại bộ nhớ RAM Khối này cũng
có tên gọi là AGU, Address Generator Unit Kiểu chỉ lệnh này sử dụng cả hai khối
Store Address và Store Data tại cùng một thời điểm
Register Files:
Register Files là một mảng các vi xử lý đăng ký trong CPU Việc tạo ra biến đổi
có thể là nguyên nhân làm cho khả năng ghi của RF (register files) suy yếu ở điện
áp thấp, kỹ thuật này làm suy yếu các cell bộ nhớ kéo lên độ mạnh có hiệu lực của
thiết bị nhằm giải quyết khả năng ghi ở điện áp thấp, khả năng vấn đề gây ra bởi
một thiết bị trong các cell bộ nhớ.
Cải thiên hiệu suất tính toán bằng các mã hóa AES (tập lệnh AES) và SHA kết
nối giữa các lõi , bộ nhớ Cache,đồ họa và các miền hệ thống bằng các vòng
bus(256 bit/vòng).
Trang 17 ALU (Khối logic số học - Arithmetic and Logic Unit) Các chỉ lệnh
thông thường này cũng được hiểu là các chỉ lệnh “integer”
Advanced Vector Extensions (AVX) 256-bit hướng dẫn thiết lập với
vectơ rộng hơn, cú pháp mở rộng mới và chức năng phong phú
Các hướng dẫn CPU bao gồm 256-bit mới AVX (Advance Vector
Extensions) hoạt động SIMD, theo bước chân của 80-bit MMX
(MultiMedia Phần mở rộng) và giá trị của nhiều thế hệ SSE 128-bit
(streaming SIMD Extensions)
System Agent chứa những mạch điều khiển giao diện ngoài như : PCI
Express, DMI, bộ nhớ và giao diện hiển thị System Agent tương tự như
những gì chúng ta thấy ở Uncore trong Nehalem nhưng không phải
hoàn toàn tương tự Nó không chứa Cache L3, là bộ phận chức năng duy
nhất làm việc cùng với tần số của bộ vi xử lí trong vi cấu trúc mới Và đặc
điểm phân biệt khác của System Agent là nó cũng dùng Ring Bus để trao
đổi dữ liệu với lõi x86 và lõi đồ họa cũng như với Cache L3.
Trang 18 Power Control Unit
Bên cạnh những mạch điều khiển giao diện ngoài, phần quan trọng khác trong System Agent của Sandy bridge đó là PCU( Power Control Unit ) PCU là một siêu điều khiển có khả năng lập trình, thu thập thông tin về nhiệt
độ , cường độ dòng điện hiện tại trong những thành phần khác nhau của bộ VXL và có thể điều khiển điện áp và tần số tương tác.
Intel nhanh Sync Video: hỗ trợ phần cứng cho video mã hóa và giải mã.
CPU đa lõi chạy ở tốc độ đồng hồ lên tới 3,6 GHz, và được bổ sung bằng nhiều xử lý đổ bóng điểm ảnh để hình ảnh có chất lượng cao, sắc nét và các nguồn lực có sẵn trong GPU, giữa chúng có thể tính toán để giải mã, mã hóa
và chuyển mã video Quick Sync Video xử lý giải mã MPEG-2, MPEG-4 (chẳng hạn như H.264) và VC-1 (còn được biết đến như là WMV9) video, cùng với mã hóa (và chuyển mã) sang MPEG-4 So với phương pháp tiếp cận dựa trên GPU-được sử dụng trong Nehalem, Intel tuyên bố rằng Quick Sync Video tiêu thụ một nửa sức mạnh khi giải mã HD video
Trang 20xử lý 4 nhân di động với TDP 35W (trước đây là 45W ở Sandy Bridge)
Số transistor trên con chip này đã đạt tới 1,4 tỷ,
tức là cao hơn 20,7% so với 1,16 tỷ transistor
trên Sandy Bridge Nếu cùng 1 lượng
transistor, tiến trình 22nm của Ivy Bridge tạo ra
những con CPU có die nhỏ chỉ bằng 47,3%
tiến trình 32nm trên Sandy Bridge, do vậy chắc
chắn Ivy Bridge sẽ nhỏ hơn Sandy khá nhiều
trong khi năng lực xử lý tăng lên đáng kể
Trang 212.Out Of Order Execution(OOOE):
Là thực thi không theo trật tự hay còn gọi là thực thi động Intel P6 gia đình là một trong những bộ vi
xử lý đầu tiên của OoO, nhưng đã được thay thế bởi vi kiến trúc Intel Pentium 4 Willamette
Nhiều năm sau, nó đã chứng minh được một kết thúc chết do hiệu suất và các vấn đề nhiệt, buộc Intel
để trở lại thiết kế P6 và tiếp tục từ đó Kết quả là Core, Core 2, Sandy Bridge hàng loạt các bộ vi xử lý
và đáng chú ý nhất là lặp đi lặp lại mới nhất của mình, Ivy Bridge Với Ivy Bridge có kiến trúc Core
được cải tiến OOO thành Wide Dynamic Execution
Thực thi động là sự kết hợp của nhiều kỹ thuật (phân tích luồng dữ liệu, thực thi suy đoán, thực thi phi thứ tự….) đã được Intel hiện thực trong vi kiến trúc P6 gồm BXL Pentium Pro, P II, P III Trong vi kiến
trúc NetBurst sau đó, Intel đưa ra cơ chế Thực thi Động tiên tiến(Advanced Duynamic Execution) thiết
kế sâu hơn, tiên đoán xa hơn và cải tiến giải thuật tiên đoán nhánh lệnh để giảm bớt trường hợp tiên
đoán sai
Trong kiến trúc Core, hang lệnh thực thi được thiết kế dài hơn (14 khâu) giúp tên đoán nhánh lệnh
chính xác hơn và có đến 4 hàng lệnh thực thi cùng lúc (intel Mobile và NetBurst trước đây chỉ thực thi được cùng lúc 3 lệnh)
Trang 223 Intel® Hyper Threading:
Là Công nghệ Siêu Phân luồng (Công nghệ HT) cung cấp hai luồng xử lý trên mỗi lõi vật
lý
Ứng dụng có luồng có thể có được nhiều việc thực hiện song song, hoàn thành nhiệm
vụ sớm tức là cho phép mỗi lõi vi xử lý thực thi hai chương trình cung một lúc bằng chức năng đa nhiệm thông minh Hai chương trình được thực thi đồng thời bởi hai luồng trên cung một core và được thực hiện bởi:
• Thêm vào các thiết lập của lõi chính như là: bộ điều khiển ngắt, thanh ghi đặc biêt,
Thiết lập đăng ký thứ hai cho phép CPU giữ lại các core và tăng tính hiệu quả trong việc chuyển đổi chúng giữa các thanh ghi.
• Sửa đổi các các lõi đơn vị khác để chuyển đổi giữa hai luồng Một vài đơn vị trung tâm
tự động chuyển luồng khi bị đình trệ, hoặc đang chờ dữ liệu.
• Độ lớn của đệm trung tâm được sử dụng bởi mỗi thread Điều này cần thiết cho sự
chắc chắn rằng các threads nhận được tài nguyên mà các chương chương trình thực thi yêu cầu.
Trang 233 Intel® Hyper Threading:
Kết quả tôt nhất của HT technology là trong sử dụng tài nguyên của core và cải thiện hiệu năng Sử
dụng công nghệ này, nhiều tài nguyên có thể chia sẻ giữa các tài nguyên mà không có sự tác động
xấu Công nghệ HT là công nghệ giúp cải thiện tối đa hiệu năng của vi xử lý trong các ứng dụng đa
luồng, hoặc đơn luồng đa nhiệm Với công nghệ siêu phân luồng Intel® Hyper Threading, một bộ xử lý lõi kép có thể thi hành đồng thời 4 luồng
Bảng dưới là sự khác nhau giữa HT, multi-core, và multi processing
Trang 244 Intel ® Virtualization:
Là Công nghệ ảo hóa - Intel Virtualization Technology (VT-x) , một tập hợp phần cứng
mới mà phát triển hiệu năng của phần mềm ảo hóa cho phép một nền tảng phần cứng
có chức năng như nhiều nền tảng "ảo" và cung cấp khả năng quản lý được cải thiện
bằng cách hạn chế thời gian chết và duy trì năng suất bằng cách cách ly các hoạt động máy tính thành các phân vùng riêng biệt
Phần mềm này thường được sử dụng đê chạy các ưng dụng và hệ điều hành trong các máy ảo, và nó cung cấp các tiện dụng dưới đây :
• Cho phép nhiều hơn các hệ điều hành chạy đồng thời như là trên từng máy tính riêng biệt Khả năng này làm nó trở nên dễ dàng hơn cho việc tổ chức nhiều hệ điều hành yêu cầu môi trường kiểm thử phần mềm Nó có thể sử dụng để chạy kết hợp nhiều máy chủ trên cùng một phần cứng Do vậy tiết kiệm được chi phí phần cứng.
• Tăng tính bảo mật và độ tin cậy cho môi trường máy ảo vì nó hoàn toàn độc lập với
máy chủ
Trang 254 Intel ® Virtualization:
Cả vi xử lý Intel và vi xử lý AMD đều tích hợp công nghệ hỗ trợ ảo hóa Công nghệ hỗ trợ
ảo hóa hay VT, bao gồm các thành phần dưới đây :
• VT-x: cung cấp các hỗ trợ cơ bản cho phần mềm ảo hóa
• VT-d hay Virtualization technology for Diercted I/O: cung cấp các hỗ trợ của truy xuất I/O VT-d là
được thực hiện chủ yếu trong chip set và không có trong bản thân của mỗi CPU
• VT-c hay Virtualization technology for Connectivity: là phần được thực hiện trong các thiết bị I/O
Dưới đây là thông số kỹ thuật của VT-x trong Intel Core thế hệ thứ 3 gia đình :
Trang 265 Intel Turbo Boost Technology 2.0:
Tính năng Turbo Boost (TB) là Công nghệ tự động tăng tốc , xem như công nghệ overclock tự động của Intel, tăng tốc độ tính toán hoặc xử lý đồ họa khi cần thiết Về nguyên tắc công suất tối đa của CPU là tổng của công xuất xử lý đồ họa và tính toán, được quy định bởi nhà sản xuất, thông thường các ứng dụng không đòi hỏi yêu cầu đồ họa và tính toán cùng 1 lúc, nên với công nghệ TurBoost,
CPU có thể lấy phần công suất của bên ít được sử dụng sang tập trung tăng tốc cho bên kia
Ví dụ với những yêu cầu tính toán nhiều mà ít yêu cầu về đồ họa, CPU tự động tập trung công suất
xử lý tính toán bằng cách tăng tần số và tăng điện áp để tăng tốc độ; và ngược lại với ứng dụng đồ họa cao, TurBoost sẽ kết hợp với chức năng Dynamic Frequency(tần số linh động) dồn công suất sang giúp cho tần số xử lý đồ họa được cải tiến
Như vậy CPU sẽ có thể chạy nhanh hơn mức cơ bản của nhà sản xuất đặt ra ở trên cả phương
diện tính toán và đồ họa mà công suất vẫn không thay đổi, và CPU cũng không bị nóng Công
nghệ này chỉ có trên dòng Core i5 và Core i7
Trang 276 AES New Instructions (AES-NI):
Công nghệ hướng dẫn thêm tăng tốc phần cứng AES, thuật toán và tăng tốc độ thực hiện của các ứng dụng AES
7 Intel HD Graphics với DirectX 11:
Là chip đồ họa tích hợp mới