1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tìm hiểu kiến trúc vi xử lý CORE i5 i7 ivy bridge

33 1,9K 8
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Tìm hiểu kiến trúc vi xử lý Core i5 i7 Ivy Bridge
Người hướng dẫn PTS. Hoàng Xuân Dậu
Trường học Học viện Công nghệ Bưu chính Viễn thông
Chuyên ngành Kỹ thuật vi xử lý
Thể loại Báo cáo
Năm xuất bản 2012
Thành phố Hà Nội
Định dạng
Số trang 33
Dung lượng 5,56 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Tìm hiểu kiến trúc vi xử lý CORE i5 i7 ivy bridge

Trang 1

MÔN : KĨ THUẬT VI XỬ LÝ

GIẢNG VIÊN:HOÀNG XUÂN DẬU

Trang 3

I.GIỚI THIỆU VỀ VXL CORE I5/I7 Ivy Bridge

II TỔNG QUAN VỀ KIẾN TRÚC

III SƠ ĐỒ KHỐI & TẬP LỆNH.

V.KẾT LUẬN.

IV.CÔNG NGHỆ MỚI VÀ TÍNH NĂNG NỔI BẬT

Trang 4

Đội hình Ivy Bridge ban đầu gồm 13 bộ xử lý bốn nhân cho máy tính xách tay, máy tính để bàn cao cấp

và máy tính tất-cả-trong-một (AIO).

Ivy Bridge là kiến trúc xử lý rơi vào giai đoạn “ Tick " theo ngôn ngữ của Intel, tức nó là một sự nâng cấp

so với Sandy Bridge chứ không phải sử dụng kiến trúc xử lý thế hệ mới

Ivy Bridge được sản xuất trên công nghệ 22nm tiên tiến hơn hẳn các sản phẩm trước đó

Bên cạnh đó, IVB cũng sử dụng bóng bán dẫn Gate và tương thích với socket sử dụng trên SNB, điều này đồng nghĩa người dùng sẽ không cần tới một

Tri-bo mạch chủ hoàn toàn mới - mà đơn giản chỉ là nâng

cấp BIOS

Trang 7

1 : Kiến trúc chíp :

Giống như Sandy Bridge, Ivy Bridge có tối đa 4 lõi xử lý, được hợp nhất với một con chip

xử lý đồ hoạ, bộ nhớ 8 MB L3 cache, và tích hợp các hệ thống kết nối khác (ví dụ như

các cổng kết nối màn hình, DMI, các thiết bị vào ra I/O) Vòng bus 256-bit có nhiệm vụ kết

nối tất cả các thành phần với nhau

Trang 8

Tổng quan về các thông số kỹ thuật quan trọng nhất:

• Xử lý Tri-Gate 22-nanometer

• 1,4 tỷ bóng bán dẫn

• Mật độ 160 mm2

• 32 + 32 KB L1 cache cho xử lý dữ liệu và kết nối (mỗi lõi)

• 256 Kbyte L2 cache (mỗi lõi)

• 8 MB L3 cache (sử dụng cho các lõi và GPU)

• Bộ xử lý đồ hoạ Intel HD 4000 (GT2, DirectX 11, 16 EUs)

• DDR3 (L) điều khiển bộ nhớ lên đến 800 MHz (PC3-12800)

• PCIe 3.0 với 16 luồng dữ liệu

• Hỗ trợ MMX, SSE, (1, 2, 3, 3S, 4.1, 4.2), AVX, AES-NI

• Điện năng tiêu thụ 35, 45 hoặc 55 watt.

Trang 9

2: Bộ Vi Xử Lý

Bộ vi xử lý của Ivy Bridge về cơ bản dựa trên người tiền nhiệm Sandy Bridge, do đó nó bao gồm các

tính năng đã được biết đến như Hyper Threading và Turbo Boost 2.0

Tiến trình mới cho phép tăng chỉ 4-6% năng lực xử lý khi xét trên 2 CPU Ivy và Sandy cùng xung

nhịp và cùng dòng sản phẩm (clock to clock) Thật sự thì mức tăng này là rất nhỏ nhưng Intel cũng

phải thực hiện rất khá nhiều thay đổi trong kiến trúc để đạt con số đó Hơn nữa, do Ivy có xung nhịp

cao hơn mà hiệu năng tổng thể của CPU tăng lên khoảng 10%

Một thay đổi đáng giá khác liên quan đến đơn vị phân chia (có tác dụng làm tăng thông lượng), các

tập lệnh AVX và SSE được tăng cường nhờ việc bổ xung 6 thanh ghi chia và tải dữ liệu Intel cũng

đã sửa đổi các dữ liệu trong bộ nhớ cache được điều chỉnh tự động và ưu tiên cho các ứng dụng

cần băng thông lớn, khai thác bộ nhớ cache hiệu quả hơn, đặc biệt là trong các nhiệm vụ đa luồng

Trang 10

Lần đầu tiên, Intel sử dụng thuật toán điền số ngẫu nhiên (Digital Random Number Generator,

DRNG) cho phép tăng cường hiệu suất tính toán và xử lý các thuật toán mã hoá lên tới 2-3Gbit/s

Trang 11

4 Bộ Xử Lý Đồ Hoạ

Có rất nhiều sự thay đổi thú vị cho GPU ở Ivy Bridge, điều mà có lẽ là lý do quan trọng nhất để Intel

trao tặng dạnh hiệu “Tick +” cho Ivy Bridge

Một trong những sáng kiến quan trọng nhất là có thể nhìn thấy đó là việc hỗ trợ DirectX 11, Shader

Model 5.0 (Sandy Bridge: DirectX 10.1 / SM 4.1), bên cạnh đó là việc hỗ trợ OpenGL 3.1 và OpenCL 1,1 Trước kia, chip đồ họa của Intel thường chậm hơn 1 thế hệ so với CPU (CPU tiến trình 32nm thì GPU mới chỉ 45nm) Sandy Bridge đã hợp nhất 2 con chip này trên một đế, chế tạo chung ở tiến trình 32nm và giờ đây Ivy Bridge tiếp tục làm điều đó ở tiến trình 22nm, Tuy vậy, có vẻ như lần này Intel

cũng quyết tâm đầu tư khá nhiều vào GPU, nâng số EU (execution units) từ 12 lên 16 để nâng cao

hiệu năng xử lý Do vậy, có thể kích thước đế Ivy cũng sẽ không thay đổi nhiều vì CPU nhỏ hơn như GPU lại to hơn Với 16 EU, Ivy đã có thể hỗ trợ 3 màn hình thay vì chỉ tối đa 2 màn hình như trước

đây, và độ phân giải tối đa hỗ trợ lên tới 4K

Trang 12

3D là những gì mà Ivy chứng tỏ chúng mạnh mẽ hơn Sandy Intel chia chip đồ họa trên Ivy thành 2 phiên bản khác nhau, 1 phiên bản GT2 chứa 16EU trong khi GT1 có thể chỉ là 8EU Năm ngoái, con số này trên Sandy là 12 và 6 EU Ngoài ra, phiên bản GT2 cũng đồng thời hỗ trợ 2 bộ lấy mẫu còn GT1 chỉ có 1

Nâng cao sức mạnh cũng chẳng để làm gì nếu không hỗ trợ các thư viện đồ họa như DirectX hay

OpenGL, CL

Nói gì thì nói, chúng ta cần 1 con số để biết Ivy mạnh hơn Sandy thế nào Mỗi 1 EU trên Ivy mạnh gần

gấp đôi 1 EU trên Sandy, tức là năng lực xử lý GFLOPS sẽ tăng gần gấp đôi trên mỗi EU Tính trung bình thì GPU của Ivy mạnh hơn Sandy khoảng 60% xét về tổng thể, một số thử nghiệm đổ bóng kết hợp của CPU và GPU thì nó còn mạnh hơn khoảng 32 lần!

Trang 13

5 : Công Suất Tiêu Thụ

Nếu muốn tìm 1 con chip tiết kiệm điện thì Ivy Bridge chính là dòng chip mà bạn nên chờ đợi Như đã nói ở trên, cùng mức xung nhịp xử lý thì Ivy Bridge mạnh hơn Sandy khoảng 4-6% đồng thời chỉ sử

dụng khoảng 75-80% lượng năng lượng mà Sandy tiêu thụ Tuy vậy, đây vẫn chưa phải là phần thú vị nhất về khả năng tiêu thụ điện năng của Ivy, bên cạnh việc tối ưu hóa hơn các giải pháp đã xuất hiện trên Sandy như System Agent Voltages hay Power Aware Interrupt Routing, Intel đưa ra 1 giải pháp mới là TDP có thể cấu hình (Configurable TDP-cTDP)

Đây là một bước tiến mới của Intel nhằm giúp các nhà sản xuất giới thiệu nhiều giải pháp linh hoạt hơn cho khách hàng Tất cả các bộ xử lý hiện tại đều đòi hỏi phải sử dụng các hệ thống tản nhiệt khác

nhau để làm mát nó và người ta đo nó bằng TDP (thermal design point) Hệ thống nào có TDP cao

hơn thì sẽ đòi hỏi tản nhiệt tốt hơn, TDP thấp thì tỏa nhiệt ít hơn Trước đây, Intel đã tận dụng TDP

cao trong thời gian ngắn nhằm kích hoạt tính năng Turbo Boost nhưng hiện tại thì cTDP là một giải

pháp xuất sắc hơn nữa

Trang 14

1 SƠ ĐỒ KHỐI

Trang 15

Bộ nhớ Cache:

 Cache L1 gồm: 32 kB dữ liệu + 32 kB hướng dẫn bộ nhớ

cache L1 (3 đồng hồ)

 Cache L2: 256 kB L2 cache (8 đồng hồ) cho mỗi lõi

 Cache L3 chia sẻ bao gồm bộ xử lý đồ họa (LGA 1155)

Pre decode : Trước khi giải mã

Intruction queue: dữ liệu được đưa vào hàng đợi

Decoder: Bộ giải mã lệnh

Giải mã vi hoạt động, bộ nhớ cache và dự đoán tối ưu dành cho

chi nhánh mở rộng

Trang 16

Load buffers: Tải vào bộ đệm, phân bổ (allocate).

Store buffers: Cửa hàng bộ đệm

Reorder buffers: Sắp xếp lại bộ đệm

Khối store address và store data

Khối xử lý các chỉ lệnh hỏi dữ liệu để được ghi tại bộ nhớ RAM Khối này cũng

có tên gọi là AGU, Address Generator Unit Kiểu chỉ lệnh này sử dụng cả hai khối

Store Address và Store Data tại cùng một thời điểm

Register Files:

Register Files là một mảng các vi xử lý đăng ký trong CPU Việc tạo ra biến đổi

có thể là nguyên nhân làm cho khả năng ghi của RF (register files) suy yếu ở điện

áp thấp, kỹ thuật này làm suy yếu các cell bộ nhớ kéo lên độ mạnh có hiệu lực của

thiết bị nhằm giải quyết khả năng ghi ở điện áp thấp, khả năng vấn đề gây ra bởi

một thiết bị trong các cell bộ nhớ.

 Cải thiên hiệu suất tính toán bằng các mã hóa AES (tập lệnh AES) và SHA kết

nối giữa các lõi , bộ nhớ Cache,đồ họa và các miền hệ thống bằng các vòng

bus(256 bit/vòng).

Trang 17

ALU (Khối logic số học - Arithmetic and Logic Unit) Các chỉ lệnh

thông thường này cũng được hiểu là các chỉ lệnh “integer”

Advanced Vector Extensions (AVX) 256-bit hướng dẫn thiết lập với

vectơ rộng hơn, cú pháp mở rộng mới và chức năng phong phú

Các hướng dẫn CPU bao gồm 256-bit mới AVX (Advance Vector

Extensions) hoạt động SIMD, theo bước chân của 80-bit MMX

(MultiMedia Phần mở rộng) và giá trị của nhiều thế hệ SSE 128-bit

(streaming SIMD Extensions)

 System Agent chứa những mạch điều khiển giao diện ngoài như : PCI

Express, DMI, bộ nhớ và giao diện hiển thị System Agent tương tự như

những gì chúng ta thấy ở Uncore trong Nehalem nhưng không phải

hoàn toàn tương tự Nó không chứa Cache L3, là bộ phận chức năng duy

nhất làm việc cùng với tần số của bộ vi xử lí trong vi cấu trúc mới Và đặc

điểm phân biệt khác của System Agent là nó cũng dùng Ring Bus để trao

đổi dữ liệu với lõi x86 và lõi đồ họa cũng như với Cache L3.

Trang 18

Power Control Unit

Bên cạnh những mạch điều khiển giao diện ngoài, phần quan trọng khác trong System Agent của Sandy bridge đó là PCU( Power Control Unit ) PCU là một siêu điều khiển có khả năng lập trình, thu thập thông tin về nhiệt

độ , cường độ dòng điện hiện tại trong những thành phần khác nhau của bộ VXL và có thể điều khiển điện áp và tần số tương tác.

Intel nhanh Sync Video: hỗ trợ phần cứng cho video mã hóa và giải mã.

CPU đa lõi chạy ở tốc độ đồng hồ lên tới 3,6 GHz, và được bổ sung bằng nhiều xử lý đổ bóng điểm ảnh để hình ảnh có chất lượng cao, sắc nét và các nguồn lực có sẵn trong GPU, giữa chúng có thể tính toán để giải mã, mã hóa

và chuyển mã video Quick Sync Video xử lý giải mã MPEG-2, MPEG-4 (chẳng hạn như H.264) và VC-1 (còn được biết đến như là WMV9) video, cùng với mã hóa (và chuyển mã) sang MPEG-4 So với phương pháp tiếp cận dựa trên GPU-được sử dụng trong Nehalem, Intel tuyên bố rằng Quick Sync Video tiêu thụ một nửa sức mạnh khi giải mã HD video

Trang 20

xử lý 4 nhân di động với TDP 35W (trước đây là 45W ở Sandy Bridge)

Số transistor trên con chip này đã đạt tới 1,4 tỷ,

tức là cao hơn 20,7% so với 1,16 tỷ transistor

trên Sandy Bridge Nếu cùng 1 lượng

transistor, tiến trình 22nm của Ivy Bridge tạo ra

những con CPU có die nhỏ chỉ bằng 47,3%

tiến trình 32nm trên Sandy Bridge, do vậy chắc

chắn Ivy Bridge sẽ nhỏ hơn Sandy khá nhiều

trong khi năng lực xử lý tăng lên đáng kể

Trang 21

2.Out Of Order Execution(OOOE):

Là thực thi không theo trật tự hay còn gọi là thực thi động Intel P6 gia đình là một trong những bộ vi

xử lý đầu tiên của OoO, nhưng đã được thay thế bởi vi kiến trúc Intel Pentium 4 Willamette

Nhiều năm sau, nó đã chứng minh được một kết thúc chết do hiệu suất và các vấn đề nhiệt, buộc Intel

để trở lại thiết kế P6 và tiếp tục từ đó Kết quả là Core, Core 2, Sandy Bridge hàng loạt các bộ vi xử lý

và đáng chú ý nhất là lặp đi lặp lại mới nhất của mình, Ivy Bridge Với Ivy Bridge có kiến trúc Core

được cải tiến OOO thành Wide Dynamic Execution

Thực thi động là sự kết hợp của nhiều kỹ thuật (phân tích luồng dữ liệu, thực thi suy đoán, thực thi phi thứ tự….) đã được Intel hiện thực trong vi kiến trúc P6 gồm BXL Pentium Pro, P II, P III Trong vi kiến

trúc NetBurst sau đó, Intel đưa ra cơ chế Thực thi Động tiên tiến(Advanced Duynamic Execution) thiết

kế sâu hơn, tiên đoán xa hơn và cải tiến giải thuật tiên đoán nhánh lệnh để giảm bớt trường hợp tiên

đoán sai

Trong kiến trúc Core, hang lệnh thực thi được thiết kế dài hơn (14 khâu) giúp tên đoán nhánh lệnh

chính xác hơn và có đến 4 hàng lệnh thực thi cùng lúc (intel Mobile và NetBurst trước đây chỉ thực thi được cùng lúc 3 lệnh)

Trang 22

3 Intel® Hyper Threading:

Là Công nghệ Siêu Phân luồng (Công nghệ HT) cung cấp hai luồng xử lý trên mỗi lõi vật

Ứng dụng có luồng có thể có được nhiều việc thực hiện song song, hoàn thành nhiệm

vụ sớm tức là cho phép mỗi lõi vi xử lý thực thi hai chương trình cung một lúc bằng chức năng đa nhiệm thông minh Hai chương trình được thực thi đồng thời bởi hai luồng trên cung một core và được thực hiện bởi:

• Thêm vào các thiết lập của lõi chính như là: bộ điều khiển ngắt, thanh ghi đặc biêt,

Thiết lập đăng ký thứ hai cho phép CPU giữ lại các core và tăng tính hiệu quả trong việc chuyển đổi chúng giữa các thanh ghi.

• Sửa đổi các các lõi đơn vị khác để chuyển đổi giữa hai luồng Một vài đơn vị trung tâm

tự động chuyển luồng khi bị đình trệ, hoặc đang chờ dữ liệu.

• Độ lớn của đệm trung tâm được sử dụng bởi mỗi thread Điều này cần thiết cho sự

chắc chắn rằng các threads nhận được tài nguyên mà các chương chương trình thực thi yêu cầu.

Trang 23

3 Intel® Hyper Threading:

Kết quả tôt nhất của HT technology là trong sử dụng tài nguyên của core và cải thiện hiệu năng Sử

dụng công nghệ này, nhiều tài nguyên có thể chia sẻ giữa các tài nguyên mà không có sự tác động

xấu Công nghệ HT là công nghệ giúp cải thiện tối đa hiệu năng của vi xử lý trong các ứng dụng đa

luồng, hoặc đơn luồng đa nhiệm Với công nghệ siêu phân luồng Intel® Hyper Threading, một bộ xử lý lõi kép có thể thi hành đồng thời 4 luồng

Bảng dưới là sự khác nhau giữa HT, multi-core, và multi processing

Trang 24

4 Intel ® Virtualization:

Là Công nghệ ảo hóa - Intel Virtualization Technology (VT-x) , một tập hợp phần cứng

mới mà phát triển hiệu năng của phần mềm ảo hóa cho phép một nền tảng phần cứng

có chức năng như nhiều nền tảng "ảo" và cung cấp khả năng quản lý được cải thiện

bằng cách hạn chế thời gian chết và duy trì năng suất bằng cách cách ly các hoạt động máy tính thành các phân vùng riêng biệt

Phần mềm này thường được sử dụng đê chạy các ưng dụng và hệ điều hành trong các máy ảo, và nó cung cấp các tiện dụng dưới đây :

• Cho phép nhiều hơn các hệ điều hành chạy đồng thời như là trên từng máy tính riêng biệt Khả năng này làm nó trở nên dễ dàng hơn cho việc tổ chức nhiều hệ điều hành yêu cầu môi trường kiểm thử phần mềm Nó có thể sử dụng để chạy kết hợp nhiều máy chủ trên cùng một phần cứng Do vậy tiết kiệm được chi phí phần cứng.

• Tăng tính bảo mật và độ tin cậy cho môi trường máy ảo vì nó hoàn toàn độc lập với

máy chủ

Trang 25

4 Intel ® Virtualization:

Cả vi xử lý Intel và vi xử lý AMD đều tích hợp công nghệ hỗ trợ ảo hóa Công nghệ hỗ trợ

ảo hóa hay VT, bao gồm các thành phần dưới đây :

• VT-x: cung cấp các hỗ trợ cơ bản cho phần mềm ảo hóa

• VT-d hay Virtualization technology for Diercted I/O: cung cấp các hỗ trợ của truy xuất I/O VT-d là

được thực hiện chủ yếu trong chip set và không có trong bản thân của mỗi CPU

• VT-c hay Virtualization technology for Connectivity: là phần được thực hiện trong các thiết bị I/O

Dưới đây là thông số kỹ thuật của VT-x trong Intel Core thế hệ thứ 3 gia đình :

Trang 26

5 Intel Turbo Boost Technology 2.0:

Tính năng Turbo Boost (TB) là Công nghệ tự động tăng tốc , xem như công nghệ overclock tự động của Intel, tăng tốc độ tính toán hoặc xử lý đồ họa khi cần thiết Về nguyên tắc công suất tối đa của CPU là tổng của công xuất xử lý đồ họa và tính toán, được quy định bởi nhà sản xuất, thông thường các ứng dụng không đòi hỏi yêu cầu đồ họa và tính toán cùng 1 lúc, nên với công nghệ TurBoost,

CPU có thể lấy phần công suất của bên ít được sử dụng sang tập trung tăng tốc cho bên kia

Ví dụ với những yêu cầu tính toán nhiều mà ít yêu cầu về đồ họa, CPU tự động tập trung công suất

xử lý tính toán bằng cách tăng tần số và tăng điện áp để tăng tốc độ; và ngược lại với ứng dụng đồ họa cao, TurBoost sẽ kết hợp với chức năng Dynamic Frequency(tần số linh động) dồn công suất sang giúp cho tần số xử lý đồ họa được cải tiến

Như vậy CPU sẽ có thể chạy nhanh hơn mức cơ bản của nhà sản xuất đặt ra ở trên cả phương

diện tính toán và đồ họa mà công suất vẫn không thay đổi, và CPU cũng không bị nóng Công

nghệ này chỉ có trên dòng Core i5 và Core i7

Trang 27

6 AES New Instructions (AES-NI):

Công nghệ hướng dẫn thêm tăng tốc phần cứng AES, thuật toán và tăng tốc độ thực hiện của các ứng dụng AES

7 Intel HD Graphics với DirectX 11:

Là chip đồ họa tích hợp mới

Ngày đăng: 06/11/2013, 18:26

HÌNH ẢNH LIÊN QUAN

1. SƠ ĐỒ KHỐI - Tìm hiểu kiến trúc vi xử lý CORE i5 i7 ivy bridge
1. SƠ ĐỒ KHỐI (Trang 14)

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w