Một số công nghê nổi bật được áp dụng trong kiên trúc NetBurst như Hyper Pipelined TechnologyCông nghê siêu ống mở rộng số hàng lênh xư ly, làm hiêu suất máy có thể tăng 30%.. Executio
Trang 1Trường đại học công nghiệp Hà nội
Khoa Công Nghê Thông Tin
- -BÀI TIỂU LUẬN MÔN HỌC: KIẾN TRÚC MÁY TÍNH
ĐÊ TÀI: Nghiên cứu tìm hiểu về thê hệ vi xư ly InTel Pentium IV
Giáo viên hướng dẫn: Nguyễn Thanh Hải
Lớp: Đại học KTPM3-K9
Nhóm sô: 3
Ha Nội, ngay 1 tháng 11 năm 2015
Trường đại học công nghiêp Hà nội
Khoa Công Nghê Thông Tin
Trang 2Báo cáo bai tập lớn môn học: Kiến trúc Máy tính
ĐÊ TÀI: Nghiên cứu tìm hiểu về thê hệ vi xư ly InTel Pentium IV
Thành viên trong nhóm:
1 Leo thị lan Hương
2 Trần hải Linh
3 Nguyễn thị Nga
4 Nguyễn thị Nhã
5 Trần thị Quyên
Giáo viên hướng dẫn: Nguyễn Thanh Hải
(GV Kiên Trúc Máy Tính)
Ha Nội ,ngay 1 tháng 11 năm 2015
Mở đầu
1 Nhiệm vụ của bài
Nghiên cứu tìm hiểu về thê hê vi xư ly InTel Pentium IV.
2 Bố cục
* Lịch sư phát triển của VXL Pentium IV :
- Hoàn cảnh ra đời của VXL Pentium IV.
- Đặc trưng công nghê chung của VXL Pentium IV.
* Đặc trưng công nghê chi tiêt của từng loại biên thể (version) của VXL Pentium IV
2
Trang 3Pentium 4 Produced From 2000 to 2008
Max 1.30 GHz to 3.80 GHz
speeds 400 MT/s to 1066 MT/s
(), , ,, ,
Transistors 42M 180nm
55M 130nm 169M 130nm (P4EE) 125M 90nm
188M 65nm
Socket(s)
Predecessor Successor
Nội dung
A.Lịch sư phát triển của VXL Pentium IV
Pentium 4 là bộ vi xư ly kiên trúc x86 thê hê thứ 7 do Intel sản xuất, và là thiêt kê CPU hoàn toàn mới đầu tiên của họ kể từ Pentium III năm 1995 Thiêt kê mới này được gọi
là kiên trúc NetBurst Không như Pentium II, Pentium III, và các loại Celeron khác
nhau, kiên trúc này khác được tạo mới hoàn toàn và thừa kê rất ít từ thiêt kê Pentium Pro/P6
Bộ vi xư ly Pentium 4 đầu tiên, mã hiêu là "Willamette", chạy với tốc độ 1.4 và
1.5 GHz và đã được phát hành vào tháng 11 năm 2000 trên nền Socket 423, và sau đó
đã chạy với tốc độ từ 1.5 GHz tới 2 GHz trên Socket 478 Được ghi nhận cùng với sự
ra đời của Pentium 4 là bus FSB(Front side bus) nhanh với tốc độ 400 MT/s Khi đó, chip AMD Athlon đang chạy với tốc độ 266 MT/s
Dòng vi xư ly Pentium 4 đã kêt thúc vào
ngày 27 tháng 7 năm 2006, được thay thể bởi
dòng Intel Core 2 - dòng sư dụng nhân
"Conroe"
Pentium 4 được sản xuất vào tháng 11 năm 2011
và được giới thiêu là bộ vi xư ly thê hê mới
Nêu bộ vi xư ly này được đặt số thay vì tên nó
sẽ được gọi là 786 bởi vì nó đại diên cho một
thê hê sau những bộ xư ly 686 Vài hình thức
khác nhau của Pentium 4 được ra mắt công
chúng được dựa trên kiên trúc và khuôn bộ xư
ly được dựa trên các nhân Willametter,
Northwood và Prescott
3
Trang 4Một số công nghê nổi bật được áp dụng trong kiên trúc
NetBurst như Hyper Pipelined Technology(Công nghê siêu
ống) mở rộng số hàng lênh xư ly, làm hiêu suất máy có thể
tăng 30% Execution Trace Cache tránh tình trạng lênh bị
chậm trễ khi chuyển từ bộ nhớ dên CPU, Rapid Execution
Engine tang tốc bộ đồng xư ly toán học, bus hê thống
(system bus) 400 MHz và 533 MHz; các công nghê
Advanced Transfer Cache, Advanced Dynamic Execution,
Enhanced Floating point và Multimedia Unit, Streaming SIMD Extensions 2 (SSE2) cũng được cải tiên nhằm tạo ra những BXL tốc độ cao hơn, khả năng tính toán mạnh hơn, xư ly đa phương tiên tốt hơn Ghi nhận cùng với sự ra đời của Pentium 4 là công nghê Quad Data Rate cho phép FSB (Front Side Bus) đạt đên tốc
độ 400 MHz Khi đó, chip AMD Athlon đang chạy với tốc độ FSB là 266 MHz (công nghê Double Data Rate)
Bộ vi xư lí Pentium IV có đên 42 triêu Tranzito,kích thước chêt của nó là 217 mm2,công suất tiêu thụ 55 W khi làm viêc ở mức 1,5GHz.Tốc độ bus hê thống 3,2 GB/s , rất cao ở thời diểm bấy giờ
Bảng: So sánh hiệu suất Pentium 3 và Pentium 4
Bảng trên là sự so sánh hiêu suất của Pentium IV 1,5GHz và Petium III 1,0 GHz.Rõ ràng ta có thể thấy tính vượt trội dành cho Pentium IV.Các ứng dụng số
Trang 5nguyên cao hơn 15-20 %,trong khi Ứng dụng dấu chấm động và multimedia lên tới 30-70%
Pentium 4 đầu tiên (tên mã là Willamette) xuất hiên cuối năm 2000 đặt dấu chấm hêt cho “triều đại” Pentium III Willamette xuất sản xuất trên công nghê 0,18
có 42 triêu transistor(nhiều hơn gần 50% so với Pentium III),bus hê thống (system bus) 400 MHz,bộ nhớ đêm tích hợp L2 256 KB,socket 423 và 478 , Socket 423 chỉ xuất hiên trong khoảng thời gian rất ngắn, từ tháng 11 năm 2000 đên tháng 8 năm
2001 và bị thay thê bởi socket 478 P4 Willamette có tốc độ như 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9 , 2.0 GHz
P4 Northwood xuất hiên vào tháng 1 năm 2002,được sản xuất trên công nghê 0,13, có khoảng 55 triêu transistor,bộ nhớ đêm tích hợp L2 512 KB,socket 478.Northwood có 3 dòng gồm Northwood A(system bus 400 MHz),tốc độ 1.6, 1.8, 2.0, 2.2, 2.4, 2.5, 2.6, và 2.8 GHz.Northwoood B(system bus 533 MHz) tốc độ 2.26, 2.4, 2.53, 2.66, 2.8, 3.06 GHz(riêng 3.06 GHz có hỗ trợ công nghê siêu phân luồng Hyper Threading-HT).Northwood C (system bus 800 MHz,tất cả hỗ trợ HT),gồm 2.4,2.6, 3.0, 3.2, 3.4 GHz
P4 Prescott (năm 2004).Là BXL đầu tiên sản xuất theo công nghê 90nm,kích thước vi mạch giảm 50% so với P4 Willamette.Điều này cho phép tích hợp nhiều transistor hơn trên cùng kích thước (125 triêu transistor so với 55 triêu transistor của P4 Northwood),tốc độ chuyển đổi của transistor nhanh hơn,tăng khả năng xư ly,tính toán.Dung lượng bộ nhớ đêm tích hợp L2 của P4 Prescott gấp đôi so với P4
Northwood(1MB so với 512KB).Ngoài tập lênh MMX,SSE,SSE2,Prescott được bổ sung tập lênh SSE3 giúp các ứng dụng xư ly video và game
chạy nhanh hơn.Đây là giai đoạn “giao thời ” giữa socket
478-775LGA,system bus 533 MHz-800MHz và mỗi sản phẩm
được đặt tên khiên người dùng càng bối rối khi chọn mua
Prescott A(FSB 533MHz)có các tốc độ 2.4, 2.26, 2.8
(socket 478),Prescott 505 (2,66GHz), 505J(2.66 GHz),506
(2,66 GHz), 511 (2,8GHz), 515J (2,93GHz), 516 (2,93GHz) , 519J (3,06GHz), 519 J(3,06GHz) sư dụng socket 775LGA
Trang 6Prescott E,F (năm 2004) có bộ nhớ đêm L2 1MB(các phiên bản sau được mở rộng 2MB),bus hê thống 800 MHz.Ngoài tập lênh MMX,SSE2,SSE3 tích hợp, Prescott E,F còn hỗ trợ công nghê siêu phân luồng,một số phiên bản sau có hỗ trợ tính toán 64 bit
Dòng sư dụng socket 478 gồm Pentium 4 HT 2.8E (2,8GHz), 3.0E (3,0 GHz), 3.2E (3,2 GHz), 3.4E(3,4 GHz).Dòng sư dụng socket 775LGA gồm Pentium 4HT 3.2F, 3.4F, 3.6F, 3.8F, với các tốc độ tương ứng từ 3,2 GHz.Pentium 4 HT 517,520,520J,521,524,530,530J,531,540,540J,541,550,560,560J,561,570J,571
với các tốc độ từ 2.8 GHz đên 3,8 GHz
*Những điểm kĩ thuật chính của Pentium 4 bao gồm:
Tốc độ từ 1.3GHz đên 3.8GHz
phần mềm tương thích với những bộ xư ly Intel 32 bit trước
Một số phiên bản hỗ trợ EM64T
Bus bộ xư ly (font-side) chạy ở 400MHz, 533Mhz, SOOMHz hay 1066MHz
Những bộ logic số học (ALUs) chạy gấp hai lần tần số nhân bộ xư ly
Công nghê siêu dẫn đường (20-30 tầng)
Công nghê siêu phân luồng hỗ trợ tất cả bộ xư ly 2.4GHz và nhanh hơn chạy Bus 800MHz, tất cả bộ xư ly 3.06GHz và nhanh hơn chạy Bus 533MHz
Thực thi tập lênh ngoài lênh chuyên nghiêp
Bộ dự đoán phụ được mở rộng
Bộ nhớ đêm LI 8KB ha>16KB cộng với bộ nhớ đêm theo vêt thực thi vi lênh 12k
Bộ nhớ đêm L2 56bit trên khuôn tốc độ nhân 256KB, 512KB, 1MB hoặc 2MB kêt hợp 8 đường
Bộ nhớ đêm L3 tốc độ nhân 2MB tích hợp trên khuôn
SSE2-SSE cộng với 144 tập lênh mới chưa xư ly âm thanh và đồ họa
B Nội dung trọng tâm
I Các công nghê mới
Khả năng cung cấp một số công nghê mới và các tính năng được tăng cường trên đây dựa vào các tiên bộ mới nhất của Intel trong lĩnh vực thiêt kê mạch, quản ly viêc tiêu thụ năng lượng và tính toán không thể thực hiên được ở các mô hình vi
Trang 7kiên trúc của các thê hê CPU trước Bộ dấu chấm động được mở rộng Có nhiều trạng thái năng lượng thấp hơn Intel bỏ những số La Mã bằng một sự chỉ định 4, số Ả-rập tiêu chuẩn đối với Pentium 4 Bên trong pentium 4 có một kiên trúc mới mà Intel gọi là vi kiên trúc NetBurst, là thuật ngữ thị trường không phải thuật ngữ kĩ thuật Intel dùng NetBurst để thí nghiêm công nghê siêu đường dẫn, một bộ máy thực thi nhanh, bus hê thống tốc độ cao (400MHz, 533MHz, 800MHz và 1066MHz) và bộ nhớ đêm theo vêt thực thi Công nghê siêu đường dẫn là làm tăng gấp đôi hay gấp ba lần độ sâu đường dẫn tập lênh so với Pentium III ( hay Athlon/Athlon 64) nghĩa là nhiều bước nhỏ hơn được yêu cầu để thực thi tập lênh Mặc dù điều này có thể dường như kém hữu hiêu, nhưng nó cho phét đạt tới những xung cao hơn nhiều Bộ máy thực thi nhanh cho phép hai bộ logic số nguyên ( ALUs) chạy gấp đôi tần số nhanh
bộ xư ly có nghĩa là có những tập lênh có thể thực thi trong nữa chu kỳ đồng hổ.Bus
hê thống 400MHz/533MHz/800Mhz/1066Mhz là bus quad-pumped chạy hơn đồng
hồ hê thống 100Mhz/133Mhz/200Mhz/266Mhz chuyển giao dữ liêu gấp bốn lần trong mỗi chu kì đồng hồ Bộ nhớ đêm theo vêt thực thi là bộ nhớ đêm L1 tốc độ cao chưa được lượng 12K những vi hoạt động giải mã Nó di chuyển bộ giải mã tập lênh từ đường dẫn thực thi chính, làm tăng tốc độ xư ly
Trong những vấn đề trên thì Bus bộ xư ly tốc độ cao là đắng kể nhất, về mặt kỹ thuật
mà nói bus bộ xư ly là bus quad-pumped 100MHz, 133MHz, 200MHz hay 266MHz chuyển giao dữ liêu gấp bốn lần trong một chu kỳ (4x) cho tốc độ hiêu dụng 400Mhz, 533Mhz,800Mhz hay 1066Mhz bởi vì bus dung lượng 64bit (8byte) cho tốc độ lưu lượng 3200MBps, 4266MBps, 6400MBps hay 8532MBps
Trong kiên trúc nội bộ đường dẫn 20 tầng hay 30 tầng của pentium 4 những tập lênh đơn bị bả thành nhiều tầng nhỏ hơn so với bộ xư ly trước như pentium III, làm cho nó hầu như giống bộ xư ly RISC Không may là có thể thêm vào số chu kỳ thực thi những tập lênh nêu chúng không được tối ưu chô bộ xư ly Một ưu điểm kiên trúc quan trọng khác là công nghê siêu phân luồng, có thể được tìm thấy trong tất cả Pentium 4 2.4GHz và nhanh hơn chạy bus 800MHz hay tất cả Pentium 4 3.06GHz và nhanh hơn chạy bus 533Mhz Siêu phân luồng cho phép một bộ xư ly đơn chạy hai luồng cùng thời, hoạt động như thê nó là hai bộ xư ly thay vì một
Trang 8Pentium 4 đời đầu sư dụng socket 423 có 423 chân trong sự sắp xêp SPGA 39x39 Nhưng phiên bản sau cùng socket 47H, phiên bản hiên nay dùng socket T (I.GA775)
có những chân thêm để hỗ trợ tính năng mới như EM64T ( sự mở rộng 64 bit), bit vô hiêu hóa thực thi ( sự bảo vê chống những tán công của tràn bộ nhớ đêm), công nghê ảo Intel, và những tính năng tiên tieean khác Celeron không bao giờ được thiêt kê để làm viêc trong socket 423, nhưng celeron và celeron D có socket 478 hay socket T ( LGA775), cho phép hê thống hạ giá so với Pentium 4 Bộ chọn điên áp được tạo ra nhờ vào Module điều chỉnh điên áp tự động được đặt trên bo mạch chỉ và được nối đên socket
1 Hyper-Pipelined Technology - Công nghê Siêu ống
Là công nghê mới được giới thiêu trong Vi kiên trúc Netburst™ của Intel Nó tăng gấp đôi "độ sâu" của "ống" xư ly lênh của CPU khi so sánh với mô hình Vi kiên trúc P6 được sư dụng ở các thê hê CPU Pentium III Lênh được thực hiên trong
20 giai đoạn (20 stages) trong vi kiên trúc Netburst, so với 10 giai đoạn trong vi kiên trúc P6 Ống lênh dài giúp chip Pentium 4 có thể đạt được mức xung nhịp cao hơn
2 Execution Trace Cache
Là bộ nhớ đêm cấp 1 Bên cạnh 8KB bộ nhớ đêm dùng để chứa dữ liêu , Pentium 4 có khả năng lưu trữ đên 12K vi lênh đã được giải mã nhằm giúp tăng cường tốc độ thực thi lênh của CPU
3 Rapid Execution Engine - Cơ chê thực thi (lênh) nhanh chóng
Điều này được thực hiên dựa trên hai Đơn vị Luận ly Số Học được thiêt kê bên trong Pentium 4 Nó cho phép Pentium 4 thực hiên các lênh số học (cộng, trừ, nhân chia) và luận ly (And, Or ) chính với tốc độ gấp 2 lần tần số xư ly cơ bản của bộ xư
ly Như vậy CPU Pentium 4 - 2.0Ghz có khả năng thực hiên các lênh trên với tốc
độ 4.0Ghz và CPU Pentium 4 - 2.53Ghz thực hiên với tốc độ 5.1Ghz
4 Advanced Transfer Cache (ATC)
Là bộ nhớ đêm cấp 2 (L2 Cache) được thiêt kê bên trong Pentium 4 ATC có hai loại: 512 KB L2 ATC với các tốc độ CPU 2.8Ghz - 2.53Ghz - 2.40Ghz -
2.40(B)Ghz -2.26Ghz - 2.20Ghz - 2.0(A)Ghz và 1.6(A)Ghz; 256 KB L2 ATC với các tốc độ từ 1.2Ghz - 2.0Ghz ATC cung cấp kênh truyền có thông lượng rất cao với nhân của CPU ATC bao gồm một giao diên 256-bit (32 byte) để truyền dữ liêu
Trang 9trên mỗi xung clock Điều này cho phép ATC (L2 Cache) hỗ trợ tốc độ cao gấp 4 lần tốc độ truyền dữ liêu của L2 Cache sư dụng trong các CPU Pentium III
Ví dụ: CPU Pentium 4 - 2.53Ghz có tốc độ truyền dữ liêu lên tới 81GB/giây,
so với tốc độ truyền dữ liêu 16GB/giây của Pentium III - 1.0 Ghz
5 Out-Of-Order Execution
Nhân hỗ trợ Out-of-Order Execution có thể sắp xêp lại các vi lênh, cho phép lênh (cùng với đầu vào và các tài nguyên hê thống cần thiêt) để thực thi ngay khi có thể và tránh lãng phí thời gian Khi một vi lênh đang chờ được cấp phát tài nguyên hoặc dữ liêu, các lênh khác (thường là trong buffer) có thể chen vào thực thi Nhờ thực thi các
lênh song song, những khoảng trễ của pipeline bị loại bỏ Nhân có thể thực thi nhiều lênh trong mỗi giai đoạn của pipeline Sau đó in-order retirement unit sẽ tìm các lênh được hiên xong và không còn phụ thuộc dữ liêu cũng như liên quan đên các lênh rẽ nhánh chưa hoàn thất để xư ly và lưu kêt quả ra bộ nhớ theo trật tự ban đầu của nó
6 Branch Prediction (phỏng đoán nhánh)
Kiên trúc NetBurst có thể nhớ được các nhánh trong chương trình chạy, giúp làm giảm độ trễ trong quá trình nhảy và nạp đầy ống lênh , Các nhánh được lưu giữ trên cơ
sở địa chỉ lênh bên trong Branch Target Buffer (BTB) Bộ vi xư ly có thể dự đoán được các nhánh sắp tới trước cả khi lênh rẽ nhánh được thực hiên
7 Rapid Execution Engine
Trong Pentium 4, có 2 ALU và hai AGU chạy với mức xung gấp đôi xung clock Rapid execution engine được giới thiêu là làm giảm độ trễ của viêc thực hiên các phép toán đơn giản Điều này thực sự có y nghĩa vì hiêu năng và tốc độ của
vi xư ly phụ thuộc rất nhiều vào các tính toán số nguyên trên ALU
8 Quad Data Rate
FSB của Pentium 4 có thể truyền bốn lần dữ liêu trong một xung clock Công nghê này là Quad Pumped hay còn gọi là Quad Data Rate (QDR).QDR khiên cho xung nhịp hiêu dụng tăng lên gấp 4 lần so với xung thực Nhờ đó các CPU Pentium 4 có thể đạt đên 400Mhz System bus, tốc độ truyền nhận dữ liêu vào-ra CPU là 3.2GBps
so với tốc độ tương ứng là 1.06GBps của Pentium III (133Mhz system bus)
Real Clock Performance Tranfer Rate
Trang 10100MHz 400MHz 3.2GB/s
9 Enhanced Floating Point & Multimedia Unit
Bộ xư ly Pentium 4 mở rộng các thanh ghi dấu chấm động lên tới 128bit và tạo thêm một thanh ghi mở rộng nhằm phục vụ viêc di chuyển dữ liêu
Do vậy, khả năng xư ly các ứng dụng dấu chấm động (tính toán kêt cấu, số liêu tài chính, số liêu khoa học…) và truyền thông đa phương tiên (dựng và xư ly phim video, xư ly hình ảnh đồ họa…) được tăng cường rất nhiều
10 Streaming SIMD Extension 2 (SSE2) Instructions
Là tập lênh hỗ trợ đồ họa mở rộng được thiêt kê cho Pentium 4 Vi kiên trúc Netburst
mở rộng khả năng xư ly theo kiểu cấu trúc SIMD của các công nghê Intel® MMX™
và SSE bằng cách thêm vào 144 lênh mới Các lênh này bao gồm các tác vụ số nguyên SIMD 128-bit và các tác vụ dấu chấm động Các lênh mới này làm tối ưu hóa khả năng thực hịên các ứng dụng như phim video, xư ly âm thanh - hình ảnh, mã hóa, tính toán khoa học
11 Hyper Threading (siêu phân luồng)
Hyper threading là công nghê cho phép một CPU vật ly hoạt động trên hê điều hành như là hai CPU logic hoạt động song song Nó dựa trên nguyên tắc là vào một thời điểm chỉ có một phần tài nguyên của CPU được sư dụng để thực thi lênh của một tiên trình, những phần chưa được sư dụng có thể được dùng để thực thi các tiên trình khác.Trong các CPU sư dụng công nghê Hyper-Threading, mỗi CPU logic sở hữu một tập các thanh ghi, kể cả thanh ghi đêm chương trình PC riêng , CPU vật ly sẽ luân phiên các giai đoạn tìm/giải mã giữa hai CPU logic và chỉ cố gắng thực thi những thao tác từ hai chuỗi lênh đồng thời theo cách hướng tới những đơn vị thực thi ít được
sư dụng