Một số công nghê nổi bật được ap dụng trong kiên trúcNetBurst như Hyper Pipelined TechnologyCông nghê siêu ống mở rộng số hàng lênh xưly, làm hiêu suất may có thể tăng 30%.. Execution Tr
Trang 1Trường đại học công nghiệp Hà nội
Khoa Công Nghê Thông Tin -
-BAI TIÊU LUÂN MÔN HOC: KIÊN TRUC MAY TINH
ĐÊ TAI: Nghiên cứu tìm hiểu về thê hệ vi xư ly InTel Pentium IV
Gia ́ o iênohươngo dn : Nguyên Thanh Hai
Lớ: Đại học KTPM3-K9
Nh
o mosô : 3
HaoNôi,ongào1o hango11onămo2015
Trường đại học công nghiêp Hà nội
Khoa Công Nghê Thông Tin
Trang 2oBa ́ oca ́ obaiotậpolơnomônohọc:oooooooooKiếnotrúcoMa ̀ otính
ĐÊ TAI: Nghiên cứu tìm hiểu về thê hệ vi xư ly InTel Pentium IV Nhóm thực hiện :oNhomo3–LơpoKTPM3-K9
Thành viên trong nhóm:
1
2
3
4
5
Leo thị lan Hương
Trần hải Linh
Nguyễn thị Nga
Nguyễn thị Nhã
Trần thị Quyên
Giáo viên hướng dẫn:ooNgu ̀ ênoThanhoHai
(GV Kiên Trúc Máy Tính)
ooooooHaoNôio,ngào1othango11onămo2015
Mở đầu
1 Nhiệm vụ của bài
Nghiên cứu tìm hiểu về thê hê vi xư ly InTel Pentium IV.
2 Bố cục
*
-Lich sư phat triển cua VXL Pentium IV :
Hoàn canh ra đời cua VXL Pentium IV.
- Đăc trưng công nghê chung cua VXL Pentium IV.
Đăc trưng công nghê chi tiêt cua tưng loại biên thể (version) cua VXL
*
Trang 3 Nội dung
A.Lịch sư phat triên cca VXL Pentium IV
Pentium 4 là bộ vi xưly kiên trúc x86 thê hê thứ 7 do Intel san xuất, và là thiêt kê CPU hoàn toàn mới đầu tiên cua họ kể tư Pentium III năm 1995 Thiêt kê mới nàyđược gọi
là kiên trúc NetBurst Không như Pentium II, Pentium III, và cac loại Celeron khac
nhau, kiên trúc nàykhac được tạo mới hoàn toàn và thưa kê rất ít tư thiêt kê Pentium
Pro/P6
Bộ vi xưly Pentium 4 đầu tiên, mã hiêu là "Willamette", chạyvới tốc độ 1.4 và
1.5 GHz và đã được phat hành vào thang 11 năm 2000 trên nền Socket 423, và sau đó
đã chạyvới tốc độ tư 1.5 GHz tới 2 GHz trên Socket 478 Được ghi nhận cùng với sự
ra đời cua Pentium 4 là bus FSB(Front side bus) nhanh với tốc độ 400 MT/s Khi đó,
chip AMD Athlon đang chạyvới tốc độ 266 MT/s
Pentium 4
Dòng vi xưly Pentium 4 đã kêt thúc vào
ngày27 thang 7 năm 2006, được thaythể bởi
dòng Intel Core 2 - dòng sưdụng nhân
Produced From 2000 to 2008
Max CPU clock rate
1.30 GHz to 3.80 GHz
"Conroe"
Pentium 4 được san xuất vào thang 11 năm 2011
và được giới thiêu là bộ vi xưly thê hê mới
Nêu bộ vi xưly nàyđược đăt số thayvì tên nó
sẽ được gọi là 786 bởi vì nó đại diên cho một
thê hê sau những bộ xưly 686 Vài hình thức
khac nhau cua Pentium 4 được ra mắt công
chúng được dựa trên kiên trúc và khuôn bộ xư
ly được dựa trên cac nhân Willametter,
Northwood và Prescott
FSB speeds 400 MT/s to 1066 MT/s
Instruction set x86 (i386), x86-64, MM
X,SSE, SSE2, SSE3
Microarchitecture NetBurst
Transistors 42M 180nm
5 1 1
5M 130nm 69M 130nm (P4EE) 25M 90nm
188M 65nm Socket 423 Socket 478 LGA 775
Socket(s)
3
Predecessor Pentium III
Trang 4Một số công nghê nổi bật được ap dụng trong kiên trúc
NetBurst như Hyper Pipelined Technology(Công nghê siêu
ống) mở rộng số hàng lênh xưly, làm hiêu suất may có thể
tăng 30% Execution Trace Cache tranh tình trạng lênh bi
chậm trễ khi chuyển tư bộ nhớ dên CPU, Rapid Execution
Engine tang tốc bộ đồng xư ly toan học, bus hê thống
(system bus) 400 MHz và 533 MHz; cac công nghê
Advanced Transfer Cache, Advanced Dynamic Execution,
Enhanced Floating point và Multimedia Unit, Streaming SIMD Extensions 2 (SSE2) cũng được cai tiên nhằm tạo ra những BXL tốc độ cao hơn, kha năng tính toan mạnh hơn, xư ly đa phương tiên tốt hơn Ghi nhận cùng với sự ra đời cua Pentium 4 là công nghê Quad Data Rate cho phép FSB (Front Side Bus) đạt đên tốc
độ 400 MHz Khi đó, chip AMD Athlon đang chạy với tốc độ FSB là 266 MHz (công nghê Double Data Rate)
Bộ vi xưlí Pentium IV có đên 42 triêu Tranzito,kích thước chêt cua nó là 217 mm2,công suất tiêu thụ 55 W khi làm viêc ở mức 1,5GHz.Tốc độ bus hê thống 3,2 GB/s , rất cao ở thời diểm bấygiờ
Bang: So sánh hiệu suất Pentium 3 và Pentium 4
Bang trên là sự so sanh hiêu suất cua Pentium IV 1,5GHz và Petium III 1,0 GHz.Rõ ràng ta có thể thấytính vượt trội dành cho Pentium IV.Cac ứng dụng số
Trang 5nguyên cao hơn 15-20 %,trong khi Ứng dụng dấu chấm động và multimedia lên tới 0-70%
Pentium 4 đầu tiên (tên mã là Willamette) xuất hiên cuối năm 2000 đăt dấu 3
chấm hêt cho “triều đại” Pentium III Willamette xuất san xuất trên công nghê 0,18
có 42 triêu transistor(nhiều hơn gần 50% so với Pentium III),bus hê thống (system bus) 400 MHz,bộ nhớ đêm tích hợp L2 256 KB,socket 423 và 478 , Socket 423 chỉ xuất hiên trong khoang thời gian rất ngắn, tư thang 11 năm 2000 đên thang 8 năm 2
1
001 và bithay thê bởi socket 478 P4 Willamette có tốc độ như 1.3, 1.4, 1.5, 1.6, 7, 1.8, 1.9 , 2.0 GHz
P4 Northwood xuất hiên vào thang 1 năm 2002,được san xuất trên công nghê ,13, có khoang 55 triêu transistor,bộ nhớ đêm tích hợp L2 512 KB,socket 78.Northwood có 3 dòng gồm Northwood A(system bus 400 MHz),tốc độ 1.6, 8, 2.0, 2.2, 2.4, 2.5, 2.6, và 2.8 GHz.Northwoood B(system bus 533 MHz) tốc độ 26, 2.4, 2.53, 2.66, 2.8, 3.06 GHz(riêng 3.06 GHz có hỗ trợ công nghê siêu phân
0
4
1
2
luồng Hyper Threading-HT).Northwood C (system bus 800 MHz,tất ca hỗ trợ HT),gồm 2.4,2.6, 3.0, 3.2, 3.4 GHz
P4 Prescott (năm 2004).Là BXL đầu tiên san xuất theo công nghê 90nm,kích thước vi mạch giam 50% so với P4 Willamette.Điều này cho phép tích hợp nhiều transistor hơn trên cùng kích thước (125 triêu transistor so với 55 triêu transistor cua P4 Northwood),tốc độ chuyển đổi cua transistor nhanh hơn,tăng kha năng xưly,tính toan.Dung lượng bộ nhớ đêm tích hợp L2 cua P4 Prescott gấp đôi so với P4 Northwood(1MB so với 512KB).Ngoài tập lênh MMX,SSE,SSE2,Prescott được bổ sung tập lênh SSE3 giúp cac ứng dụng xưly video và game
chạy nhanh hơn.Đây là giai đoạn “giao thời ” giữa socket
478-775LGA,system bus 533 MHz-800MHz và mỗi san
phẩm được đăt tên khiên người dùng càng bối rối khi chọn
mua
Prescott A(FSB 533MHz)có cac tốc độ 2.4, 2.26, 2.8
(socket 478),Prescott 505 (2,66GHz), 505J(2.66 GHz),506
(2,66 GHz), 511 (2,8GHz), 515J (2,93GHz), 516 (2,93GHz) , 519J (3,06GHz), 519 J(3,06GHz) sưdụng socket 775LGA
Trang 6Prescott E,F (năm 2004) có bộ nhớ đêm L2 1MB(cac phiên ban sau được mở rộng 2MB),bus hê thống 800 MHz.Ngoài tập lênh MMX,SSE2,SSE3 tích hợp, Prescott E,F còn hỗ trợ công nghê siêu phân luồng,một số phiên ban sau có hỗ trợ tính toan 64 bit
Dòng sư dụng socket 478 gồm Pentium 4 HT 2.8E (2,8GHz), 3.0E (3,0 GHz), 3
4
.2E (3,2 GHz), 3.4E(3,4 GHz).Dòng sư dụng socket 775LGA gồm Pentium
HT 3.2F, 3.4F, 3.6F, 3.8F, với cac tốc độ tương ứng tư 3,2 GHz.Pentium 4
HT 517,520,520J,521,524,530,530J,531,540,540J,541,550,560,560J,561,570J,571 với cac tốc độ tư 2.8 GHz đên 3,8 GHz
*Những điểm kĩ thuật chính cua Pentium 4 bao gồm:
Tốc độ tư 1.3GHz đên 3.8GHz
phần mềm tương thích với những bộ xưly Intel 32 bit trước
Một số phiên ban hỗ trợ EM64T
Bus bộ xưly (font-side) chạyở 400MHz, 533Mhz, SOOMHz hay1066MHz Những bộ logic số học (ALUs) chạygấp hai lần tần số nhân bộ xưly
Công nghê siêu dân đường (20-30 tầng)
Công nghê siêu phân luồng hỗ trợ tất ca bộ xưly 2.4GHz và nhanh hơn chạyBus 800MHz, tất ca bộ xưly 3.06GHz và nhanh hơn chạyBus 533MHz
Thực thi tập lênh ngoài lênh chuyên nghiêp
Bộ dự đoan phụ được mở rộng
Bộ nhớ đêm LI 8KB ha>16KB cộng với bộ nhớ đêm theo vêt thực thi vi lênh 12k
Bộ nhớ đêm L2 56bit trên khuôn tốc độ nhân 256KB, 512KB, 1MB hoăc 2MB kêt hợp 8 đường
Bộ nhớ đêm L3 tốc độ nhân 2MB tích hợp trên khuôn
SSE2-SSE cộng với 144 tập lênh mới chưa xưly âm thanh và đồ họa
B Nôi dung trong tâm
I Cac công nghê mới
Kha năng cung cấp một số công nghê mới và cac tính năng được tăng cường trên đâydựa vào cac tiên bộ mới nhất cua Intel trong lĩnh vực thiêt kê mạch, quan ly viêc tiêu thụ năng lượng và tính toan không thể thực hiên được ở cac mô hình vi
Trang 7kiên trúc cua cac thê hê CPU trước Bộ dấu chấm động được mở rộng Có nhiều trạng thai năng lượng thấp hơn Intel bonhững số La Mã bằng một sự chỉ đinh 4, số A-rập tiêu chuẩn đối với Pentium 4 Bên trong pentium 4 có một kiên trúc mới mà Intel gọi là vi kiên trúc NetBurst, là thuật ngữ thitrường không phai thuật ngữ kĩ thuật Intel dùng NetBurst để thí nghiêm công nghê siêu đường dân, một bộ maythực thi nhanh, bus hê thống tốc độ cao (400MHz, 533MHz, 800MHz và 1066MHz) và bộ nhớ đêm theo vêt thực thi Công nghê siêu đường dân là làm tăng gấp đôi haygấp ba lần độ sâu đường dân tập lênh so với Pentium III ( hayAthlon/Athlon 64) nghĩa là nhiều bước nhohơn được yêu cầu để thực thi tập lênh Măc dù điều nàycó thể dường như kém hữu hiêu, nhưng nó cho phét đạt tới những xung cao hơn nhiều Bộ may thực thi nhanh cho phép hai bộ logic số nguyên ( ALUs) chạygấp đôi tần số nhanh
bộ xưly có nghĩa là có những tập lênh có thể thực thi trong nữa chu ky đồng hổ.Bus
hê thống 400MHz/533MHz/800Mhz/1066Mhz là bus quad-pumped chạyhơn đồng
hồ hê thống 100Mhz/133Mhz/200Mhz/266Mhz chuyển giao dữ liêu gấp bốn lần trong mỗi chu kì đồng hồ Bộ nhớ đêm theo vêt thực thi là bộ nhớ đêm L1 tốc độ cao chưa được lượng 12K những vi hoạt động giai mã Nó di chuyển bộ giai mã tập lênh
tư đường dân thực thi chính, làm tăng tốc độ xưly
Trong những vấn đề trên thì Bus bộ xưly tốc độ cao là đắng kể nhất, về măt ky thuật
mà nói bus bộ xưly là bus quad-pumped 100MHz, 133MHz, 200MHz hay266MHz chuyển giao dữ liêu gấp bốn lần trong một chu ky (4x) cho tốc độ hiêu dụng 400Mhz, 533Mhz,800Mhz hay1066Mhz bởi vì bus dung lượng 64bit (8byte) cho tốc độ lưu lượng 3200MBps, 4266MBps, 6400MBps hay8532MBps
Trong kiên trúc nội bộ đường dân 20 tầng hay30 tầng cua pentium 4 những tập lênh đơn biba thành nhiều tầng nhohơn so với bộ xưly trước như pentium III, làm cho nó hầu như giống bộ xưly RISC Không maylà có thể thêm vào số chu ky thực thi những tập lênh nêu chúng không được tối ưu chô bộ xưly Một ưu điểm kiên trúc quan trọng khac là công nghê siêu phân luồng, có thể được tìm thấytrong tất ca Pentium 4 2.4GHz và nhanh hơn chạybus 800MHz haytất ca Pentium 4 3.06GHz và nhanh hơn chạybus 533Mhz Siêu phân luồng cho phép một bộ xưly đơn chạyhai luồng cùng thời, hoạt động như thê nó là hai bộ xưly thayvì một
Trang 8Pentium 4 đời đầu sưdụng socket 423 có 423 chân trong sự sắp xêp SPGA 39x39 Nhưng phiên ban sau cùng socket 47H, phiên ban hiên naydùng socket T (I.GA775)
có những chân thêm để hỗ trợ tính năng mới như EM64T ( sự mở rộng 64 bit), bit vô hiêu hóa thực thi ( sự bao vê chống những tan công cua tràn bộ nhớ đêm), công nghê
ao Intel, và những tính năng tiên tieean khac Celeron không bao giờ được thiêt kê để làm viêc trong socket 423, nhưng celeron và celeron D có socket 478 haysocket T ( LGA775), cho phép hê thống hạ giaso với Pentium 4 Bộ chọn điên ap được tạo ra nhờ vào Module điều chỉnh điên ap tự động được đăt trên bo mạch chỉ và được nối đên socket
1 Hyper-Pipelined Technology- Công nghê Siêu ống
Là công nghê mới được giới thiêu trong Vi kiên trúc Netburst™ cua Intel Nó tăng gấp đôi "độ sâu" cua "ống" xư ly lênh cua CPU khi so sanh với mô hình Vi kiên trúc P6 được sư dụng ở cac thê hê CPU Pentium III Lênh được thực hiên trong
20 giai đoạn (20 stages) trong vi kiên trúc Netburst, so với 10 giai đoạn trong vi kiên trúc P6 Ống lênh dài giúp chip Pentium 4 có thể đạt được mức xung nhip cao hơn
2 Execution Trace Cache
Là bộ nhớ đêm cấp 1 Bên cạnh 8KB bộ nhớ đêm dùng để chứa dữ liêu , Pentium 4 có kha năng lưu trữ đên 12K vi lênh đã được giai mã nhằm giúp tăng cường tốc độ thực thi lênh cua CPU
3 Rapid Execution Engine - Cơ chê thực thi (lênh) nhanh chóng
Điều nàyđược thực hiên dựa trên hai Đơn vi Luận ly Số Học được thiêt kê bên trong Pentium 4 Nó cho phép Pentium 4 thực hiên cac lênh số học (cộng, trư, nhân chia) và luận ly (And, Or ) chính với tốc độ gấp 2 lần tần số xư ly cơ ban cua bộ xư
ly Như vậyCPU Pentium 4 - 2.0Ghz có kha năng thực hiên cac lênh trên với tốc
độ 4.0Ghz và CPU Pentium 4 - 2.53Ghz thực hiên với tốc độ 5.1Ghz
4 Advanced Transfer Cache (ATC)
Là bộ nhớ đêm cấp 2 (L2 Cache) được thiêt kê bên trong Pentium 4 ATC có hai loại: 512 KB L2 ATC với cac tốc độ CPU 2.8Ghz 2.53Ghz 2.40Ghz
-.40(B)Ghz -2.26Ghz - 2.20Ghz - 2.0(A)Ghz và 1.6(A)Ghz; 256 KB L2 ATC với cac 2
tốc độ tư 1.2Ghz - 2.0Ghz ATC cung cấp kênh truyền có thông lượng rất cao với nhân cua CPU ATC bao gồm một giao diên 256-bit (32 byte) để truyền dữ liêu
Trang 9trên mỗi xung clock Điều nàycho phép ATC (L2 Cache) hỗ trợ tốc độ cao gấp 4 lần tốc độ truyền dữ liêu cua L2 Cache sưdụng trong cac CPU Pentium III
Ví dụ: CPU Pentium 4 - 2.53Ghz có tốc độ truyền dữ liêu lên tới 81GB/giây,
so với tốc độ truyền dữ liêu 16GB/giâycua Pentium III - 1.0 Ghz
5 Out-Of-Order Execution
Nhân hỗ trợ Out-of-Order Execution có thể sắp xêp lại cac vi lênh, cho phép lênh (cùng với đầu vào và cac tài nguyên hê thống cần thiêt) để thực thi ngaykhi có thể và tranh lãng phí thời gian Khi một vi lênh đang chờ được cấp phat tài nguyên hoăc dữ liêu, cac lênh khac (thường là trong buffer) có thể chen vào thực thi Nhờ thực thi cac
lênh song song, những khoang trễ cua pipeline biloại bo Nhân có thể thực thi nhiều lênh trong mỗi giai đoạn cua pipeline Sau đó in-order retirement unit sẽ tìm cac lênh được hiên xong và không còn phụ thuộc dữ liêu cũng như liên quan đên cac lênh rẽ nhanh chưa hoàn thất để xưly và lưu kêt qua ra bộ nhớ theo trật tự ban đầu cua nó
6 Branch Prediction (phong đoan nhanh)
Kiên trúc NetBurst có thể nhớ được cac nhanh trong chương trình chạy, giúp làm giam độ trễ trong quatrình nhayvà nạp đầyống lênh , Cac nhanh được lưu giữ trên cơ
sở đia chỉ lênh bên trong Branch Target Buffer (BTB) Bộ vi xưly có thể dự đoan được cac nhanh sắp tới trước ca khi lênh rẽ nhanh được thực hiên
7 Rapid Execution Engine
Trong Pentium 4, có 2 ALU và hai AGU chạyvới mức xung gấp đôi xung clock Rapid execution engine được giới thiêu là làm giam độ trễ cua viêc thực hiên cac phép toan đơn gian Điều này thực sự có y nghĩa vì hiêu năng và tốc độ cua
vi xư ly phụ thuộc rất nhiều vào cac tính toan số nguyên trên ALU
8 Quad Data Rate
FSB cua Pentium 4 có thể truyền bốn lần dữ liêu trong một xung clock Công nghê nàylà Quad Pumped haycòn gọi là Quad Data Rate (QDR).QDR khiên cho xung nhip hiêu dụng tăng lên gấp 4 lần so với xung thực Nhờ đó cac CPU Pentium 4 có thể đạt đên 400Mhz System bus, tốc độ truyền nhận dữ liêu vào-ra CPU là 3.2GBps
so với tốc độ tương ứng là 1.06GBps cua Pentium III (133Mhz system bus)
Real Clock Performance Tranfer Rate
Trang 101 1 2 2
00MHz 33MHz 00MHz 66MHz
400MHz 533MHz 800MHz 1066MHz
3.2GB/s 4.2GB/s 6.4GB/s 8.5GB/s
9 Enhanced Floating Point & Multimedia Unit
Bộ xư ly Pentium 4 mở rộng cac thanh ghi dấu chấm động lên tới 128bit và tạo thêm một thanh ghi mở rộng nhằm phục vụ viêc di chuyển dữ liêu
Do vậy, kha năng xư ly cac ứng dụng dấu chấm động (tính toan kêt cấu, số liêu tài chính, số liêu khoa học…) và truyền thông đa phương tiên (dựng và xư ly phim video, xưly hình anh đồ họa…) được tăng cường rất nhiều
10 Streaming SIMD Extension 2 (SSE2) Instructions
Là tập lênh hỗ trợ đồ họa mở rộng được thiêt kê cho Pentium 4 Vi kiên trúc Netburst
mở rộng kha năng xưly theo kiểu cấu trúc SIMD cua cac công nghê Intel® MMX™
và SSE bằng cach thêm vào 144 lênh mới Cac lênh nàybao gồm cac tac vụ số nguyên SIMD 128-bit và cac tac vụ dấu chấm động Cac lênh mới nàylàm tối ưu hóa kha năng thực hiên cac ứng dụng như phim video, xưly âm thanh - hình anh, mã hóa, tính toan khoa học
11 Hyper Threading (siêu phân luồng)
Hyper threading là công nghê cho phép một CPU vật ly hoạt động trên hê điều hành như là hai CPU logic hoạt động song song Nó dựa trên nguyên tắc là vào một thời điểm chỉ có một phần tài nguyên cua CPU được sư dụng để thực thi lênh cua một tiên trình, những phần chưa được sưdụng có thể được dùng để thực thi cac tiên trình khac.Trong cac CPU sưdụng công nghê Hyper-Threading, mỗi CPU logic sở hữu một tập cac thanh ghi, kể ca thanh ghi đêm chương trình PC riêng , CPU vật ly sẽ luân phiên cac giai đoạn tìm/giai mã giữa hai CPU logic và chỉ cố gắng thực thi những thao tac tư hai chuỗi lênh đồng thời theo cach hướng tới những đơn vithực thi ít được
sưdụng