Pentium 4 là bộ vi xử lý kiến trúc x86 thế hệ thứ 7 do Intel sản xuất, và là thiết kế CPU hoàn toàn mới đầu tiên của họ kể từ Pentium III năm 1995. Thiết kế mới này được gọi là kiến trúc NetBurst. Không như Pentium II, Pentium III, và các loại Celeron khác nhau, kiến trúc này khác được tạo mới hoàn toàn và thừa kế rất ít từ thiết kế Pentium ProP6.Bộ vi xử lý Pentium 4 đầu tiên, mã hiệu là Willamette, chạy với tốc độ 1.4 và 1.5 GHz và đã được phát hành vào tháng 11 năm 2000 trên nền Socket 423, và sau đó đã chạy với tốc độ từ 1.5 GHz tới 2 GHz trên Socket 478. Được ghi nhận cùng với sự ra đời của Pentium 4 là bus FSB(Front side bus) nhanh với tốc độ 400 MTs. Khi đó, chip AMD Athlon đang chạy với tốc độ 266 MTs.
Trang 1Trường đại học công nghiệp Hà nội
Khoa Công Nghệ Thông Tin
- -BÀI TIỂU LUẬN MÔN HỌC: KIẾN TRÚC MÁY TÍNH
ĐỀ TÀI: Nghiên cứu tìm hiểu về thế hệ vi xử lý InTel Pentium IV
Giáo viên hướng dẫn: Nguyễn Thanh Hải
Lớp: Đại học KTPM3-K9
Nhóm sô: 3
Hà Nội, ngày 1 tháng 11 năm 2015
Trường đại học công nghiệp Hà nội
Khoa Công Nghệ Thông Tin
Trang 2Báo cáo bài tập lớn môn học: Kiến trúc Máy tính
ĐỀ TÀI: Nghiên cứu tìm hiểu về thế hệ vi xử lý InTel Pentium IV
Nhóm thực hiện: Nhóm 3–Lớp KTPM3-K9
Thành viên trong nhóm:
1 Leo thị lan Hương
2 Trần hải Linh
3 Nguyễn thị Nga
4 Nguyễn thị Nhã
5 Trần thị Quyên
Giáo viên hướng dẫn: Nguyễn Thanh Hải
(GV Kiến Trúc Máy Tính)
Hà Nội ,ngày 1 tháng 11 năm 2015
Mở đầu
1 Nhiệm vụ của bài
Nghiên cứu tìm hiểu về thế hệ vi xử lý InTel Pentium IV.
2 Bố cục
* Lịch sử phát triển của VXL Pentium IV :
- Hoàn cảnh ra đời của VXL Pentium IV.
- Đặc trưng công nghệ chung của VXL Pentium IV.
* Đặc trưng công nghệ chi tiết của từng loại biến thể (version) của VXL Pentium IV
Trang 3 Nội dung
A.Lịch sử phát triển của VXL Pentium IV
Pentium 4 là bộ vi xử lý kiến trúc x86 thế hệ thứ 7 do Intel sản xuất, và là thiết kế
CPU hoàn toàn mới đầu tiên của họ kể từ Pentium III năm 1995 Thiết kế mới này
được gọi là kiến trúc NetBurst Không như Pentium II, Pentium III, và các
loại Celeron khác nhau, kiến trúc này khác được tạo mới hoàn toàn và thừa kế rất ít từ thiết kế Pentium Pro/P6
Bộ vi xử lý Pentium 4 đầu tiên, mã hiệu là "Willamette", chạy với tốc độ 1.4 và
1.5 GHz và đã được phát hành vào tháng 11 năm 2000 trên nền Socket 423, và sau đó
đã chạy với tốc độ từ 1.5 GHz tới 2 GHz trên Socket 478 Được ghi nhận cùng với sự
ra đời của Pentium 4 là bus FSB(Front side bus) nhanh với tốc độ 400 MT/s Khi đó,
chip AMD Athlon đang chạy với tốc độ 266 MT/s
Dòng vi xử lý Pentium 4 đã kết thúc vào
ngày 27 tháng 7 năm 2006, được thay thể bởi
dòng Intel Core 2 - dòng sử dụng nhân
"Conroe"
Pentium 4 được sản xuất vào tháng 11 năm 2011
và được giới thiệu là bộ vi xử lý thế hệ mới
Nếu bộ vi xử lý này được đặt số thay vì tên nó
sẽ được gọi là 786 bởi vì nó đại diện cho một
thế hệ sau những bộ xử lý 686 Vài hình thức
khác nhau của Pentium 4 được ra mắt công
chúng được dựa trên kiến trúc và khuôn bộ xử
lý được dựa trên các nhân Willametter,
Northwood và Prescott
3
Pentium 4
Produced From 2000 to 2008
Max CPU clock rate
1.30 GHz to 3.80 GHz
FSB speeds 400 MT/s to 1066 MT/s
Instruction set x86 (i386), x86-64, MM
X,SSE, SSE2, SSE3
Microarchitecture NetBurst
Transistors 42M 180nm
55M 130nm 169M 130nm (P4EE) 125M 90nm
188M 65nm
Socket(s) Socket 423
Socket 478 LGA 775
Predecessor Pentium III
Trang 4Một số công nghệ nổi bật được áp dụng trong kiến trúc
NetBurst như Hyper Pipelined Technology(Công nghệ siêu
ống) mở rộng số hàng lệnh xử lý, làm hiệu suất máy có thể
tăng 30% Execution Trace Cache tránh tình trạng lệnh bị
chậm trễ khi chuyển từ bộ nhớ dến CPU, Rapid Execution
Engine tang tốc bộ đồng xử lý toán học, bus hệ thống
(system bus) 400 MHz và 533 MHz; các công nghệ
Advanced Transfer Cache, Advanced Dynamic Execution,
Enhanced Floating point và Multimedia Unit, Streaming SIMD Extensions 2 (SSE2) cũng được cải tiến nhằm tạo ra những BXL tốc độ cao hơn, khả năng tính toán mạnh hơn, xử lý đa phương tiện tốt hơn Ghi nhận cùng với sự ra đời của Pentium 4 là công nghệ Quad Data Rate cho phép FSB (Front Side Bus) đạt đến tốc
độ 400 MHz Khi đó, chip AMD Athlon đang chạy với tốc độ FSB là 266 MHz (công nghệ Double Data Rate)
Bộ vi xử lí Pentium IV có đến 42 triệu Tranzito,kích thước chết của nó là 217 mm2,công suất tiêu thụ 55 W khi làm việc ở mức 1,5GHz.Tốc độ bus hệ thống 3,2 GB/s , rất cao ở thời diểm bấy giờ
Bảng: So sánh hiệu suất Pentium 3 và Pentium 4
Bảng trên là sự so sánh hiệu suất của Pentium IV 1,5GHz và Petium III 1,0
GHz.Rõ ràng ta có thể thấy tính vượt trội dành cho Pentium IV.Các ứng dụng số
Trang 5nguyên cao hơn 15-20 %,trong khi Ứng dụng dấu chấm động và multimedia lên tới 30-70%
Pentium 4 đầu tiên (tên mã là Willamette) xuất hiện cuối năm 2000 đặt dấu chấm hết cho “triều đại” Pentium III Willamette xuất sản xuất trên công nghệ 0,18
có 42 triệu transistor(nhiều hơn gần 50% so với Pentium III),bus hệ thống (system bus) 400 MHz,bộ nhớ đệm tích hợp L2 256 KB,socket 423 và 478 , Socket 423 chỉ xuất hiện trong khoảng thời gian rất ngắn, từ tháng 11 năm 2000 đến tháng 8 năm
2001 và bị thay thế bởi socket 478 P4 Willamette có tốc độ như 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9 , 2.0 GHz
P4 Northwood xuất hiện vào tháng 1 năm 2002,được sản xuất trên công nghệ 0,13, có khoảng 55 triệu transistor,bộ nhớ đệm tích hợp L2 512 KB,socket 478.Northwood có 3 dòng gồm Northwood A(system bus 400 MHz),tốc độ 1.6, 1.8, 2.0, 2.2, 2.4, 2.5, 2.6, và 2.8 GHz.Northwoood B(system bus 533 MHz) tốc độ 2.26, 2.4, 2.53, 2.66, 2.8, 3.06 GHz(riêng 3.06 GHz có hỗ trợ công nghệ siêu phân luồng Hyper Threading-HT).Northwood C (system bus 800 MHz,tất cả hỗ trợ HT),gồm 2.4,2.6, 3.0, 3.2, 3.4 GHz
P4 Prescott (năm 2004).Là BXL đầu tiên sản xuất theo công nghệ 90nm,kích thước vi mạch giảm 50% so với P4 Willamette.Điều này cho phép tích hợp nhiều transistor hơn trên cùng kích thước (125 triệu transistor so với 55 triệu transistor của P4 Northwood),tốc độ chuyển đổi của transistor nhanh hơn,tăng khả năng xử lý,tính toán.Dung lượng bộ nhớ đệm tích hợp L2 của P4 Prescott gấp đôi so với P4 Northwood(1MB so với 512KB).Ngoài tập lệnh MMX,SSE,SSE2,Prescott được bổ sung tập lệnh SSE3 giúp các ứng dụng xử lý video và game
chạy nhanh hơn.Đây là giai đoạn “giao thời ” giữa socket
478-775LGA,system bus 533 MHz-800MHz và mỗi sản
phẩm được đặt tên khiến người dùng càng bối rối khi chọn
mua
Prescott A(FSB 533MHz)có các tốc độ 2.4, 2.26, 2.8
(socket 478),Prescott 505 (2,66GHz), 505J(2.66 GHz),506
(2,66 GHz), 511 (2,8GHz), 515J (2,93GHz), 516 (2,93GHz) , 519J (3,06GHz), 519 J(3,06GHz) sử dụng socket 775LGA
Trang 6Prescott E,F (năm 2004) có bộ nhớ đệm L2 1MB(các phiên bản sau được mở rộng 2MB),bus hệ thống 800 MHz.Ngoài tập lệnh MMX,SSE2,SSE3 tích hợp, Prescott E,F còn hỗ trợ công nghệ siêu phân luồng,một số phiên bản sau có hỗ trợ tính toán 64 bit
Dòng sử dụng socket 478 gồm Pentium 4 HT 2.8E (2,8GHz), 3.0E (3,0 GHz), 3.2E (3,2 GHz), 3.4E(3,4 GHz).Dòng sử dụng socket 775LGA gồm Pentium 4HT 3.2F, 3.4F, 3.6F, 3.8F, với các tốc độ tương ứng từ 3,2 GHz.Pentium 4
HT 517,520,520J,521,524,530,530J,531,540,540J,541,550,560,560J,561,570J,571 với các tốc độ từ 2.8 GHz đến 3,8 GHz
*Những điểm kĩ thuật chính của Pentium 4 bao gồm:
Tốc độ từ 1.3GHz đến 3.8GHz
phần mềm tương thích với những bộ xử lý Intel 32 bit trước
Một số phiên bản hỗ trợ EM64T
Bus bộ xử lý (font-side) chạy ở 400MHz, 533Mhz, SOOMHz hay 1066MHz
Những bộ logic số học (ALUs) chạy gấp hai lần tần số nhân bộ xử lý
Công nghệ siêu dẫn đường (20-30 tầng)
Công nghệ siêu phân luồng hỗ trợ tất cả bộ xử lý 2.4GHz và nhanh hơn chạy Bus 800MHz, tất cả bộ xử lý 3.06GHz và nhanh hơn chạy Bus 533MHz
Thực thi tập lệnh ngoài lệnh chuyên nghiệp
Bộ dự đoán phụ được mở rộng
Bộ nhớ đệm LI 8KB ha>16KB cộng với bộ nhớ đệm theo vết thực thi vi lệnh 12k
Bộ nhớ đệm L2 56bit trên khuôn tốc độ nhân 256KB, 512KB, 1MB hoặc 2MB kết hợp 8 đường
Bộ nhớ đệm L3 tốc độ nhân 2MB tích hợp trên khuôn
SSE2-SSE cộng với 144 tập lệnh mới chưa xử lý âm thanh và đồ họa
B Nội dung trọng tâm
I Các công nghệ mới
Khả năng cung cấp một số công nghệ mới và các tính năng được tăng cường trên đây dựa vào các tiến bộ mới nhất của Intel trong lĩnh vực thiết kế mạch, quản lý việc tiêu thụ năng lượng và tính toán không thể thực hiện được ở các mô hình vi kiến trúc của các thế hệ CPU trước Bộ dấu chấm động được mở rộng Có nhiều trạng thái năng lượng thấp hơn Intel bỏ những số La Mã bằng một sự chỉ định 4, số Ả-rập tiêu chuẩn đối với Pentium 4 Bên trong pentium 4 có một kiến trúc mới mà
Trang 7Intel gọi là vi kiến trúc NetBurst, là thuật ngữ thị trường không phải thuật ngữ kĩ thuật Intel dùng NetBurst để thí nghiệm công nghệ siêu đường dẫn, một bộ máy thực thi nhanh, bus hệ thống tốc độ cao (400MHz, 533MHz, 800MHz và 1066MHz) và bộ nhớ đệm theo vết thực thi Công nghệ siêu đường dẫn là làm tăng gấp đôi hay gấp ba lần độ sâu đường dẫn tập lệnh so với Pentium III ( hay Athlon/Athlon 64) nghĩa là nhiều bước nhỏ hơn được yêu cầu để thực thi tập lệnh Mặc dù điều này có thể dường như kém hữu hiệu, nhưng nó cho phét đạt tới những xung cao hơn nhiều Bộ máy thực thi nhanh cho phép hai bộ logic số nguyên ( ALUs) chạy gấp đôi tần số nhanh
bộ xử lý có nghĩa là có những tập lệnh có thể thực thi trong nữa chu kỳ đồng hổ.Bus hệ thống 400MHz/533MHz/800Mhz/1066Mhz là bus quad-pumped chạy hơn đồng
hồ hệ thống 100Mhz/133Mhz/200Mhz/266Mhz chuyển giao dữ liệu gấp bốn lần trong mỗi chu kì đồng hồ Bộ nhớ đệm theo vết thực thi là bộ nhớ đệm L1 tốc độ cao chưa được lượng 12K những vi hoạt động giải mã Nó di chuyển bộ giải mã tập lệnh từ đường dẫn thực thi chính, làm tăng tốc độ xử lý
Trong những vấn đề trên thì Bus bộ xử lý tốc độ cao là đắng kể nhất, về mặt kỹ thuật
mà nói bus bộ xử lý là bus quad-pumped 100MHz, 133MHz, 200MHz hay 266MHz chuyển giao dữ liệu gấp bốn lần trong một chu kỳ (4x) cho tốc độ hiệu dụng 400Mhz, 533Mhz,800Mhz hay 1066Mhz bởi vì bus dung lượng 64bit (8byte) cho tốc độ lưu lượng 3200MBps, 4266MBps, 6400MBps hay 8532MBps
Trong kiến trúc nội bộ đường dẫn 20 tầng hay 30 tầng của pentium 4 những tập lệnh đơn bị bả thành nhiều tầng nhỏ hơn so với bộ xử lý trước như pentium III, làm cho nó hầu như giống bộ xử lý RISC Không may là có thể thêm vào số chu kỳ thực thi những tập lệnh nếu chúng không được tối ưu chô bộ xử lý Một ưu điểm kiến trúc quan trọng khác là công nghệ siêu phân luồng, có thể được tìm thấy trong tất cả Pentium 4 2.4GHz và nhanh hơn chạy bus 800MHz hay tất cả Pentium 4 3.06GHz và nhanh hơn chạy bus 533Mhz Siêu phân luồng cho phép một bộ xử lý đơn chạy hai luồng cùng thời, hoạt động như thế nó là hai bộ xử lý thay vì một
Pentium 4 đời đầu sử dụng socket 423 có 423 chân trong sự sắp xếp SPGA 39x39 Nhưng phiên bản sau cùng socket 47H, phiên bản hiện nay dùng socket T (I.GA775)
có những chân thêm để hỗ trợ tính năng mới như EM64T ( sự mở rộng 64 bit), bit vô
Trang 8hiệu hóa thực thi ( sự bảo vệ chống những tán công của tràn bộ nhớ đệm), công nghệ ảo Intel, và những tính năng tiên tieean khác Celeron không bao giờ được thiết kế để làm việc trong socket 423, nhưng celeron và celeron D có socket 478 hay socket T ( LGA775), cho phép hệ thống hạ giá so với Pentium 4 Bộ chọn điện áp được tạo ra nhờ vào Module điều chỉnh điện áp tự động được đặt trên bo mạch chỉ và được nối đến socket
1 Hyper-Pipelined Technology - Công nghệ Siêu ống
Là công nghệ mới được giới thiệu trong Vi kiến trúc Netburst™ của Intel Nó tăng gấp đôi "độ sâu" của "ống" xử lý lệnh của CPU khi so sánh với mô hình Vi kiến trúc P6 được sử dụng ở các thế hệ CPU Pentium III Lệnh được thực hiện trong
20 giai đoạn (20 stages) trong vi kiến trúc Netburst, so với 10 giai đoạn trong vi kiến trúc P6 Ống lệnh dài giúp chip Pentium 4 có thể đạt được mức xung nhịp cao hơn
2 Execution Trace Cache
Là bộ nhớ đệm cấp 1 Bên cạnh 8KB bộ nhớ đệm dùng để chứa dữ liệu , Pentium 4 có khả năng lưu trữ đến 12K vi lệnh đã được giải mã nhằm giúp tăng cường tốc độ thực thi lệnh của CPU
3 Rapid Execution Engine - Cơ chế thực thi (lệnh) nhanh chóng
Điều này được thực hiện dựa trên hai Đơn vị Luận lý Số Học được thiết kế bên trong Pentium 4 Nó cho phép Pentium 4 thực hiện các lệnh số học (cộng, trừ, nhân chia) và luận lý (And, Or ) chính với tốc độ gấp 2 lần tần số xử lý cơ bản của bộ xử lý Như vậy CPU Pentium 4 - 2.0Ghz có khả năng thực hiện các lệnh trên với tốc
độ 4.0Ghz và CPU Pentium 4 - 2.53Ghz thực hiện với tốc độ 5.1Ghz
4 Advanced Transfer Cache (ATC)
Là bộ nhớ đệm cấp 2 (L2 Cache) được thiết kế bên trong Pentium 4 ATC có hai loại: 512 KB L2 ATC với các tốc độ CPU 2.8Ghz - 2.53Ghz - 2.40Ghz -
2.40(B)Ghz -2.26Ghz - 2.20Ghz - 2.0(A)Ghz và 1.6(A)Ghz; 256 KB L2 ATC với các tốc độ từ 1.2Ghz - 2.0Ghz ATC cung cấp kênh truyền có thông lượng rất cao với nhân của CPU ATC bao gồm một giao diện 256-bit (32 byte) để truyền dữ liệu trên mỗi xung clock Điều này cho phép ATC (L2 Cache) hỗ trợ tốc độ cao gấp 4 lần tốc độ truyền dữ liệu của L2 Cache sử dụng trong các CPU Pentium III
Trang 9Ví dụ: CPU Pentium 4 - 2.53Ghz có tốc độ truyền dữ liệu lên tới 81GB/giây,
so với tốc độ truyền dữ liệu 16GB/giây của Pentium III - 1.0 Ghz
5 Out-Of-Order Execution
Nhân hỗ trợ Out-of-Order Execution có thể sắp xếp lại các vi lệnh, cho phép lệnh (cùng với đầu vào và các tài nguyên hệ thống cần thiết) để thực thi ngay khi có thể và tránh lãng phí thời gian Khi một vi lệnh đang chờ được cấp phát tài nguyên hoặc dữ liệu, các lệnh khác (thường là trong buffer) có thể chen vào thực thi Nhờ thực thi các
lệnh song song, những khoảng trễ của pipeline bị loại bỏ Nhân có thể thực thi nhiều lệnh trong mỗi giai đoạn của pipeline Sau đó in-order retirement unit sẽ tìm các lệnh được hiện xong và không còn phụ thuộc dữ liệu cũng như liên quan đến các lệnh rẽ nhánh chưa hoàn thất để xử lý và lưu kết quả ra bộ nhớ theo trật tự ban đầu của nó
6 Branch Prediction (phỏng đoán nhánh)
Kiến trúc NetBurst có thể nhớ được các nhánh trong chương trình chạy, giúp làm giảm độ trễ trong quá trình nhảy và nạp đầy ống lệnh , Các nhánh được lưu giữ trên cơ
sở địa chỉ lệnh bên trong Branch Target Buffer (BTB) Bộ vi xử lý có thể dự đoán được các nhánh sắp tới trước cả khi lệnh rẽ nhánh được thực hiện
7 Rapid Execution Engine
Trong Pentium 4, có 2 ALU và hai AGU chạy với mức xung gấp đôi xung clock Rapid execution engine được giới thiệu là làm giảm độ trễ của việc thực hiện các phép toán đơn giản Điều này thực sự có ý nghĩa vì hiệu năng và tốc độ của
vi xử lý phụ thuộc rất nhiều vào các tính toán số nguyên trên ALU
8 Quad Data Rate
FSB của Pentium 4 có thể truyền bốn lần dữ liệu trong một xung clock Công nghệ này là Quad Pumped hay còn gọi là Quad Data Rate (QDR).QDR khiến cho xung nhịp hiệu dụng tăng lên gấp 4 lần so với xung thực Nhờ đó các CPU Pentium 4 có thể đạt đến 400Mhz System bus, tốc độ truyền nhận dữ liệu vào-ra CPU là 3.2GBps
so với tốc độ tương ứng là 1.06GBps của Pentium III (133Mhz system bus)
Real Clock Performance Tranfer Rate
Trang 10200MHz 800MHz 6.4GB/s
9 Enhanced Floating Point & Multimedia Unit
Bộ xử lý Pentium 4 mở rộng các thanh ghi dấu chấm động lên tới 128bit và tạo thêm một thanh ghi mở rộng nhằm phục vụ việc di chuyển dữ liệu
Do vậy, khả năng xử lý các ứng dụng dấu chấm động (tính toán kết cấu, số liệu tài chính, số liệu khoa học…) và truyền thông đa phương tiện (dựng và xử lý phim video, xử lý hình ảnh đồ họa…) được tăng cường rất nhiều
10 Streaming SIMD Extension 2 (SSE2) Instructions
Là tập lệnh hỗ trợ đồ họa mở rộng được thiết kế cho Pentium 4 Vi kiến trúc Netburst
mở rộng khả năng xử lý theo kiểu cấu trúc SIMD của các công nghệ Intel® MMX™
và SSE bằng cách thêm vào 144 lệnh mới Các lệnh này bao gồm các tác vụ số nguyên SIMD 128-bit và các tác vụ dấu chấm động Các lệnh mới này làm tối ưu hóa khả năng thực hịên các ứng dụng như phim video, xử lý âm thanh - hình ảnh, mã hóa, tính toán khoa học
11 Hyper Threading (siêu phân luồng)
Hyper threading là công nghệ cho phép một CPU vật lý hoạt động trên hệ điều hành như là hai CPU logic hoạt động song song Nó dựa trên nguyên tắc là vào một thời điểm chỉ có một phần tài nguyên của CPU được sử dụng để thực thi lệnh của một tiến trình, những phần chưa được sử dụng có thể được dùng để thực thi các tiến trình khác.Trong các CPU sử dụng công nghệ Hyper-Threading, mỗi CPU logic sở hữu một tập các thanh ghi, kể cả thanh ghi đếm chương trình PC riêng , CPU vật lý sẽ luân phiên các giai đoạn tìm/giải mã giữa hai CPU logic và chỉ cố gắng thực thi những thao tác từ hai chuỗi lệnh đồng thời theo cách hướng tới những đơn vị thực thi ít được sử dụng