1. Trang chủ
  2. » Luận Văn - Báo Cáo

Báo cáo thực tập: nghiên cứu tìm hiểu về CPU

52 1,6K 7

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 52
Dung lượng 1,88 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

I. Lịch sử ra đời và phát triển CPU CPU là từ viết tắt của cụm Central Processing Unit (Đơn Vị Xử Lý Trung Tâm), là một bộ phận tính toán chính của máy tính. Nó được cấu thành bởi đơn vị số học-lôgic (ALU) và đơn vị điều khiển. Ngày nay, CPU trong hầu hết các máy tính được chứa trọn vẹn trên một chip đơn. Cpu là một linh kiện rất phổ biến, là "bộ não" của những máy tính ngày nay. Nhưng ít ai biết rằng con CPU đầu tiên của thế giới đã ra đời từ cách đây hơn 40 năm. 1. BXL 4bit 4004 là BXL đầu tiên được Intel giới thiệu vào tháng 11 năm 1971, sử dụng trong máy tính (calculator) của Busicom. 4004 có tốc độ 740KHz, khả năng xử lý 0,06 triệu lệnh mỗi giây (milion instructions per second - MIPS); được sản xuất trên công nghệ 10 µm, có 2.300 transistor (bóng bán dẫn), bộ nhớ mở rộng đến 640 byte. 4040 phiên bản cải tiến của 4004 được giới thiệu vào năm 1974, có 3.000 transistor, tốc độ từ 500 KHz đến 740KHz. 2. BXL 8bit 8008 (năm 1972) được sử dụng trong thiết bị đầu cuối Datapoint 2200 của Computer Terminal Corporation (CTC). 8008 có tốc độ 200kHz, sản xuất trên công nghệ 10 µm, với 3.500 transistor, bộ nhớ mở rộng đến 16KB. 8080 (năm 1974) sử dụng trong máy tính Altair 8800, có tốc độ gấp 10 lần 8008 (2MHz), sản xuất trên công nghệ 6 µm, khả năng xử lý 0,64 MIPS với 6.000 transistor, có 8 bit bus dữ liệu và 16 bit bus địa chỉ, bộ nhớ mở rộng tới 64KB. 8085 (năm 1976) sử dụng trong Toledo scale và những thiết bị điều khiển ngoại vi. 8085 có tốc độ 2MHz, sản xuất trên công nghệ 3 µm, với 6.500 transistor, có 8 bit bus dữ liệu và 16 bit bus địa chỉ, bộ nhớ mở rộng 64KB 3. BXL 16bit 8086 xuất hiện tháng 6 năm 1978, sử dụng trong những thiết bị tính toán di động. 8086 được sản xuất trên công nghệ 3 µm, với 29.000 transistor, có 16 bit bus dữ liệu và 20 bit bus địa chỉ, bộ nhớ mở rộng 1MB. Các phiên bản của 8086 gồm 5, 8 và 10 MHz. 8088 trình làng vào tháng 6 năm 1979, là BXL được IBM chọn đưa vào chiếc máy tính (PC) đầu tiên của mình; điều này cũng giúp Intel trở thành nhà sản xuất BXL máy tính lớn nhất trên thế giới. 8088 giống hệt 8086 nhưng có khả năng quản lý địa chỉ dòng lệnh. 8088 cũng sử dụng công nghệ 3 µm, 29.000 transistor, kiến trúc 16 bit bên trong và 8 bit bus dữ liệu ngoài, 20 bit bus địa chỉ, bộ nhớ mở rộng tới 1MB. Các phiên bản của 8088 gồm 5 MHz và 8 MHz.

Trang 1

Lời nói đầu

Ngày nay khoa học kỹ thuật trên thế giới nói chung, ở Việt Nam nói riêng đang trên đà phát triển mạnh mẽ và không ngừng nâng cao phát triển về mọi mặt Đặc biệt là ngành công nghệ thông tin

Để đáp ứng nhu cầu ngày càng cao của con người thì hàng loạt các công ty về máy tính được ra đời và các ứng dụng công nghệ thông tin đang được áp dụng ngày một nhiều hơn.Với công nghệ máy tính hiện đại như ngày nay thì con người dần dần được giải phóng bởi những công việc nặng nhọc và thay vào đó

là những ứng dụng của công nghệ thông tin ngày một hiện đại và kỹ xảo như các robot, máy tự động, các phần mềm quản lý và rất nhiều các ứng dụng đang được áp dụng ngoài thực tiễn

Trong đó, phải kể tới bộ não của máy tính đơn vị xử lí trung tâm CPU là bộ phận tính toán chính của máy tính Nhận thấy tầm quan trọng của nó, em chọn

đề tài thực tập “nghiên cứu tìm hiểu về CPU”

Trang 2

I Lịch sử ra đời và phát triển CPU

CPU là từ viết tắt của cụm Central Processing Unit (Đơn Vị Xử Lý Trung Tâm),

là một bộ phận tính toán chính của máy tính Nó được cấu thành bởi đơn vị số lôgic (ALU) và đơn vị điều khiển Ngày nay, CPU trong hầu hết các máy tính được chứa trọn vẹn trên một chip đơn

học-Cpu là một linh kiện rất phổ biến, là "bộ não" của những máy tính ngày nay

Nhưng ít ai biết rằng con CPU đầu tiên của thế giới đã ra đời từ cách đây hơn 40 năm

1 BXL 4bit

4004 là BXL đầu tiên được Intel giới thiệu vào tháng 11 năm 1971, sử dụng trong

máy tính (calculator) của Busicom 4004 có tốc độ 740KHz, khả năng xử lý 0,06 triệu lệnh mỗi giây (milion instructions per second - MIPS); được sản xuất trên công nghệ 10 µm, có 2.300 transistor (bóng bán dẫn), bộ nhớ mở rộng đến 640 byte

4040 phiên bản cải tiến của 4004 được giới thiệu vào năm 1974, có 3.000 transistor,

tốc độ từ 500 KHz đến 740KHz

2 BXL 8bit

8008 (năm 1972) được sử dụng trong thiết bị đầu cuối Datapoint 2200 của

Computer Terminal Corporation (CTC) 8008 có tốc độ 200kHz, sản xuất trên công nghệ 10 µm, với 3.500 transistor, bộ nhớ mở rộng đến 16KB

8080 (năm 1974) sử dụng trong máy tính Altair 8800, có tốc độ gấp 10 lần 8008

(2MHz), sản xuất trên công nghệ 6 µm, khả năng xử lý 0,64 MIPS với 6.000

transistor, có 8 bit bus dữ liệu và 16 bit bus địa chỉ, bộ nhớ mở rộng tới 64KB

8085 (năm 1976) sử dụng trong Toledo scale và những thiết bị điều khiển ngoại vi

8085 có tốc độ 2MHz, sản xuất trên công nghệ 3 µm, với 6.500 transistor, có 8 bit bus dữ liệu và 16 bit bus địa chỉ, bộ nhớ mở rộng 64KB

3 BXL 16bit

8086 xuất hiện tháng 6 năm 1978, sử dụng trong những thiết bị tính toán di động

8086 được sản xuất trên công nghệ 3 µm, với 29.000 transistor, có 16 bit bus dữ liệu và 20 bit bus địa chỉ, bộ nhớ mở rộng 1MB Các phiên bản của 8086 gồm 5, 8

và 10 MHz

8088 trình làng vào tháng 6 năm 1979, là BXL được IBM chọn đưa vào chiếc máy

tính (PC) đầu tiên của mình; điều này cũng giúp Intel trở thành nhà sản xuất BXL máy tính lớn nhất trên thế giới 8088 giống hệt 8086 nhưng có khả năng quản lý địa chỉ dòng lệnh 8088 cũng sử dụng công nghệ 3 µm, 29.000 transistor, kiến trúc 16

Trang 3

bit bên trong và 8 bit bus dữ liệu ngoài, 20 bit bus địa chỉ, bộ nhớ mở rộng tới 1MB Các phiên bản của 8088 gồm 5 MHz và 8 MHz.

80186 (năm 1982) còn gọi là iAPX 186 Sử dụng chủ yếu trong những ứng dụng

nhúng, bộ điều khiển thiết bị đầu cuối Các phiên bản của 80186 gồm 10 và 12 MHz

80286 (năm 1982) được biết đến với tên gọi 286, là BXL đầu tiên của Intel có thể

chạy được tất cả ứng dụng viết cho các BXL trước đó, được dùng trong PC của IBM và các PC tương thích 286 có 2 chế độ hoạt động: chế độ thực (real mode) với chương trình DOS theo chế độ mô phỏng 8086 và không thể sử dụng quá 1 MB RAM; chế độ bảo vệ (protect mode) gia tăng tính năng của bộ vi xử lý, có thể truy xuất đến 16 MB bộ nhớ

286 sử dụng công nghệ 1,5 µm, 134.000 transistor, bộ nhớ mở rộng tới 16 MB Các phiên bản của 286 gồm 6, 8, 10, 12,5, 16, 20 và 25MHz

4 BXL 32bit vi kiến trúc NetBurst (NetBurst MICRO-ARCHITECTURE) Intel386 gồm các họ 386DX, 386SX và 386SL Intel386DX là BXL 32 bit đầu tiên

Intel giới thiệu vào năm 1985, được dùng trong các PC của IBM và PC tương thích Intel386 là một bước nhảy vọt so với các BXL trước đó Đây là BXL 32 bit có khả năng xử lý đa nhiệm, nó có thể chạy nhiều chương trình khác nhau cùng một thời điểm 386 sử dụng các thanh ghi 32 bit, có thể truyền 32 bit dữ liệu cùng lúc trên bus dữ liệu và dùng 32 bit để xác định địa chỉ Cũng như BXL 80286, 80386 hoạt động ở 2 chế độ: real mode và protect mode

386DX sử dụng công nghệ 1,5 µm, 275.000 transistor, bộ nhớ mở rộng tới 4GB

Các phiên bản của 386DX gồm 16, 20, 25 và 33 MHz (công nghệ 1 µm) 386SX (năm1988) sử dụng công nghệ 1,5 µm, 275.000 transistor, kiến trúc 32 bit bên trong, 16 bit bus dữ liệu ngoài, 24 bit bus địa chỉ, bộ nhớ mở rộng 16MB; gồm các phiên bản 16, 20, 25 và 33 MHz

386SL (năm1990) được thiết kế cho thiết bị di động, sử dụng công nghệ 1 µm,

855.000 transistor, bộ nhớ mở rộng 4GB; gồm các phiên bản 16, 20, 25 MHz 486DX ra đời năm 1989 với cấu trúc bus dữ liệu 32 bit 486DX có bộ nhớ sơ cấp (L1 cache) 8 KB để giảm thời gian chờ dữ liệu từ bộ nhớ đưa đến, bộ đồng xử lý toán học được tích hợp bên trong Ngoài ra, 486DX được thiết kế hàng lệnh

(pipeline), có thể xử lý một chỉ lệnh trong một xung nhịp

486DX sử dụng công nghệ 1 µm, 1,2 triệu transistor, bộ nhớ mở rộng 4GB; gồm

các phiên bản 25 MHz, 35 MHz và 50 MHz (0,8 µm) 486SX (năm 1991) dùng trong dòng máy tính cấp thấp, có thiết kế giống hệ 486DX nhưng không tích hợp bộ đồng xử lý toán học 486DX sử dụng công nghệ 1 µm (1,2 triệu transistor) và 0,8

µm (0,9triệu transistor), bộ nhớ mở rộng 4GB; gồm các phiên bản 16, 20, 25, 33

Trang 4

486SL (năm 1992) là BXL đầu tiên dành cho máy tính xách tay (MTXT), sử dụng

công nghệ 0,8 µm, 1,4 triệu transistor, bộ nhớ mở rộng 4GB; gồm các phiên bản 20,

25 và 33 MHz Intel Pentium, BXL thế hệ kế tiếp 486 ra đời năm 1993 Cải tiến lớn nhất của Pentium là thiết kế hai hàng lệnh (pipeline), dữ liệu bên trong có khả năng thực hiện hai chỉ lệnh trong một chu kỳ, do đó Pentium có thể xử lý chỉ lệnh nhiều gấp đôi so với 80486 DX trong cùng thời gian Bộ nhớ sơ cấp 16KB gồm 8 KB chứa dữ liệu và 8 KB khác để chứa lệnh Bộ đồng xử lý toán học được cải tiến giúp tăng khả năng tính toán đối với các trình ứng dụng

Pentium sử dụng công nghệ 0,8 µm chứa 3,1 triệu transistor, có các tốc độ 60, 66

MHz (socket 4 273 chân, PGA) Các phiên bản 75, 90, 100, 120 MHz sử dụng công nghệ 0,6 µm chứa 3,3 triệu transistor (socket 7, PGA) Phiên bản 133, 150, 166, 200

sử dụng công nghệ 0,35 µm chứa 3,3 triệu transistor (socket 7, PGA)

Pentium MMX (năm 1996), phiên bản cải tiến của Pentium với công nghệ MMX

được Intel phát triển để đáp ứng nhu cầu về ứng dụng đa phương tiện và truyền thông MMX kết hợp với SIMD (Single Instruction Multiple Data) cho phép xử lý nhiều dữ liệu trong cùng chỉ lệnh, làm tăng khả năng xử lý trong các tác vụ đồ họa,

đa phương tiện

Pentium MMX sử dụng công nghệ 0,35 µm chứa 4,5 triệu transistor, có các tốc độ

166, 200, 233 MHz (Socket 7, PGA)

Pentium Pro Nối tiếp sự thành công của dòng Pentium, Pentium Pro được Intel

giới thiệu vào tháng 9 năm 1995, sử dụng công nghệ 0,6 và 0,35 µm chứa 5,5 triệu transistor, socket 8 387 chân, Dual SPGA, hỗ trợ bộ nhớ RAM tối đa 4GB Điểm nổi bật của Pentium Pro là bus hệ thống 60 hoặc 66MHz, bộ nhớ đệm L2 (cache L2) 256KB hoặc 512KB (trong một số phiên bản) Pentium Pro có các tốc độ 150,

166, 180, 200 MHz Pentium II (năm 1997), phiên bản cải tiến từ Pentium Pro được

sử dụng trong những dòng máy tính cao cấp, máy trạm (workstation) hoặc máy chủ (server) Pentium II có bộ nhớ đệm L1 32KB, L2 512KB, tích hợp công nghệ MMX được cải tiến giúp việc xử lý dữ liệu video, audio và đồ họa hiệu quả hơn Pentium

II có đế cắm dạng khe - Single-Edge contact (SEC) 242 chân, còn gọi là Slot 1

Trang 5

Phiên bản sau, tên mã Mendocino, đã khắc phục khuyết điểm này với bộ nhớ đệm L2 128KB.

Covington sử dụng công nghệ 0,25 µm, 7,5 triệu transistor, bộ nhớ đệm L1 32KB, bus hệ thống 66MHz, đế cắm 242 chân Slot 1 SEPP (Single Edge Processor

Package), tốc độ 266, 300 MHz

Mendocino cũng sử dụng công nghệ 0,25 µm có đến 19 triệu transistor, bộ nhớ đệm L1 32KB, L2 128KB, bus hệ thống 66 MHz, đế cắm Slot 1 SEPP hoặc socket 370 PPGA, tốc độ 300, 333, 366, 400, 433, 466, 500, 533 MHz

Katmai sử dụng công nghệ 0,25 µm, 9,5 triệu transistor, bộ nhớ đệm L1 32KB, L2

512KB, đế cắm Slot 1 SECC2 (Single Edge Contact cartridge 2), tốc độ 450, 500,

550, 533 và 600 MHz (bus 100 MHz), 533, 600 MHz (bus 133 MHz)

Coppermine sử dụng công nghệ 0,18 µm, 28,1 triệu transistor, bộ nhớ đệm L2 256

KB được tích hợp bên trong nhằm tăng tốc độ xử lý Đế cắm Slot 1 SECC2 hoặc socket 370 FC-PGA (Flip-chip pin grid array), có các tốc độ như 500, 550, 600,

650, 700, 750, 800, 850 MHz (bus 100MHz), 533, 600, 667, 733, 800, 866, 933,

1000, 1100 và 1133 MHz (bus 133MHz)

Tualatin áp dụng công nghệ 0,13 µm có 28,1 triệu transistor, bộ nhớ đệm L1

32KB, L2 256 KB hoặc 512 KB tích hợp bên trong BXL, socket 370 FC-PGA (Flip-chip pin grid array), bus hệ thống 133 MHz Có các tốc độ như 1133, 1200,

1266, 1333, 1400 MHz

Celeron Coppermine (năm 2000) được “rút gọn” từ kiến trúc BXL Pentium III

Coppermine, còn gọi là Celeron II, được bổ sung 70 lệnh SSE Sử dụng công nghệ 0,18 µm có 28,1 triệu transistor, bộ nhớ đệm L1 32KB, L2 256 KB tích hợp bên trong BXL, socket 370 FC-PGA, Có các tốc độ như 533, 566, 600, 633, 667, 700,

733, 766, 800 MHz (bus 66 MHz), 850, 900, 950, 1000, 1100, 1200, 1300 MHz (bus 100 MHz)

Tualatin Celeron (Celeron S) (năm 2000) được “rút gọn” từ kiến trúc BXL

Pentium III Tualatin, áp dụng công nghệ 0,13 µm, bộ nhớ đệm L1 32KB, L2 256

KB tích hợp, socket 370 FC-PGA, bus hệ thống 100 MHz, gồm các tốc độ 1,0, 1,1, 1,2, 1,3 và 1,4 GHz

7 BXL Pentium IV

Intel Pentium 4 (P4) là BXL thế hệ thứ 7 dòng x86 phổ thông, được giới thiệu vào tháng 11 năm 2000 P4 sử dụng vi kiến trúc NetBurst có thiết kế hoàn toàn mới so

Trang 6

với các BXL cũ (PII, PIII và Celeron sử dụng vi kiến trúc P6) Một số công nghệ nổi bật được áp dụng trong vi kiến trúc NetBurst như Hyper Pipelined Technology

mở rộng số hàng lệnh xử lý, Execution Trace Cache tránh tình trạng lệnh bị chậm trễ khi chuyển từ bộ nhớ đến CPU, Rapid Execution Engine tăng tốc bộ đồng xử lý toán học, bus hệ thống (system bus) 400 MHz và 533 MHz; các công nghệ

Advanced Transfer Cache, Advanced Dynamic Execution, Enhanced Floating point

và Multimedia Unit, Streaming SIMD Extensions 2 (SSE2) cũng được cải tiến nhằm tạo ra những BXL tốc độ cao hơn, khả năng tính toán mạnh hơn, xử lý đa phương tiện tốt hơn Tham khảo thêm thông tin trong bài viết "Pentium 4 trên

đường định hình" (TGVT A, số 1/2001, Tr.54)

Pentium 4 đầu tiên (tên mã Willamette) xuất hiện cuối năm 2000 đặt dấu chấm hết cho "triều đại" Pentium III Willamette sản xuất trên công nghệ 0,18 µm, có 42 triệu transistor (nhiều hơn gần 50% so với Pentium III), bus hệ thống (system bus) 400 MHz, bộ nhớ đệm tích hợp L2 256 KB, socket 423 và 478 P4 Willamette có một số tốc độ như 1,3, 1,4, 1,5, 1,6, 1,7, 1,8, 1,9, 2,0 GHz

8 BXL Celeron

BXL Celeron được thiết kế với mục tiêu dung hòa giữa công nghệ và giá cả, đáp ứng các yêu cầu phổ thông như truy cập Internet, Email, chat, xử lý các ứng dụng văn phòng Điểm khác biệt giữa Celeron và Petium là về công nghệ chế tạo và số lượng Transistor trên một đơn vị

Celeron Willamette 128 (2002), bản "rút gọn" từ P4 Willamette, sản xuất trên công

nghệ 0,18 µm, bộ nhớ đệm L2 128 KB, bus hệ thống 400 MHz, socket 478 Celeron Willamette 128 hỗ trợ tập lệnh MMX, SSE, SSE2 Một số BXL thuộc dòng này như Celeron 1.7 (1,7 GHz) và Celeron 1.8 (1,8 GHz)

Celeron NorthWood 128, "rút gọn" từ P4 Northwood, công nghệ 0,13 µm, bộ nhớ

đệm tích hợp L2 128 KB, bus hệ thống 400 MHz, socket 478 Celeron NorthWood

128 cũng hỗ trợ các tập lệnh MMX, SSE, SSE2, gồm Celeron 1.8A, 2.0, 2.1, 2.2, 2.3, 2.4, 2.5, 2.6, 2.7, 2.8 tương ứng với các tốc độ từ 1,8 GHz đến 2,8 GHz

Celeron D (Presscott 256), được xây dựng từ nền tảng P4 Prescott, sản xuất trên

công nghệ 90nm, bộ nhớ đệm tích hợp L2 256 KB (gấp đôi dòng Celeron

NorthWood), bus hệ thống 533 MHz, socket 478 và 775LGA Ngoài các tập lệnh MMX, SSE, SSE2, Celeron D hỗ trợ tập lệnh SSE3, một số phiên bản sau có hỗ trợ tính toán 64 bit Celeron D gồm 310, 315, 320, 325, 325J, 326, 330, 330J, 331, 335, 335J, 336, 340, 340J, 341, 345, 345J, 346, 350, 351, 355 với các tốc độ tương ứng

từ 2,13 GHz đến 3,33 GHz.[1]

Pentium 4 Extreme Edition

Pentium 4 Extreme Edition (P4EE) xuất hiện vào tháng 9 năm 2003, là BXL được Intel "ưu ái" dành cho game thủ và người dùng cao cấp P4EE được xây dựng từ

Trang 7

BXL Xeon dành cho máy chủ và trạm làm việc Ngoài công nghệ HT "đình đám" thời bấy giờ, điểm nổi bật của P4EE là bổ sung bộ nhớ đệm L3 2 MB Phiên bản đầu tiên của P4 EE (nhân Gallatin) sản xuất trên công nghệ 0,13 µm, bộ nhớ đệm L2 512 KB, L3 2 MB, bus hệ thống 800 MHz, sử dụng socket 478 và 775LGA, gồm P4 EE 3.2 (3,2 GHz), P4 EE 3.4 (3,4 GHz).

9 BXL 64 BIT, Vi kiến trúc NETBURST

SpeedStep để tối ưu tốc độ làm việc nhằm tiết kiệm điện năng Các BXL 6x2 có thêm công nghệ ảo hóa (Virtualization Technology) Prescott 2M có một số tốc độ như P4 HT 620 (2,8 GHz), 630 (3,0 GHz), 640 (3,2 GHz), 650 (3,4 GHz), 660, 662 (3,6 GHz) và 670, 672 (3,8 GHz)

Prescott Cedar Mill (năm 2006) hỗ trợ các tập lệnh và tính năng tương tự Prescott 2M nhưng không tích hợp Virtualization Technology Cedar Mill được sản xuất trên công nghệ 65nm nên tiêu thụ điện năng thấp hơn, tỏa nhiệt ít hơn các dòng trước, gồm 631 (3,0 GHz), 641 (3,2 GHz), 651 (3,4 GHz) và 661 (3,6 GHz)

Pentium D (năm 2005)

Pentium D (tên mã Smithfield, 8xx) là BXL lõi kép (dual core) đầu tiên của Intel, được cải tiến từ P4 Prescott nên cũng gặp một số hạn chế như hiện tượng thắt cổ chai do băng thông BXL ở mức 800 MHz (400 MHz cho mỗi lõi), điện năng tiêu thụ cao, tỏa nhiều nhiệt Smithfield được sản xuất trên công nghệ 90nm, có 230 triệu transistor, bộ nhớ đệm L2 2 MB (2x1 MB, không chia sẻ), bus hệ thống 533 MHz (805) hoặc 800 MHz, socket 775LGA Ngoài các tập lệnh MMX, SSE, SSE2, SSE3, Smithfield được trang bị tập lệnh mở rộng EMT64 hỗ trợ đánh địa chỉ nhớ

64 bit, công nghệ Enhanced SpeedStep (830, 840) Một số BXL thuộc dòng này như Pentium D 805 (2,66 GHz), 820 (2,8 GHz), 830 (3,0 GHz), 840 (3,2 GHz)

Cùng sử dụng vi kiến trúc NetBurst, Pentium D (mã Presler, 9xx) được Intel thiết

kế mới trên công nghệ 65nm, 376 triệu transistor, bộ nhớ đệm L2 4 MB (2x2 MB), hiệu năng cao hơn, nhiều tính năng mới và ít tốn điện năng hơn Smithfield Pentium

Trang 8

BXL lõi kép dành cho game thủ và người dùng cao cấp Pentium EE sử dụng nhân Smithfield, Presler của Pentium D trong đó Smithfield sử dụng công nghệ 90nm, bộ nhớ đệm L2 được mở rộng đến 2 MB (2x1 MB), hỗ trợ tập lệnh MMX, SSE, SSE2, SSE3, công nghệ HT, Enhanced Intel SpeedStep Technology (EIST) và EM64T Pentium 840 EE (3,20 GHz, bus hệ thống 800 MHz, socket 775LGA) là một trong những BXL thuộc dòng này.

Pentium EE Presler sử dụng công nghệ 65 nm, bộ nhớ đệm L2 được mở rộng đến 4

MB (2x2 MB), hỗ trợ tập lệnh MMX, SSE, SSE2, SSE3, công nghệ HT, Enhanced Intel SpeedStep Technology (EIST), EM64T và Virtualization Technology Một số BXL thuộc dòng này là Pentium EE 955 (3,46GHz) và Pentium EE 965 (3,73GHz)

có bus hệ thống 1066 MHz, socket 775

10 BXL 64bit, kiến trúc Core

Tại diễn đàn IDF đầu năm 2006, Intel đã giới thiệu kiến trúc Intel Core với năm cải tiến quan trọng là khả năng mở rộng thực thi động (Wide Dynamic Execution), tính năng quản lý điện năng thông minh (Intelligent Power Capability), chia sẻ bộ nhớ đệm linh hoạt (Advanced Smart Cache), truy xuất bộ nhớ thông minh (Smart

Memory Access) và tăng tốc phương tiện số tiên tiến (Advanced Digital Media Boost) Những cải tiến này sẽ tạo ra những BXL mạnh hơn, khả năng tính toán nhanh hơn và giảm mức tiêu thụ điện năng, tỏa nhiệt ít hơn so với kiến trúc

NetBurst Tham khảo chi tiết kiến trúc Core trong bài viết "Intel Core vi kiến trúc hai nhân chung đệm", ID: A0605_124

Intel Core 2 Duo

BXL lõi kép sản xuất trên công nghệ 65 nm, hỗ trợ SIMD instructions, công nghệ Virtualization Technology cho phép chạy cùng lúc nhiều HĐH, tăng cường bảo vệ

hệ thống trước sự tấn công của virus (Execute Disable Bit), tối ưu tốc độ BXL nhằm tiết kiệm điện năng (Enhanced Intel SpeedStep Technology), quản lý máy tính từ xa (Intel Active Management Technology) Ngoài ra, còn hỗ trợ các tập lệnh MMX, SSE, SSE2, SSE3, SSSE3

Core 2 Duo (tên mã Conroe) có 291 triệu transistor, bộ nhớ đệm L2 4 MB, bus hệ thống 1066 MHz, socket 775LGA Một số BXL thuộc dòng này: E6600 (2,4 GHz), E6700 (2,66 GHz) Core 2 Duo (tên mã Allendale) E6300 (1,86 GHz), E6400 (2,13 GHz) có 167 triệu transistor, bộ nhớ đệm L2 2MB, bus hệ thống 1066 MHz, socket 775LGA E4300 (1,8 GHz) xuất hiện năm 2007 có bộ nhớ đệm L2 2 MB, bus 800 MHz, không hỗ trợ Virtualization Technology

Trang 9

Active Management, Virtualization Technology, Intel Trusted Execution

Technology các tập lệnh MMX, SSE, SSE2, SSE3, SSSE3

Core 2 Extreme (tên mã Conroe XE) (tháng 7 năm 2006) với đại diện X6800 2,93 Ghz, bộ nhớ đệm L2 đến 4 MB, bus hệ thống 1066 MHz, socket 775LGA Cuối năm 2006, con đường phía trước của BXL tiếp tục rộng mở khi Intel giới thiệu BXL

4 nhân (Quad Core) như Core 2 Extreme QX6700, Core 2 Quad Q6300, Q6400, Q6600 và BXL 8 nhân trong vài năm tới Chắc chắn những BXL này sẽ thỏa mãn nhu cầu người dùng đam mê công nghệ và tốc độ

Tiếp cho đến nay là các thế hệ core i3, core i5, corei7 ra đời

Core i3: Ra đời theo từng bộ vi xử lý (BVXL) ứng với chủng loại của máy tính và theo từng kiến trung khác nhau Khả năng xử lý thông minh rõ ràng Core i3 được ứng dụng trong những máy tính cá nhân sử dụng đồ họa, xử lý công việc thông dụng và hỗ trợ trên công nghệ windows 64 bit với những chương trình đồ họa: photoshop CS4, Corel X4, Plash FX … loại này phù hợp cho những người dùng phổ thông: học sinh, sinh viên, nhân viên văn phòng

Core i5: Khả năng xử lý thông minh rõ ràng bằng một cú tăng vọt tốc độ Core

i5 thì được dùng nhiều hơn khi máy tính cần phải xử lý công việc nhiều và hiệu quả hơn về thiết kế đồ họa và trong việc xây dựng lên hệ thống ảo hóa phục vụ công việc nghiên cứu và học tập nâng cao dùng cho những người dùng tầm trung: học sinh, sinh viên học chuyên ngành công nghệ thông tin, nhân viên văn phòng cao cấp cần xử lý nhiều công việc và đồ họa cao cấp

Core i7: Khả năng xử lý thông minh rõ ràng cao nhất Core i7 với kiến trúc 4 nhân

8 luồn dữ liệu nên thường được dùng vào trong các công việc đồ họa dưới giao diện

64 bit cần độ xử lý tốc độ cực nhanh: thiết kế hình vẽ 3D, 4D dựng phim 4D….xây dựng hệ thống ảo hóa với quy mô lớn phục vụ công việc nghiên cứu công nghệ Dùng cho người dùng cao cấp, người dùng chuyên nghiệp: chuyên thiết kế đồ họa, chế bản âm thanh hình ảnh, sản xuất phim ảnh, sinh viên học chuyên ngành đồ họa máy tính, chế bản phim hoạt hình…

Trang 10

I Cấu tạo và nguyên lí hoạt động của CPU

ĐẶC TRƯNG CỦA CPU

1 Tốc độ làm việc:

Tốc độ xử lý của CPU được quyết định bởi các yếu tố :

- Độ rộng Bus dữ liệu và Bus địa chỉ ( Data Bus và Add Bus )

- Tốc độ xử lý và tốc độ Bus ( tốc độ dữ liệu ra vào chân ) còn

gọi là FSB

- Dung lượng bộ nhớ đệm Cache

(Ngoài ra ngày nay tốc độ của CPU còn phụ thuộc vào số lượng nhân của CPU - thật ra mỗi nhân được xem như 1 CPU)

Độ rộng của bus dữ liệu và bus địa chỉ (data bus and address bus) :

- Độ rộng Bus dữ liệu là nói tới số lượng đường truyền dữ liệu

bên trong và bên ngoài CPU

- Như ví dụ hình dưới đây thì CPU có 12 đường truyền dữ liệu

( ta gọi độ rộng Data Bus là 12 bit )Minh họa bên trong CPU có 12 đường truyền

dữ liệu gọi là Data Bus có 12 bit

Tương tự như vậy thì độ rộng Bus địa chỉ ( Add Bus ) cũng là số đường dây truyền các thông tin về địa chỉ

Địa chỉ ở đây có thể là các địa chỉ của bộ nhớ RAM, địa chỉ các cổng vào ra và các thiết bị ngoại vi v v để có thể gửi hoặc nhận dữ liệu từ các thiết bị này thì CPU phải có địa chỉ của nó và địa chỉ này được truyền đi qua các Bus địa chỉ

Giả sử : Nếu số đường địa chỉ là 8 đường thì CPU sẽ quản lý được 28 = 256 địa chỉ Hiện nay trong các CPU Pentium 4 có 64 bít địa chỉ và như vậy chúng quản lý được

264 địa chỉ nhớ Ngoài ra còn có nhiều công nghệ làm tăng tốc độ xử lý của CPU

Ví dụ công nghệ Core hay Nehalem.:

2 Tốc độ xử lý CPU

- Là tốc độ chạy bên trong của CPU, tốc độ này được tính MHz hoặc GHz

- Thí dụ một CPU Pentium 3 có tốc độ 800MHz tức là nó dao động ở tần số

800.000.000 Hz , CPU pentium 4 có tốc độ 2,4GHz tức là nó dao động ở tần số 2.400.000.000 Hz

Trang 11

3 Tốc độ Bus của CPU ( FSB ) :

- Là tốc độ dữ liệu ra vào các chân của CPU - còn gọi là Bus phía trước : Front SiteBus ( FSB )

Thông thường tốc độ xử lý của CPU thường nhanh gấp nhiều lần tốc độ Bus của nó, dưới đây là thí dụ minh hoạ về hai tốc độ này :

Minh họa về tốc độ xử lý (CPU speed) và tốc độ Bus (FSB) của CPU

Tốc độ CPU có liên hệ với tần số đồng hồ làm việc của nó (tính bằng các đơn vị như MHz, GHz, ) Đối với các CPU cùng loại tần số này càng cao thì tốc độ xử lý càng tăng Đối với CPU khác loại, thì điều này chưa chắc đã đúng; ví dụ CPU Core 2 Duo có tần số 2,6GHz có thể xử lý dữ liệu nhanh hơn CPU 3,4GHz một nhân Tốc

độ CPU còn phụ thuộc vào bộ nhớ đệm của nó, ví như Intel Core 2 Duo sử dụng chung cache L2 (sh ared cache ) giúp cho tốc độ xử lý của hệ thống 2 nhân mới này nhanh hơn so với hệ thống 2 nhân thế hệ 1 (Intel Pentium D) với mỗi core từng cache L2 riêng biệt (Bộ nhớ đệm dùng để lưu các lệnh hay dùng, giúp cho việc nhập dữ liệu xử lý nhanh hơn) Hiện nay công nghệ sản xuất CPU mới nhất là 32nm

Hiện nay CPU phổ biến là Duo-Core (2 nhân), Quad-Core (4 nhân) Quý 2 năm

2010 Intel và AMD ra mắt CPU Six-Core (6 nhân)

4 Đơn vị giao tiếp (BUS):

a Hàng đợi lệnh (Instruction Queue)

Trong khi EU đang giải mã hay thi hành một lệnh không cần sử dụng các hệ thống BUS, BIU sẽ đưa vào sáu bytes lệnh tiếp theo BIU chứa các byte này trong một thanh ghi FIFO (First - In - First - Out) gọi là hàng đợi Khi EU đã sẵn sàng cho lệnh tiếp theo, nó sẽ chỉ cần đọc các byte lệnh trong hàng đợi của BIU Việc này làm tăng tốc độ của hệ thống, và kỹ thuật này được gọi là pipelining

b Các thanh ghi đoạn (Segment Register)

Trang 12

Gồm bốn thanh ghi CS, DS, ES, SS, dùng để chứa địa chỉ đoạn Bộ nhớ trong 1MB của CPU 8088 được chia thành các đoạn, mỗi đoạn chứa tối đa 64 KB, ở mỗi thời điểm CPU chỉ có thể truy xuất tối đa 4 đoạn được xác định bởi 4 thanh ghi CS, DS,

c Con trỏ lệnh IP (Instruction Pointer)

Dùng để xác định địa chỉ offset của ô nhớ chứa mã lệnh của lệnh kế tiếp sẽ được CPU thi hành (ô nhớ này nằm trong đoạn được xác định bởi thanh ghi CS)

Khi CPU thực hiện một lệnh, thanh ghi IP sẽ tự động thay đổi để chỉ đến địa chỉ offset của ô nhớ chứa lệnh sẽ được CPU thi hành kế tiếp

5 BUS địa chỉ (Address BUS):

BUS địa chỉ là dụng cụ để CPU có thể xác định và nhận ra vị trí của các thiết bị trong hệ thống Các thiết bị này có thể là các ô nhớ, các cổng giao tiếp Số lượng đường dây trên BUS địa chỉ phụ thuộc vào từng loại VXL, có thể là 16, 20 hay nhiều hơn Với bộ VXL 8086/8088 thì BUS địa chỉ có 20 đường dây ký hiệu từ A0

-> A19 , như vậy có 220 vị trí địa chỉ có thể phân biệt được

6 BUS dữ liệu (Data BUS):

BUS dữ liệu (Data BUS) dùng để chuyển thông tin (gồm cả dữ liệu và lệnh) giữa bộ VXL với các thiết bị khác trong hệ thống

Quá trình chuyển thông tin từ bộ VXL đến các thiết bị khác trong hệ thống (có thể

là bộ nhớ hay các thiết bị ngoại vi) được gọi là thao tác ghi (Write Operation), ngược lại quá trình nhận số liệu vào bộ VXL từ các thiết bị ngoại vi được gọi là thao tác đọc (Read Operation) Như vậy BUS dữ liệu vừa phải thu và phát thông tin nên nó là BUS hai chiều (Bidirectional BUS) Tất nhiên không thể thu phát đồng thời cùng một lúc được

Bộ VXL Intel 8088 có điểm khác nhau quan trọng với 8086 là nó chỉ có BUS dữ liệu 8 bít thay vì 16 bít Ðặc biệt trong họ VXL Intel (80X86), đều sử dụng

Trang 13

kỹthuật Multiplex các đường dây của BUS địa chỉ và dữ liệu Cụ thể đó là quá trình dùng chung các đường dây (các chân ra) nhưng lúc thì làm việc này, lúc thì làm việc khác, tức là thực hiện các công việc khác nhau trong các thời gian khác nhau Khi đóng vai trò BUS dữ liệu các đường dây sẽ truyền thông tin cho các thiết bị của

hệ thống, ngược lại khi đóng vai trò BUS địa chỉ, cũng chính các đường dây này được dùng để gửi ra các tín hiệu địa chỉ

7 BUS điều khiển (Control BUS):

BUS điều khiển (Control BUS) là tập hợp các đường dây điều khiển dùng để điều khiển các tác vụ của hệ thống BUS điều khiển có từ 4 đến 10 đường tín hiệu, được sinh ra từCPU, các tín hiệu điều khiển điển hình là: MEMR (MEMory Read), MEMW (MEMory Write), IOR (I/O Read) và IOW (I/O Write)

Ví dụ: khi muốn đọc một byte từ một vùng nhớ, CPU trước hết gửi địa chỉ vùng nhớ đó ra BUS địa chỉ, sau đó đưa ra tín hiệu Memory Read ra BUS dữ liệu Tín hiệu Memory Read sẽ kích hoạt thiết bị nhớ để thiết bị này gửi số liệu ra BUS dữ liệu Số liệu này theo BUS dữ liệu về CPU

Định thời chu kỳ bus

Mỗi chu kỳ bus bắt đầu bằng việc xuất địa chỉ bộ nhớ hoặc I/O port (chu kỳ

xung nhịp T1) Với 8086 thì địa chỉ này có thể là địa chỉ bộ nhớ 20 bit, địa chỉ I/O gián

tiếp 16 bit (thanh ghi DX) hay địa chỉ I/O trực tiếp 8 bit Bus điều khiển có 4 tín hiệu

tác động mức thấp là MEMR, MEMW, IOR và IOW

Các chuỗi sự kiện xảy ra trong một chu kỳ bus đọc bộ nhớ:

T1: CPU xuất địa chỉ bộ nhớ Các đường dữ liệu không hoạt động và các đườngđiều khiển bị cấm

T2: Đường điều khiển MEMR xuống mức thấp Đơn vị bộ nhớ ghi nhận chu

kỳ bus này là quá trình đọc bộ nhớ và đặt byte hay word có địa chỉ đó lên bus dữ liệu

T3: CPU đặt cấu hình để các đường bus dữ liệu là nhập Trạng thái này chủ yếu

để bộ nhớ có thời gian tìm kiếm byte hay word dữ liệu

T4: CPU đợi dữ liệu trên bus dữ liệu Do đó, nó thực hiện chốt bus dữ liệu và

giải phóng các đường điều khiển đọc bộ nhớ Quá trình này sẽ kết thúc chu kỳ bus.Trong một chu kỳ bus, CPU có thể thực hiện đọc I/O, ghi I/O, đọc bộ nhớ hay

Trang 14

ghi bộ nhớ Các đường bus địa chỉ và bus điều khiển dùng để xác định địa chỉ bộ nhớ hay I/O và hướng truyền dữ liệu trên bus dữ liệu.

Chú ý rằng CPU điều khiển tất cả các quá trình trên nên bộ nhớ bắt buộc phải

cung cấp được dữ liệu vào lúc MEMR lên mức cao trong trạng thái T4 Nếu không,CPU sẽ đọc dữ liệu ngẫu nhiên không mong muốn trên bus dữ liệu Để giải quyết vấn đề này, ta có thể dùng thêm các trạng thái chờ (wait state)

8 Kiến trúc nội:

CPU có khả năng thực hiện các tác vụ dữ liệu theo tập lệnh bên trong Một lệnhđược ghi nhận bằng mã đã được định nghĩa trước, gọi là mã lệnh (opcode) Trước khithực thi một lệnh, CPU phải nhận được mã lệnh từ bộ nhớ chương trình của nó Quátrình xử lý này gọi là chu kỳ nhận lệnh (fetch cycle) Một khi các mã được nhận vàđược giải mã thì mạch bên trong CPU có thể tiến hành thực thi (execute) mã lệnh

BIU (Bus Interface Unit – đơn vị giao tiếp bus) nhận các mã lệnh từ bộ nhớ vàđặt chúng vào hàng chờ lệnh EU (Execute Unit – đơn vị thực thi) sẽ giải mã và thựchiện các lệnh trong hàng Chú ý rằng các đơn vị EU và BIU làm việc độc lập vớinhaunên BIU có khả năng đang nhận một lệnh mới trong khi EU dang thực thi lệnh trướcđó Khi EU đã thực hiện xong lệnh, nó sẽ lấy mã lệnh kế tiếp trong hàng lệnh(instruction queue)

9 Bộ nhớ đệm Cache

Thời L2 Cache còn phải nằm trên mainboard Khi nghe giới thiệu về CPU, bạn

ắt biếttới các thuật ngữ L1 Cache, L2 Cache, L3 Cache

Cache (đọc là kets, hay còn gọi là cạc) là tên gọi của bộ nhớ đệm – nơi lưu trữ các

dữ liệu nằm chờ các ứng dụng hay phần cứng xử lý Mục đích của nó là để tăng tốc

độ xử lý (có sẵn xài liền không cần tốn thời gian đi lùng sục tìm kéo về)

Nói một cách bài bản, cache là một cơ chế lưu trữ tốc độ cao đặc biệt Nó có thể là một vùng lưu trữ của bộ nhớ chính hay một thiết bị lưu trữ tốc độ cao độc lập

Có hai dạng lưu trữ cache được dùng phổ biến trong máy tính cá nhân là memory caching (bộ nhớ cache hay bộ nhớ truy xuất nhanh) và disk caching (bộ nhớ đệm đĩa)

a/ Memory cache:

Đây là một khu vực bộ nhớ được tạo bằng bộ nhớ tĩnh (SRAM) có tốc độ cao nhưng đắt tiền thay vì bộ nhớ động (DRAM) có tốc độ thấp hơn và rẻ hơn, được dùng cho bộ nhớ chính Cơ chế lưu trữ bộ nhớ cahce này rất có hiệu quả Bởi lẽ, hầu hết các chương trình thực tế truy xuất lặp đi lặp lại cùng một dữ liệu hay các lệnh y chang nhau Nhờ lưu trữ các thông tin này trong SRAM, máy tính sẽ khỏi

Trang 15

phải truy xuất vào DRAM vốn chậm chạp hơn.

Một số bộ nhớ cache được tích hợp vào trong kiến trúc của các bộ vi xử lý Chẳng hạn, CPU Intel đời 80486 có bộ nhớ cache 8 KB, trong khi lên đời Pentium là 16

KB Các bộ nhớ cache nội (internal cache) như thế gọi là Level 1 (L1) Cache (bộ nhớ đệm cấp 1) Các máy tính hiện đại hơn thì có thêm bộ nhớ cache ngoại

(external cache) gọi là Level 2 (L2) Cache (bộ nhớ đệm cấp 2) Các cache này nằm giữa CPU và bộ nhớ hệ thống DRAM Sau này, do nhu cầu xử lý nặng hơn và với tốc độ nhanh hơn, các máy chủ (server), máy trạm (workstation) và mới đây là CPU Pentium 4 Extreme Edition được tăng cường thêm bộ nhớ đệm L3 Cache

CPU Slot 1 dạng cartridge với L2 Cache nằm cạnh nhân CPU

b/ Disk cache:

Bộ nhớ đệm đĩa cũng hoạt động cùng nguyên tắc với bộ nhớ cache, nhưng thay

vì dùng SRAM tốc độ cao, nó lại sử dụng ngay bộ nhớ chính Các dữ liệu được truy xuất gần đây nhất từ đĩa cứng sẽ được lưu trữ trong một buffer (phần đệm) của bộ nhớ Khi chương trình nào cần truy xuất dữ liệu từ ổ đĩa, nó sẽ kiểm tra trước tiên trong bộ nhớ đệm đĩa xem dữ liệu mình cần đang có sẵn không Cơ chế bộ nhớ đệm đĩa này có công dụng cải thiện một cách đáng ngạc nhiên sức mạnh và tốc độ của hệ thống Bởi lẽ, việc truy xuất 1 byte dữ liệu trong bộ nhớ RAM có thể nhanh hơn hàng ngàn lần nếu truy xuất từ một ổ đĩa cứng

xin nói thêm, người ta dùng thuật ngữ cache hit để chỉ việc dữ liệu được tìm thấy trong cache Và hiệu năng của một cache được tính bằng hit rate (tốc độ tìm thấy dữ liệu trong cache)

Trở lại chuyện bộ nhớ cache Hồi thời Pentium đổ về trước, bộ nhớ cache nằm trên mainboard và một số mainboard có chừa sẵn socket để người dùng có thể gắn thêm cache khi có nhu cầu Tới thế hệ Pentium II, Intel phát triển được công nghệ đưa bộ nhớ cache vào khối CPU Nhờ nằm chung như vậy, tốc độ truy xuất cache tăng lên

rõ rệt so với khi nó nằm trên mainboard Nhưng do L2 Cache vẫn phải ở ngoài nhân CPU nên Intel phải chế ra một bo mạch gắn cả nhân CPU lẫn L2 Cache Và thế là CPU có hình dạng to đùng như một cái hộp (gọi là cartridge) và được gắn vào mainboard qua giao diện slot (khe cắm), Slot 1 Tốc độ truy xuất cache lúc đó chỉ bằng phân nửa tốc độ CPU Thí dụ, CPU 266 MHz chỉ có tốc độ L2 Cache là 133 MHz Sang Pentium III cũng vậy Mãi cho tới thế hệ Pentium III Coppermine (công nghệ 0.18-micron), Intel mới thành công trong việc tích hợp ngay L2 Cache vào nhân chip (gọi là on-die cache) Lúc đó, tốc độ L2 Cache bằng vớitốc độ CPU và con CPU được thu gọn lại, đóng gói với giao diện Socket 370

Trang 16

CPU Socket 370 với L2 Cache nằm ngay trên nhân CPU Như đã nói, dung lượng của Cache CPU lợi hại lắm nghen Phổ biến nhất là L2 Cache là một chip nhớ nằm giữa L1 Cache ngay trên nhân CPU và bộ nhớ hệ thống Khi CPU xử lý, L1 Cache

sẽ tiến hành kiểm tra L2 Cache xem có dữ liệu mình cần không trước khi truy cập vào bộ nhớ hệ thống Vì thế, bộ nhớ đệm càng lớn, CPU càng xử lý nhanh hơn Đó

là lý do mà Intel bên cạnh việc tăng xung nhịp cho nhân chíp, còn chú ý tới việc tăng dung lượng bộ nhớ Cache Do giá rất đắt, nên dung lượng Cache không thể tăng ồ ạt được Bộ nhớ cache chính L1 Cache vẫn chỉ ở mức từ 8 tới 32 KB Trong khi, L2 Cache thì được đẩy lên dần tới hiện nay cao nhất là Pentium M Dothan 2

MB (cho máy tính xách tay) và Pentium 4 Prescott 1 MB (máy để bàn) Riêng dòng CPU dành cho dân chơi game và dân multimedia “pro” là Pentium 4 Extreme

Edition còn được bổ sung L3 Cache với dung lượng 2 MB Đây cũng là CPU để bàn

của con người và máy tính không thể hiểu được

Để máy tính có thể hiểu được, lệnh của người sử dụng được HĐH hay trình dịch ngôn ngữ phiên dịnh thành lệnh ở dạng ngôn ngữ máy và CPU có thể đọc

và hiểu được

Khi CPU đọc lệnh dạng mã máy, nó thực hiện việc phiên dịch lệnh này thành các vi lệnh để các thành phần của CPU có thể hiểu và thực hiện được Quá trình này gọi là giải mã lệnh

Tập các vi lệnh của CPU cũng là một yếu tố đánh giá khả năng làm việc của CPU, khi trang bị một CPU vào hệ thống người ta thường quan tâm đến vấn đế kiến trúc của CPU, có hai loại kiến trúc CPU, đó là:

CISC: (Complex Instruction Set Computer) máy tính với tập lệnh đầy đủ Trong kiến trúc CISC, máy tính cần sử dụng rất ít thanh ghi

RISC: (Reduced Instruction Set Computer) máy tính với tập lệnh rút gọn Trong kiến trúc RISC, máy tính cần sử dụng nhiều thanh ghi Đây là kiến trúc được các bộ

vi xử lý Intel ngày nay sử dụng

Chúng ta có thể lấy một ví dụ để phân biệt giữa SISC và RISC như sau: Cộng 1 vào một vùng địa chỉ Trong CISC, lệnh tương ứng phải thực hiện ba chức năng sau: đọc vùng bộ nhớ, cộng thêm 1, ghi trả lại kết quả Trong RISC, mỗi chức năng trên

là một lệnh Điều khác biệt là trong CISC không cần tới nhiều thanh ghi, với lệnh

Trang 17

trên CISC có thể đọc giá trị tại vùng nhớ vào ALU, thực hiện tăng lên 1 và trả kết quả vào vùng nhớ Còn đối với CPU RISC, nếu giá trị cần đọc đã có sẵn ở thanh ghi thi không cần phải đọc nó từ bộ nhớ, giá trị sau khi tăng lên 1 có thể chứa ở thanh ghi mà không cần phải ghi kết quả vào bộ nhớ.

11 CPU đa lõi:

Lý do lớn nhất việc đặt nhiều lõi lên cùng một vi mạch là sẽ giúp giảm không gian trên bản mạch chính khi có nhu cầu muốn sử dụng với số lượng CPU lõi đơn tương đương Thêm nữa, lợi thế của việc sử dụng đa lõi trên cùng một vi mạch đương nhiên sẽ làm việc kết hợp cùng nhau chặt chẽ và nâng cao được hiệu quả hơn

Khả năng tiết kiệm năng lượng cũng được phát huy thấy rõ đối với thiết kế này Khi nhiều lõi cùng nằm trên một chip, xung tín hiệu truyền giữa các lõi sẽ ngắn hơn Ngoài ra, đặc trưng của CPU đa lõi là chạy với điện năng thấp hơn vì công suất tiêu tốn để tín hiệu truyền trên dây bằng với bình phương điện áp chia cho điện trở trong dây, do đó điện năng thấp hơn sẽ dẫn đến kết quả là nguồn điện sử dụng đi

Một lý do khác đối với việc tiết kiệm nguồn điện là tốc độ đồng hồ CPU đa lõi có thể thực thi các hoạt động nhiều lần hơn trong một giây trong khi tần số thấp hơn

Ví dụ bộ xử lý MIT RAW 16 lõi hoạt động ở tần số 425MHz có thể thực thi gấp

100 lần các hoạt động trong một giây đối với Intel Pentium 3 đang chạy ở tần số

600 MHz Có một quy tắc đơn giản là mỗi một phần trăm tăng thêm tốc độ đồng hồ

sẽ tăng 3% điện năng tiêu thụ Và tất nhiên là điều đó còn chưa tính tới tác động của các nhân tố khác có ảnh hưởng tới sự tiêu thụ điện năng

CPU đa lõi còn có thể chia sẻ một mạch ghép nối bus tốt như mạch lưu trữ Hình bên dưới là lược đồ của chip Core 2 dual của Intel – có tính năng là một L2 cache được chia sẻ Kết quả là tiết kiệm được lượng không gian đáng kể Theo Intel, CPU Core 2 dual có thể lên tới 4MB được chia sẻ L2 Cache

Sơ đồ Bộ xử lý Core 2 Dual của Intel

Một nhân tố khác giới hạn lợi ích thực thi của CPU đa lõi là phần mềm chạy trên

nó Đối với người dùng bình thường, hiệu suất lớn nhất mà họ đạt được khi lựa chọn một CPU đa lõi là tính đa nhiệm được cải thiện Ví dụ, với một CPU đa lõi ta

sẽ thấy sự cải thiện lớn khi xem DVD trong lúc máy vẫn đang được quét virus mà tốc độ không bị ảnh hưởng, bởi vì từng ứng dụng sẽ được gán trên các lõi khác nhau

Nếu người dùng đang chạy một ứng dụng đơn trên máy tính đa lõi thì sẽ không thấy

rõ được việc tăng hiệu suất đáng kể lắm Bởi hầu hết các ứng dụng không được xử

lý đa luồng Chính vì vậy các ứng dụng cũng cần phải thay đổi trong thiết kế Ví dụ một chương trình quét virus chạy trên một tuyến mới trong khi GUI lại chạy trên một tuyến khác Việc xử lý đa luồng đúng cách là khi khối lượng công việc được phân chia thành nhiều luồng khác nhau Việc quét virus là một ví dụ, luồng GUI làm việc rất ít, trong khi luồng quét virus thực hiện một nhiệm vụ rất nặng và không

Trang 18

có khả năng chia nhỏ ra và gửi đến các lõi khác.

Việc phát triển một ứng dụng đa luồng đích thực yêu cầu rất nhiều công việc phức tạp Điều này rõ ràng cũng tốn khá nhiều chi phí vào một chu trình thiết kế phần mềm Đó là lý do tại sao phần lớn các ứng dụng phần mềm sẽ không được phát triển như các ứng dụng thực sự đa luồng cho đến khi số lượng lõi đủ cao để thực hiện nhiều tác vụ mà không làm ảnh hưởng tới hiệu suất Và điều này sẽ đạt được khi người dùng có nhu cầu

12 Các thuộc tính kỹ thuật của CPU

Word Size: kích thước từ nhớ là số bit lớn nhất mà CPU có thể xử lý ở một thời điểm

Kích thước đường dữ liệu là số bit dữ liệu có thể vào ra CPU ở một thời điểm từ bus

dữ liệu (data bus)

Kích thước địa chỉ cực đại là không gian địa chỉ vật lý cực đại mà CPU có thể điều khiển

Tốc độ xử lý tính bằng megahertz (MHz) hoặc gigahertz (GHz) Con số đứng trước MHz hay Ghz chỉ cho biết có bao nhiêu dao độ trong một giây Ví dụ, CPU

600MHz sẽ dao động 600 triệu lần/giây

Level 1 Execution Trace Cache: là bộ nhớ đệm bổ sung 8 KB, CPU Pentium 4 bao gồm bộ nhớ dò tìm thi hành lệnh mà dung lượng lên đến 12KB để đọc/giải mã theo thứ tự sự thực hiện của chương trình Hiệu suất tăng dần này được gở bỏ việc đọc/giải mã theo mỗi vòng lặp và làm hiệu quả hơn không gian lưu trữ đệm cho đến khi những tập lệnh không được lưu nữa Kết quả là nó chuyển một khối lượng lớn những lệ

Level 2 Advanced Transfer Cache (ATC):

Bộ nhớ đệm Level 2 có trong bộ xử lý từ 2,4Ghz trở lên Level 2 ATC giúp thông lượng truyền dữ liệu nhiều hơn giữa hai kênh

là bộ đệm Level 2 và bộ xử lý Bộ đệm Level

2 có một mạch ghép nối 256bit (32 byte) mà

nó truyền dữ liệu trong mỗi xung

Level 3 cache: chỉ có Pentium 4 Extreme Edition 3,2GHz trở lên mới có bộ nhớ đệm Level 3 Đây là bộ nhớ thứ ba được thêm vào trên CPU Nó được thiết kế đặc biệt để đáp ứng những nhu cầu cho những ai đòi hỏi cao

về năng xuất CPU có bộ nhớ Level 3 cung cấp một đường truyền rộng đến bộ nhớ Thiết kế của cache L3 giúp cho những dữ liệu xử lý chứa đựng ở CPU được nhiều hơn và nhanh hơn

Trang 19

HT Technology (Hyper-Threading Technology – Công nghệ siêu phân luồng):

Các CPU có tốc độ truyền dữ liệu với Mainboard Bus 800MHz trở lên hỗ trợ HT Technology Công nghệ HT Technology

là một bước đột phá, nó làm thay đổi kỹ thuật thiết kế bộ xử lý mà tốc độ vượt qua GHz cải thiện hiệu quả làm việc Nó cho phép những chương trình phần mềm

“thấy 2 CPU” và làm việc hiệu quả hơn

Kỹ thuật này cho phép CPU chạy hai loạt chuỗi, hoặc luồng của lệnh trong cùng một thời điểm Theo cách ấy, hệ thống đã được cải tiến hiệu quả, nâng dần hiệu suất xử lý trong môi trường khi thực hiện cùng lúc nhiều ứng dụng

Trang 20

II/ CẤU TẠO :

1 Các thành phần cơ bản của cpu:

CU (Control Unit): Đơn vị điều khiển : Điểu khiển hoạt động của hệ thống theo chương trình đã dựng sẵn Có chức năng điều khiển toàn bộ tiến trình chuyển giao dữ liệu từ chổ này sang chổ khác trong khi quá trình tính toán đang tiếp tục thực hiện

ALU (Arithmetic and Logic Unit): Đơn vị số học và luận lý Thực hiện tất cả các tính toán số học và lôgic Đơn vị số học và luận lý chỉ thực hiện các phép toán số học đơn giản như phép cộng, trừ, nhân, chia Để CPU có thể xử lý dữ liệu với các số thực với độ chính xác cao và các phép toán phức tạp như sin, cos, tính tích phân…, các CPU thường được trang bị thêm bộ đồng xử lý toán học (FPU: Floatting Point Unit ) còn được gọi là

bộ xử lý dấu chấm động

Tập các thanh ghi (Registry)-Dùng để chứa thông tin tạm thời phục vụ cho các hoạt động hiện tại của CPU

2 Các chức năng cơ bản của cpu:

Thực hiện các lệnh về xử lý dữ liệu & các lệnh nhập xuất dữ liệu, các lệnh đọc, ghi, xóa dữ liệu trên các thiết bị lưu trữ, các lệnh về quản lý bộ nhớ bao gồm cấp phát và giải phóng tài nguyên bộ nhớ

3 Các thành phần chính vật lý:

a CPU INTEL :

Bộ vi xử lý là trái tim của máy tính hiện đại; đây là một loại chip được tạo thành từ hàng triệu transistor và những thành phần khác được tổ chức thành những khối chức năng chuyên biệt, bao gồm đơn vị xử lý số học, khối quản lý bộ nhớ và bộ nhớ đệm, khối luân chuyển dữ liệu và phép toán luận lý suy đoán

Transistor gồm ba lớp bán dẫn ghép với nhau hình thành hai mối tiếp giáp P-N , nếu ghép theo thứ tự PNP ta được Transistor thuận , nếu ghép theo thứ tự NPN ta được Transistor ngược về phương diện cấu tạo Transistor tương đương với hai Diode đấu ngược chiều nhau

Trang 21

Cấu tạo Transistor

 Ba lớp bán dẫn được nối ra thành

ba cực , lớp giữa gọi là cực gốc ký hiệu là B ( Base ), lớp bán dẫn B rất mỏng và

có nồng độtạp chất thấp

 Hai lớp bán dẫn bên ngoài được nối ra thành cực phát (Emitter ) viết tắt là E,

và cực thu hay cực góp ( Collector )viết tắt là C, vùng bán dẫn E và C có cùng loại bán dẫn (loại N hay P )nhưng có kích thước và nồng độ tạp chất khác nhau nên không hoán vị chonhau được

Bộ vi xử lý của máy tính hiện nay đã phát triển cực mạnh về khả năng, tốc độ và tính phức tạp so với thập niên trước đây Tốc độ cao, kích thước nhỏ, số lượng transistor khổng lồ Nếu bộ xử lý năm 1983 chỉ có 30.000 transistor thì hiện nay với một số bộ xử lý con số này là trên 40 triệu

Bất kỳ chương trình máy tính nào cũng bao gồm rất nhiều lệnh để thao tác với dữ liệu Bộ xử lý sẽ thực hiện chương trình qua bốn giai đoạn xử lý: nạp, giải mã, thực thi và hoàn tất

Giai đoạn nạp (lấy lệnh và dữ liệu) đọc các lệnh của chương trình và dữ liệu cần thiết vào bộ xử lý

Giai đoạn giải mã xác định mục đích của lệnh và chuyển nó đến phần cứng tương ứng

Giai đoạn thực thi là lúc có sự tham gia của phần cứng, với lệnh và dữ liệu đã được nạp sẵn, các lệnh sẽ được thực hiện

Quá trình này có thể gồm các tác vụ như cộng, chuyển bít hay nhân thập phân động

Giai đoạn hoàn tất sẽ lấy kết quả của giai đoạn thực thi và đưa vào thanh ghi của bộ

xử lý hay bộ nhớ chính

Một bộ phận quan trọng của bộ vi xử lý là đồng hồ xung nhịp được thiết kế sẵn, xác định tốc độ làm việc tối đa của những bộ phận khác và giúp đồng bộ hoá những hoạt động liên quan Hiện nay tốc độ nhanh nhất của bộ xử lý có trên thị trường là trên 2 GHz hay hơn hai tỷ xung nhịp mỗi giây Một số người thích sử dụng thủ

Trang 22

thuật "ép" xung để chạy ở tốc độ cao hơn, nhưng nên nhớ là khi đó nhiệt độ làm việc của chip sẽ cao hơn và có thể gây trục trặc.

b CPU AMD

Chất liệu chủ yếu chế tạo cpu AMD là ceramic (gốm) và organic ( hữu cơ) từ dòng Thoroughbred trở đi đều làm bằng organic.Hiện tại, công nghệ được áp dụng cho các CPU là MOS (Metal Oxide Semi-Conductor - bán dẫn ôxít kim loại), dựa vào một lớp ôxít kim loại nằm trên tấm silicon kết nối bởi các đường hợp chất dẫn điện.Người ta đã cải tiến MOS thành CMOS (Complimentary MOS - MOS bổ trợ) hoạt động ở điện thế thấp

Để đáp ứng nhu cầu làm cho CPU ngày càng nhanh hơn, ít tiêu hao năng lượng hơn các công nghệ 0,25 -> 0,18 -> 0,13 micron lần lượt ra đời Nhưng chính sự thu nhỏ các cầu nối trong CPU này khiến việc áp dụng MOS và CMOS trở nên ngày càng khó khăn hơn, do các cầu nối này nằm quá sát nhau nên dễ dẫn đến hiện tượng đóng điện chéo lên các cầu bên cạnh Một nhược điểm quan trọng khác của công nghệ MOS là phần silicon ở giữa các cầu nối (có vai trò như một tụ điện) phải nạp được điện dung tối đa để có thể đóng - và lại phải thoát hết điện dung để có thể mở Việc này tốn thời gian xử lý, và lãng phí thời gian xử lý trên CPU

Các nhà sản xuất CPU đã cải tiến MOS hiện có như việc thay oxit nhôm bằng oxit đồnglàm tăng xung nhịp lên đáng kể Nhưng để CPU có thể đạt tới tốc độ 5-10 GHz phải có một giải pháp khắc phục triệt để hơn nữa 2 nhược điểm nêu trên Đó chính là công nghệ SOI (Silicon On Insulator)

Cải tiến SOI là điện dung của tụ silicon giữa các cầu được cực tiểu hoá làm giảm thời gian cần thiết để thoát/nạp, để mở và đóng cầu nối Điều này giúp tăng xung nhịp lên rất nhiều Sở dĩ SOI làm được điều đó là nhờ việc chèn vào giữa tấm

silicon một lớp vật liệu cách điện và để lại một phần silicon nhỏ ở giữa các cầu nối Lớp vật liệu cách điện này là một dạng của ôxít silicon được tạo ra bằng kĩ thuật SIMOX (Seperation by Implantation of Oxygen) - khí ôxi được ép lên bề mặt của silicon wafer ở áp suất và nhiệt độ cao, khi đó silicon phản ứng với ôxi tạo nên 1 lớp ôxít silicon bám vào silicon wafer bên dưới

SOI sẽ không thay thế hoàn toàn MOS/CMOS mà chỉ tối ưu hoá cho hai công nghệ này:

- CPU dùng SOI sẽ nhanh hơn đến 30% so với CPU dùng MOS/CMOS nếu có cùng một xung đồng hồ như nhau

- Yêu cầu về điện năng thấp hơn nhiều so với MOS/CMOS (ít hơn khoảng 50%), CPU sẽ chạy mát hơn - vượt qua một trở ngại lớn của việc nâng tốc độ các bộ xử lý

- Cho phép thu nhỏ công nghệ sản xuất CPU xuống 0.09 micron hay thấp hơn cùng với SOI có nghĩa rằng các bộ vi xử lý sẽ được tăng tốc rất nhanh và tốc độ 5-10GHz

Trang 23

sẽ sớm đạt được Thế nhưng SOI cần có silicon đạt độ nguyên chất 100% - thứ mà công nghệ hiện nay chưa sản xuất được Isonics là 1 công ty đang nghiên cứu sản xuất loại silicon wafer này AMD thực sự trông đợi vào SOI để khắc phục những nhược điểm của CPU như tiêu tốn nhiều điện năng và chạy nóng hơn Cả thế giới đang mong đợi bộ xử lý K8 của họ, hay còn gọi là Hammer dùng công nghệ SOI.

4 Thành phần chính luận lý:

Mạch của bộ xử lý được thiết kế thành những phần luận lý riêng biệt - khoảng hơn một chục bộ phận - được gọi là những đơn vị thực thi Chúng có nhiệm vụ thực hiện bốn giai đoạn trên và có khả năng xử lý gối đầu Dưới đây là một số đơn vị thực thi phổ biến nhất

a/ Bộ luận lý số học: Xử lý tất cả những phép toán số học Đôi lúc đơn vị này được chia thành những phân hệ, một chuyên xử lý các lệnh cộng và trừ số nguyên, phân

hệ khác chuyên tính toán các phép nhân và chia số phức

b/ Bộ xử lý dấu chấm động (FPU): Thực hiện tất cả các lệnh liên quan đến dấu chấm động (không phải là số nguyên) Ban đầu FPU là bộ đồng xử lý gần ngoài nhưng hiện nay nó được tích hợp ngay trên bộ xử lý để tăng tốc độ xử lý

c/ Bộ phận nạp/lưu: Quản lý tất cả lệnh đọc hay ghi bộ nhớ

d/ Bộ phận quản lý bộ nhớ (MMU): Chuyển đổi địa chỉ của ứng dụng thành địa chỉ

bộ nhớ vật lý Điều này cho phép hệ điều hành ánh xạ mã và dữ liệu của ứng dụng vào những khoảng địa chỉ ảo để MMU có thể thực hiện các dịch vụ theo chế độ bảo

vệ bộ nhớ

e/ Bộ phận xử lý rẽ nhánh (BPU): Dự đoán hướng đi của lệnh rẽ nhánh nhằm giảm

sự ngắt quãng của dòng chuyển dữ liệu và lệnh vào bộ xử lý khi có một luồng xử lý nhảy đến một địa chỉ bộ nhớ mới, thường gặp trong các phép toán so sánh hay kết thúc vòng lặp

f/ Bộ phận xử lý vector (VPU): Xử lý các lệnh đơn, đa dữliệu (single instruction multiple data-SIMD) để tăng tốc các tác vụ đồ hoạ Những lệnh theo kiểu vector này gồm các tậplệnh mở rộng cho multimedia của Intel, 3DNow của AMD,

AltiVec của Motorola Trong một vài trường hợp không có bộ phận VPU riêng, chẳng hạn Intel và AMD tích hợp những tính năng này vào trong FPU của Pentium

4 và Athlon

Trang 24

Không phải tất cả các bộ phận này đều thực thi lệnh Người ta đã có những nỗ lực

to lớn để bảo đảm cho bộ xử lý lấy lệnh và dữ liệu ở tốc độ nhanh nhất Tác vụ nạp truy cập bộ nhớ chính (không nằm ngay trên CPU) sẽ chiếm nhiều chu kỳ xung nhịp, trong khi đó CPU lại không làm gì cả

Tuy nhiên, BPU sẽ phải làm việc rất nhiều để lấy sẵn dữ liệu và lệnh

Một cách giảm thiểu tình trạng không hoạt động của CPU là trữ sẵn mã và dữ liệu thường được truy cập trong bộ nhớ ngay trên chip, như vậy CPU có thể truy cập mã

và dữ liệu trên bộ nhớ đệm chỉ trong một chu kỳ xung nhịp Bộ nhớ đệm chính ngay trên CPU (còn gọi là Level1 hay L1) thường chỉ có dung lượng khoảng 32KB và chỉ có thể lưu được một phần chương trình hay dữ liệu Thủ thuật để thiết kế bộ nhớ đệm là tìm giải thuật để lấy thông tin quan trọng vào L1 khi cần đến Điều này có ý nghĩa hết sức quan trọng đối với tốc độ nên hơn một nửa số lượng transistor của bộ

xử lý có thể dành cho bộ nhớ đệm

Tuy nhiên, hệ điều hành đa nhiệm và một loạt các ứng dụng chạy đồng thời có thể làm quá tải ngay cả với bộ nhớ đệm L1 được thiết kế tốt nhất Để giải quyết vấn đề này, cách đây nhiều năm, các nhà sản xuất đã bổ sung đường truyền tốc độ cao để

bộ xử lý có thể giao tiếp với bộ nhớ đệm thứ cấp (Level2, L2) với tốc độ khoảng 1/2 hay 1/3 tốc độ của bộ xử lý

Hiện nay trong những bộ xử lý mới nhất như Pentium 4 hay PowerPC 7450 còn tiến

xa hơn khi đưa bộ nhớ đệm L2 vào ngay trong CPU và hỗ trợ giao tiếp tốc độ cao với bộ nhớ đệm ngoài L3 Trong tương lai, các nhà sản xuất thậm chí còn tích hợp

bộ điều khiển bộ nhớ ngay trên CPU để tăng tốc độ lên cao hơn nữa

III/ NGUYÊN TẮC HOẠT ĐỘNG:

 CPU hoạt động hoàn toàn phụ thuộc vào các mã lệnh , mã lệnh là tín hiệu số dạng 0,1 được dịch ra từ các câu lệnh lập trình ,như vậy CPU sẽ không làm

gì cả nếu không có các câu lệnh hướng dẫn

 Khi chúng ta chạy một chương trình thì các chỉ lệnh của chương trình đó được nạp lên bộ nhớ Ram, các chỉ lệnh này đã được dịch thành ngôn ngữ máy và thường trú trên các ngăn nhớ của Ram ở dạng 0,1

 CPU sẽ đọc và làm theo các chỉ lệnh một cách lần lượt

 Trong quá trình đọc và thực hiện các chỉ lệnh, các bộ giải mã sẽ giải mã các chỉ lệnh này thành các tín hiệu điều khiển

Trang 25

Đối với CPU, do việc xử lý thông tin trong CPU là hoàn toàn tự động theo những

chương trình có sẵn trong bộ nhớ, CPU cần phải biết thời điểm đọc lệnh, đọc lệnh xong thì mới chuyển đến thời điểm CPU tiến hành giải mã lệnh, giải mã lệnh xong thì CPU mới tiến hành việc thực hiện lệnh Thực hiện xong thì CPU mới tiến hành việc đọc lệnh kế tiếp

Đây là các công đoạn khi CPU thực hiện và không thể lẫn lộn được mà phải được thực hiện một cách tuần tự

Để giải quyết vấn đề này, trong CPU cần phải có một bộ tạo nhịp thời gian làm việc (CPU Clock) Tại nhịp thời gian này, CPU thực hiện việc đọc lệnh, tại nhịp thời gian tiếp theo, CPU thực hiện việc giải mã lệnh…

Nhịp thời gian càng ngắn, tốc

độ CPU thực hiện lệnh càng nhanh Chẳng hạn với một CPU pentium MMX 233 MHz, điều

đó có nghĩa là bộ tạo nhịp của CPU đó tạo ra 233 triệu nhịp làm việc trong 1 giây

Ví dụ: việc phân chia thời gian thực hiện lệnh đối với một CPU (đời cũ) có thể mô tả như sau:

Trong đó: F (Fetch): đọc lệnh

D (Decode): giải mã lệnh

E (Execute) : thực thi lệnh

ti: chu kì làm việc thứ i

Với CPU làm việc như vậy chúng ta có thể thấy rằng mỗi lệnh phải thực hiện trong

3 nhịp thời gian Tại nhịp t2 thì chỉ có bộ phận giải mã là bận rộn còn bộ đọc lệnh thì nhàn rỗi Trong thời điểm t3 thì cả hai bộ phận đọc lệnh và giải mã đều rỗi Do

đó hiệu năng làm việc của CPU thấp

Một CPU xử lý lệnh theo nhịp thời gian như vậy còn gọi là bộ vi xử lý ở chế độ đơn dòng lệnh và chỉ gặp ở các CPU đời cũ Để tăng tốc độ làm việc của CPU hay tăng hiệu suất làm việc, các CPU thế hệ thứ 3 đều trang bị chế độ xử lý xen kẽ dòng mã lệnh (pipelining)

Trang 26

Ngày nay, các CPU đều được hỗ trợ chế độ xử lý xen kẽ dòng mã lệnh Một

số CPU đời mới có đến 5 đường ốngxử lý lệnh (Core 2 Dual) Tốc độ CPU được tính bằng GHz, tương đương với hàng tỉ phép tính trên một giây Vì thế Core 2 Duo tuy có tốc độ xung nhịp không cao lắm nhưng sức mạnh thì vượt trội so với Pen 4

Và còn một vấn đề nữa đó chính là hiệu quả của thao tác đó Ví dụ như do các thuật toán không chặt chẽ dẫn đến CPU đoán nhầm và copy khối dữ liệu không cần thiết vào trong bộ nhớ đệm, còn khối dữ liệu cần dùng thì lại không copy Vì thế khi CPU tìm trong bộ nhớ đệm không thấy có khối dữ liệu đó lại phải lóc cóc tìm trong RAM, tìm xong lại phải copy vào bộ nhớ đệm rồi mới xử lý tiếp Như vậy có nghĩa

là CPU đã thực hiện rất nhiều thao tác thừa so với CPU đoán đúng được ngay khối

dữ liệu chuẩn bị được xử lý Core 2 Duo có các thuật toán cao cấp và các công nghệ tiên tiến giúp cho hiệu quả của CPU rất cao Và chính vì thế mà hiệu suất của Core

2 Duo vượt trội so với Pentium./

Ngày đăng: 22/04/2016, 18:45

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w