Các đơn vị CU, ALU và một bộ nhớ đặc biệt có tốc độ cao, nhỏ, được gọi là các thanh ghi register thường được bố trí gần nhau tạo thành bộ xử lý processor của máy tính, đó chính là là Đơn
Trang 1TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH
KHOA CÔNG NGHỆ THÔNG TIN
TÀI LIỆU ÔN TẬP MÔN: KIẾN TRÚC MÁY TÍNH
Câu hỏi ôn tập
1 Trình bày các cổng luận lý cơ sở
2 Bộ xử lý trung tâm – CPU
3 Đơn vị điều khiển – Control Unit
4 Đơn vị luận lý số – Arithmetic Logical Unit
5 Bộ nhớ – Memory
6 Hệ thống xuất nhập – Input/Output (I/O)
7 Clock là gì?
a Kỹ thuật Đồng bộ - Synchronous
b Kỹ thuật Bất đồng bộ - Asynchronous
8 Tín hiệu clock, Tác dụng của clock
9 Bus là gì?
a Các thành phần trên bus
b Data bus – Bus dữ liệu
c Address bus – Bus địa chỉ
d Control bus – Bus điều khiển
e Các tiêu chuẩn bus
f Thông số các loại bus
g ISA bus
h PCI bus
10 Trình bày Cấu trúc bộ xử lý
a Các thanh ghi
b Đơn vị xử lý
c Đơn vị điều khiển
Trang 2Phần Gợi ý trả lời
Tổ chức vật lý:
Các mô hình máy tính hiện nay được thiết kế dựa trên kiến trúc Von Neumann
Sơ đồ cấu trúc cơ bản của máy tính :
- Bộ xử lý trung tâm (CPU): Điều khiển hoạt động của máy tínhvà xử lý số liệu
- Bộ nhớ: chứa chương trình và dữ liệu đang được xử lý
- Hệ thống vào/ra (I/O: Input/Output) : trao đổi thông tin giữabên ngoài và bên trong máy tính
- Liên kết hệ thống (Interconnection): kết nối và vận chuyểnthông tin giữa các thành phần với nhau
Bộ xử lý (Processor):
Khi phân tích các đơn vị chức năng của máy tính điện tử được minh họa như Hình vẽ
chúng ta gọi ba đơn vị chức năng chính của máy tính điện tử: CU, ALU và bộ nhớ chính là Đơn vị xử lý trung tâm – CPU Trong các máy tính điện tử thế hệ thứ nhất và thứ hai các đơn vị chức năng này thường được xây dựng thành các module độc lập, tách biệt nhau rất rõ ràng, người ta có thể mở máy ra và chỉ rõ đâu là các mạch điện thực hiện chức năng ALU, đâu là các mạch điện thực hiện chức năng CU
Đến thế hệ máy tính thứ ba và thứ tư người ta đã sử dụng các mạch tích hợp (IC), các đơn vị chức năng CU, ALU có thể được xây dựng từ một hoặc một số mạch tích hợp Các đơn vị
CU, ALU và một bộ nhớ đặc biệt có tốc độ cao, nhỏ, được gọi là các thanh ghi (register) thường được bố trí gần nhau tạo thành bộ xử lý (processor) của máy tính, đó chính là là Đơn
vị xử lý trung tâm – CPU
Các máy tính điện tử thế hệ thứ tư đều sử dụng các mạch tích hợp cỡ rất lớn (VLSI), người
ta đã tích hợp được vào trong một con chip hàng trăm nghìn, thậm chí hàng triệu transistor
và một số linh kiện khác, các linh kiện này đủ để xây dựng nên các đơn vị chức năng CU, ALU và một phần bộ nhớ chính của máy tính Các chip có thể thực hiện được chức năng như một CPU đầy đủ như vậy được gọi là bộ vi xử lý – microprocessor
Tổ chức của một máy tính đơn giản, sử dụng một bus được trình bày trên CPU là bộ não của máy tính, nó bao gồm CU, ALU và các thanh ghi (Register).Chức năng của nó là thi hành các chương trình được chứa trong bộ nhớ của máy tính (main memory) bằng cách lấy các chỉ thị ở nó, kiểm tra và sau đó lần lượt thi hành các chỉ thị
Trang 3Đơn vị điều khiển – CU có nhiệm vụ lấy các chỉ thị từ bộ nhớ chính, giải mã và điều khiển ALU cũng như tất cả các thành phần khác thi hành các chỉ thị
Đơn vị số học và logic – ALU thực hiện các thao tác đơn giản, chẳng hạn cộng, AND logic để hoàn thành các chỉ thị
CPU cũng còn bao gồm một bộ nhớ nhỏ, tốc độ cao để chứa các kết quả tạm thời và những thông tin điều khiển nhất định.Bộ nhớ này gồm một số thanh ghi – register, mỗi thanh ghi có một chức năng nhất định Thanh ghi quan trọng nhất được gọi là Con đếm chương trình (Program counter – PC), nó trỏ đến chỉ thị tiếp theo sẽ được thi hành Tên là "con đếm chương trình" nhưng thực tế nó không đếm gì cả, tuy vậy thuật ngữ này được sử dụng rất rộng rãi.Một thanh ghi quan trọng khác là thanh ghi chỉ thị (instruction register – IR), nó chứa chỉ thị hiện đang được thi hành Hầu hết các máy tính đều còn có một số thanh ghi khác nữa, trong số đó một số thanh ghi người lập trình ở mức 2 và 3 có thể sử dụng được để chứa các kết quả trung gian
Trang 4- CPU :
Tổ chức bên trong của một phần của một CPU theo kiểu Von Neumann cổ điển được trình bày chi tiết trên hình vẽ
Phần này thường bao gồm từ 1 đến 16 thanh ghi và ALU, các thanh ghi này thường được gọi là các thanh ghi đệm vì chúng thường chứa tạm thời các toán hạng
Các toán hạng cho phép toán (với hình vẽ minh họa 3 là phép cộng) mà ALU cần thực hiện đang được chứa trong các thanh ghi đệm được nạp vào 2 thanh ghi vào của ALU là A
và B Các thanh ghi này giữ các toán hạng cho ALU trong khi ALU thực hiện tính toán Kết quả sinh ra được đưa vào thanh ghi ra (output register) Thanh ghi ra có thể lại chuyển nội dung vào một trong các thanh ghi đệm rồi từ đó chuyển ra bộ nhớ nếu cần
Toán hạng cho các phép toán có thể nằm trong tập các thanh ghi đệm (register), hoặc nằm trong bộ nhớ (memory) Dựa vào vị trí của các toán hạng người ta có thể chia các chỉ thị thành 3 nhớm chính: thanh ghi – bộ nhớ (register–memory), thanh ghi – thanh ghi
(register–register) và bộ nhớ – bộ nhớ (memory–memory)
Các lệnh thuộc nhớm register–memory đòi hỏi phải lấy một toán hạng trong bộ nhớ
về, đặt vào một thanh ghi đệm nhất định, còn toán hạng thứ hai đang nằm trong một thanh ghi nào đó, sau đó chúng sẽ được ALU sử dụng
Trang 5Các lệnh thuộc nhớm register–register sẽ nhận 2 toán hạng từ các thanh ghi đệm, đưa chúng vào các thanh ghi vào của ALU, thực hiện các thao tác trên các toán hạng này sau đó đưa kết quả trở lại các thanh ghi đệm
Các lệnh thuộc nhớm memory–memory sẽ nhận các toán hạng từ bộ nhớ vào trong các thanh ghi vào của ALU, thực hiện các thao tác tính toán trên các toán hạng này rồi gửi kết quả trở lại bộ nhớ
Đường dữ liệu là trái tim của hầu hết các CPU Trong một mức độ nào đó nó xác định việc máy tính có thể làm được những công việc gì và hiệu quả ra sao
- Hệ thống I/O :
Để máy tính làm công việc giải một bài toán, trước hết phải trao cho nó chương trình và
dữ liệu.Sau khi máy tính tìm được lời giải của bài toán, nó cần chuyển kết quả cho con người Vấn đề đưa thông tin vào (input) và lấy thông tin ra (output) khỏi máy tính được gọi
là vào/ra – input/output, thường được gọi ngắn gọn hơn là I/O
Clock :
Đặc điểm: cần kiểm soát về thời gian trên hệ thống:
- Có sự trễ (delay) của tín hiệu
- Kiểm soát thứ tự thực hiện
Hai kỹ thuật cơ bản:
- Đồng bộ - Synchronous : dùng thêm tín hiệu clock (xung nhịp)
- Bất đồng bộ - Asynchronous : dùng thêm các tín hiệu bắt tay
Tín hiệu clock :
Chú thích :
- Rising Edge: Cạnh lên
- Falling Edge: Cạnh xuống
- High: Mức cao
- Low: Mức thấp
Thông số của clock :
- Tần số - Frequency: số chu kỳ trong 1 giây
- Chu kỳ (Cycle): chiều dài 1 chu kỳ
Trang 6- Ví dụ:
1GHZ = 109chu kỳ/giây
1 chu kỳ = 10-9 giây = 1 nano giây
Tác dụng của clock :
- Mọi thao tác được thực hiện trong thời gian bằng một số nguyên chu kỳ clock
- Ví dụ:
Lệnh cộng – 1 chu kỳ
CPU đọc 1 từ nhớ - 3 chu kỳ
• chu kỳ 1: phát địa chỉ
• chu kỳ 2: chờ
• chu kỳ 3: đọc dữ liệu
•
Bus :
Các hệ thống máy tính thông thường chứa ba thành phần chính, Bộ xử lý trung tâm (Central Processing Unit - CPU) để xử lý các dữ liệu, bộ nhớ chính dùng để lưu các dữ liệu cần xử lý, và một loạt các thiết bị ngoại vi giao tiếp dữ liệu đó với thế giới bên ngoài Trong một hệ thống hiện đại chúng ta có thể tìm thấy một CPU, bộ nhớ DDR3 SDRAM, một ổ cứngcho các dữ liệu không trực tuyến, Card đồ họa và màn hình LCD như là hệ thống hiển thị, một mouse và bàn phím cho các tương tác, và một kết nối Wi-Fi cho mạng
Các bus máy tính bằng hình thức này hay hình thức khác chuyển dữ liệu giữa tất cả các thiết bị này
Trong đa số các kiến trúc máy tính truyền thống, CPU và bộ nhớ chính có xu hướng được kết hợp chặt chẽ Vi xử lý thông thường có một số các kết nối điện được gọi là "chân"
có thể được sử dụng để chọn một "địa chỉ" trong bộ nhớ chính, và thiết lập khác của chân (pin) để đọc và ghi dữ liệu được lưu trữ tại địa điểm đó Trong hầu hết trường hợp, CPU và
bộ nhớ chia sẻ đặc điểm tín hiệu và hoạt động một cách đồng bộ.Các bus kết nối CPU và bộ nhớ là một trong những đặc điểm xác định của hệ thống, và thường được gọi đơn giản là Bus
hệ thống
Nó có thể cho phép thiết bị ngoại vi giao tiếp với bộ nhớ trong cùng một kiểu, gắn bộ điều hợp trong các hình thức của thẻ mở rộng trực tiếp vào bus hệ thống Điều này thường được thực hiện thông qua một số loại kết nối điện được tiêu chuẩn hóa, một số trong số này tạo thành bus mở rộng hoặc local bus Tuy nhiên, sự khác biệt hiệu suất giữa các CPU và các thiết bị ngoại vi rất khác nhau, một số giải pháp nói chung cần thiết để đảm bảo rằng các thiết bị ngoại vi không làm chậm hiệu suất hệ thống tổng thể Nhiều CPU nhiều tính năng thiết lập thứ hai của các chân tương tự như giao tiếp với bộ nhớ, nhưng có thể hoạt động ở tốc độ rất khác nhau và sử dụng các giao thức khác nhau.Những người khác sử dụng bộ điều khiển thông minh để đặt các dữ liệu trực tiếp trong bộ nhớ, một khái niệm được gọi là bộ nhớ truy cập trực tiếp.Hệ thống hiện đại nhất kết hợp cả hai giải pháp, khi thích hợp
Khi số lượng các thiết bị ngoại vi tiềm năng lớn, bằng cách sử dụng thẻ mở rộng cho tất cả các thiết bị ngoại vi ngày càng trở nên không đứng vững Điều này đã dẫn đến sự ra đời của hệ thống bus được thiết kế đặc biệt để hỗ trợ nhiều thiết bị ngoại vi Các ví dụ
Trang 7thường gặp là các cổng SATA trong các máy tính hiện đại, mà cho phép một số ổ cứng được kết nối mà không cần một thẻ Tuy nhiên, các hệ thống hiệu suất cao nói chung là quá đắt để thực hiện trong các thiết bị cấp thấp, như chuột Điều này đã dẫn đến sự phát triển song song của một số hệ thống bus hiệu suất cao cho các giải pháp này, ví dụ phổ biến nhất là Universal Serial Bus.Tất cả các ví dụ như vậy có thể được gọi là bus ngoại vi, mặc dù thuật ngữ này không phải là phổ quát
Trong các hệ thống hiện đại khác biệt hiệu suất giữa CPU bộ nhớ chính đã phát triển tuyệt vời với số lượng ngày càng tăng của bộ nhớ tốc độ cao được dựng trực tiếp vào trong CPU, thường được biết như bộ nhớ cache Trong hệ thống như vậy, CPU giao tiếp bằng cách sử dụng bus hiệu năng cao hoạt động ở tốc độ lớn hơn nhiều so với bộ nhớ, và giao tiếp với bộ nhớ bằng cách sử dụng giao thức tương tự như những người sử dụng chỉ duy nhất cho thiết bị ngoại vi trong quá khứ
Khái niệm về cấu trúc bộ xử lý
Cấu trúc bộ xử lý
Bộ vi xử lý là trái tim của máy tính hiện đại; đây là một loại chip được tạo thành từ hàng triệu transistor và những thành phần khác được tổ chức thành những khối chức năng chuyên biệt, bao gồm đơn vị xử lý số học, khối quản lý bộ nhớ và bộ nhớ đệm, khối luân chuyển dữ liệu và phép toán luận lý suy đoán
Bộ vi xử lý của máy tính hiện nay đã phát triển cực mạnh về khả năng, tốc độ và tính phức tạp so với thập niên trước đây Tốc độ cao, kích thước nhỏ, số lượng transistor khổng lồ Nếu bộ xử lý năm 1983 chỉ có 30.000 transistor thì hiện nay với một số bộ xử lý con số này
là trên 40 triệu
Bất kỳ chương trình máy tính nào cũng bao gồm rất nhiều lệnh để thao tác với dữ liệu Bộ xử lý sẽ thực hiện chương trình qua bốn giai đoạn xử lý: nạp,giải mã,thực thi và hoàn tất
Giai đoạn nạp (lấy lệnh và dữ liệu) đọc các lệnh của chương trình và dữ liệu cần thiết vào bộ xử lý
Giai đoạn giải mã xác định mục đích của lệnh và chuyển nó đến phần cứng tươngứng
Giai đoạn thực thi là lúc có sự tham gia của phần cứng, với lệnh và dữ liệu đã được nạp sẵn, các lệnh sẽ được thực hiện Quá trình này có thể gồm cáctác vụ như cộng,chuyển bit hay nhân thập phân động
Giai đoạn hoàn tất sẽ lấy kết quả của giai đoạn thực thi và đưa vào thanh ghi của bộ xử lý hay bộ nhớ chính
Một bộ phận quan trọng của bộ vi xử lý là đồng hồ xung nhịp được thiết kế sẵn, xác định tốc độ làm việc tối đa của những bộ phận khác và giúp đồng bộ hoá những hoạt động liên quan Hiện nay tốc độ nhanh nhất của bộ xử lý có trên thị trường là trên 3.2 GHz hay hơn ba tỷ xung nhịp mỗi giây Một số người thích sử dụng thủ thuật "ép" xung để chạy ở tốc
độ cao hơn, nhưng nên nhớ là khi đó nhiệt độ làm việc của chip sẽ cao hơn và có thể gây trục trặc
Trang 8Các bộ phận của CPU
Mạch của bộ xử lý được thiết kế thành những phần luận lý riêng biệt - khoảng hơn một chục bộ phận - được gọi là những đơn vị thực thi Chúng có nhiệm vụ thực hiện bốn giai đoạn trên và có khả năng xử lý gối đầu Dưới đây là một số đơn vị thực thi phổ biến nhất
Bộ luận lý số học: Xử lý tất cả những phép toán số học Đôi lúc đơn vị này được chia thành những phân hệ, một chuyên xử lý các lệnh cộng và trừ số nguyên, phân hệ khác chuyên tính toán các phép nhân và chia số phức
Bộ xử lý dấu chấm động (FPU): Thực hiện tất cả các lệnh liên quan đến dấu chấm động (không phải là số nguyên) Ban đầu FPU là bộ đồng xử lý gần ngoài nhưng hiện nay nó được tích hợp ngay trên bộ xử lý để tăng tốc độ xử lý
Bộ phận nạp/lưu: Quản lý tất cả lệnh đọc hay ghi bộ nhớ
Bộ phận quản lý bộ nhớ (MMU): Chuyển đổi địa chỉ của ứng dụng thành địa chỉ bộ nhớ vật lý Điều này cho phép hệ điều hành ánh xạ mã và dữ liệu của ứng dụng vào những khoảng địa chỉ ảo để MMU có thể thực hiện các dịch vụ theo chế độ bảo vệ bộ nhớ
Bộ phận xử lý rẽ nhánh (BPU): Dự đoán hướng đi của lệnh rẽ nhánh nhằm giảm sự ngắt quãng của dòng chuyển dữ liệu và lệnh vào bộ xử lý khi có một luồng xử lý nhảy đến một địa chỉ bộ nhớ mới, thường gặp trong các phép toán so sánh hay kết thúc vòng lặp
Bộ phận xử lý vector (VPU): Xử lý các lệnh đơn, đa dữ liệu (single instruction multiple data-SIMD) để tăng tốc các tác vụ đồ hoạ Những lệnh theo kiểu vector này gồm các tập lệnh mở rộng cho multimedia của Intel, 3DNow của AMD, AltiVec của Motorola Trong một vài trường hợp không có bộ phận VPU riêng, chẳng hạn Intel và AMD tích hợp những tính năng này vào trong FPU của Pentium 4 và Athlon
Không phải tất cả các bộ phận này đều thực thi lệnh.Người ta đã có những nỗ lực to lớn để bảo đảm cho bộ xử lý lấy lệnh và dữ liệu ở tốc độ nhanh nhất Tác vụ nạp truy cập bộ nhớ chính (không nằm ngay trên CPU) sẽ chiếm nhiều chu kỳ xung nhịp, trong khi đó CPU lại không làm gì cả Tuy nhiên, BPU sẽ phải làm việc rất nhiều để lấy sẵn dữ liệu và lệnh
Một cách giảm thiểu tình trạng không hoạt động của CPU là trữ sẵn mã và dữ liệu thường được truy cập trong bộ nhớ ngay trên chip, như vậy CPU có thể truy cập mã và dữ liệu trên bộ nhớ đệm chỉ trong một chu kỳ xung nhịp Bộ nhớ đệm chính ngay trên CPU (còn gọi là Level1 hay L1) thường chỉ có dung lượng khoảng 32KB và chỉ có thể lưu được một phần chương trình hay dữ liệu Thủ thuật để thiết kế bộ nhớ đệm là tìm giải thuật để lấy thông tin quan trọng vào L1 khi cần đến.Điều này có ý nghĩa hết sức quan trọng đối với tốc
độ nên hơn một nửa số lượng transistor của bộ xử lý có thể dành cho bộ nhớ đệm
Tuy nhiên, hệ điều hành đa nhiệm và một loạt các ứng dụng chạy đồng thời có thể làm quá tải ngay cả với bộ nhớ đệm L1 được thiết kế tốt nhất Để giải quyết vấn đề này, cách đây nhiều năm, các nhà sản xuất đã bổ sung đường truyền tốc độ cao để bộ xử lý có thể giao tiếp với bộ nhớ đệm thứ cấp (Level2, L2) với tốc độ khoảng 1/2 hay 1/3 tốc độ của bộ xử lý Hiện nay trong những bộ xử lý mới nhất như Pentium 4E tiến xa hơn khi đưa bộ nhớ đệm L2
và L3 vào ngay trong CPU và hỗ trợ giao tiếp tốc độ cao
Các phương pháp thực hiện đơn vị điều khiển
Các phương pháp nâng cao khả năng hoạt động bộ xử lý
Tác động clock
Trang 9Overclock được hiểu đơn thuần đó là làm cho phần cứng như CPU , RAM … chạy với tốc
độ cao hơn tốc độ chuẩn Điều này cho phép người dùng tăng hiệu suất làm việc của hệ thống mà không phải mua phần cứng có tốc độ cao hơn Ví dụ như người mua đã mua CPU với tốc độ 2.5GHz sau đó chạy Overclock để chạy ổn định với tốc độ 3.0GHz
Tuy nhiên mọi thiết bị khác nhau sẽ Overclock theo những cách khác nhau, cần chú ý :
- Overclock mà không xem xét một cách thận trọng sẽ gây mối nguy hiểm đe dọa tới nhiều linh kiện khác nhau khiến cho chúng làm việc không ôn định và sẽ không tốt cho máy tính
- Các linh kiện mới đều có thiết kế để ngăn chặn những lỗi khiên cho bị hỏng vĩnh viễn Điều đó có nghĩa là Overclock gần như không gây mối nguy hiểm cho hệ thống , tuy nhiên thường có những mối đe dọa khiến cho hệ thống không an toàn và sẽ làm việc không phù hợp và lỗi hệ thống sẽ xảy ra
Cơ chế đường ống
Để tăng sức mạnh cho CPU thì một trong các cách là tăng frequency , tức tăng độ dài pipeline lên , ppipeline càng nhiều "tầng" thì frequency max có thể đạt được càng lớn Tuy nhiên khi tăng độ dài pipeline thì này sinh vẫn đề là số IPC bị giảm xuống (các yếu tố khác giữ nguyên ) cái này đại loại là : mỗi lần thực hiện instruction CPU có khả năng phải truy xuất thông tin trong cache và trong bộ nhớ trung tâm, pipeline càng nhiều tầng thì thời gian truy xuất càng dài dẫn đến việc IPC bị giảm đi
Nếu frequency max có thể được đủ lớn để bù được cho sự giảm IPC này thì kiến trúc pipeline dài sẽ mạnh hơn so với kiến trúc pipeline ngắn
Độ dài pipeline của 1 số kiến trúc CPU Intel :
- 20 tầng với core Willamette và Northwood với frequency tối đa 3,4 GHz
- 31 tầng với core Prescott và Cedar Mill frequency max 5 GHz
- 45 tầng với core Tejas frequency max 7 GHz (cái này lẽ ra là thế hệ CPU đươc Intel tung ra để tiếp bước kiến trúc netburst của Pen4 nhưng cuối cùng Intel đã thay thế nó bằng Core )
Qua đây có thể thấy rất nhanh vì sao người ta nói Pen4C mạnh hơn Pen4 E, đơn giản bởi vì Pen4 E chưa đạt tới frequency cần thiết để bù lại sự giảm IPC so với Pen4 C Trên lí thuyết Pen4 E có thể đạt đến tốc độ tối đa 5Gz nhưng vì nhiều yếu tố cản trở như qui trình sản xuất chưa theo kịp dẫn đến hiện tượng CPU tỏa nhiệt và tiêu tốn quá nhiều năng lượng Ngược lại dòng Pen4 lúc mới được tung ra chạy với frequency dưới 2Ghz cũng chưa tỏ ra thuyết phục,
lí do cũng như trên
Pipeline càng nhiều tầng thì CPU càng có khả năng mạnh hơn Tuy nhiên khi đạt tới 1 giới hạn , frequency cao ko thể bù lại sự giảm IPC được nữa Người ta ước tính được số tầng pipeline tối ưu là vào khoảng 55 tức là cao hơn rất nhiều so với kiến trúc netburst hiện nay Tất nhiên yếu tố tỏa nhiệt và tiêu thụ điện năng chưa được tính đên
Bộ nhớ cache
Ngày nay, tốc độ hoạt động của CPU tăng nhanh hơn so với việc tăng tốc độ của bộ nhớ ngoài, nên các chip vi xử lý hiện nay đều sử dụng cache để tăng hiệu suất của CPU Thường thì chỉ có bộ nhớ cache Level 1 (L1) và Level 2 (L2) Các vi xử lý đa nhân còn có thêm cả cache L3 So về tốc độ đáp ứng thì L1 > L2 > L3 còn kích thước thì ngược lại
Trang 10Hoạt động của bộ nhớ cache: do tốc độ đáp ứng dữ liệu của bộ nhớ ngoài chậm hơn CPU nhiều lần, bộ nhớ cache sẽ được nạp sẵn một vùng bộ nhớ chính Khi CPU có yêu cầu dữ liệu, nếu nó tìm thấy trong bộ nhớ cache (trường hợp này gọi là hit) thì nó trả giá trị chứa trong ô nhớ đó cho CPU Nếu không tìm thấy ô nhớ đó trong bộ nhớ cache (trường hợp này gọi là miss), nó sẽ phải chờ để đọc trực tiếp từ bộ nhớ chính (thời gian trễ gấp vài chục lần so với đọc từ cache)
Tác dụng của bộ nhớ cache: khi số lần truy xuất bộ nhớ tăng lên, nếu có bộ nhớ cache sẽ giảm thời gian CPU để đọc dữ liệu từ bộ nhớ ngoài Chú ý là trong thời gian chờ này thì CPU không thực hiện bất kỳ tác vụ nào khác điều này làm giảm đáng kể hiệu suất.Bộ nhớ cache cho tốc độ hoạt động cao nên giá thành rất đắt và chiếm diện tích lớn trên chip.Vì vậy các bộ nhớ cache thường có kích thước nhỏ Với chip vi xử lý có cùng kiến trúc thì chip nào
có bộ nhớ cache lớn hơn sẽ xử lý nhanh hơn
Giới thiệu các bộ xử lý Intel