1. Trang chủ
  2. » Tất cả

Tìm hiểu về vi xử lý pentium m

33 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Tìm hiểu về vi xử lý Pentium M
Trường học Trường Đại Học Công Nghệ Thông Tin
Chuyên ngành Kỹ thuật điện tử và vi xử lý
Thể loại Bài tiểu luận
Năm xuất bản 2003-2008
Thành phố Hà Nội
Định dạng
Số trang 33
Dung lượng 447,75 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Môn Học Kỹ Thuật Vi Xử Lý Giáo Viên Hướng Dẫn TS Nguyễn Quý Sỹ Bài tiểu luận Tìm hiểu về vi xử lý Pentium M Bài tiểu luận Tìm hiểu về vi xử lý Pentium M Nội dung chính gồm các phần sau I, Giới thiệu v[.]

Trang 1

Bài tiểu luận:

Tìm hiểu về vi xử lý Pentium M

Trang 2

Nội dung chính gồm các phần sau:

I, Giới thiệu về vi xử lý Pentium M

II, Kiến trúc Pentium M

III, Kiến trúc tập lệnh

IV, Chế độ định địa chỉ

V, Kết luận

Trang 3

I, Giới thiệu về vi xử lý Pentium M:

1, Xuất xứ:

- Pentium M được xây dựng trên kiến trúc thế hệ thứ 6 của Intel.

- Intel Pentium M được sản xuất từ năm 2003 đến năm

2008, là bộ xử lý cuối cùng mang tên Pentium, trước đó

là vi xử lý Intel Pentium 4

- Vi xử lý với tên mã là Banias và được cho là hoàn hảo

nhất của kiến trúc P6 Nó là sự kết

hợp giữa nhân P3 với các đặc tính

tiên tiến của P4, kết quả là được một vi xử

lý có tốc độ khá nhanh với yêu cầu năng

lượng thấp

Trang 4

2, Các dòng vi xử lý:

* Banias

- Dòng sản phẩm đầu tiên của Pentium M có tên mã la Banias.

- Banias hỗ trợ công nghệ SSE2,công nghệ Enhanced

SpeedStep nâng cao trên mô hình SL6NA và

SL6P4(làm giảm xung nhịp CPU để tiết kiệm pin khi

máy tính nhàn rỗi).

* Dothan

- Intel ra mắt pentium M cải tiến với tên mã là Dothan,với

những phiên bản được biết đến là Pentium M 710 (1.4 GHz), 715 (1.5 GHz), 725 (1.6 GHz), 735 (1.7 GHz), 740 (1.73 GHz), 745 (1.8 GHz), 750 (1.86 GHz), 755 (2.0 GHz), and 765 (2.1 GHz).

• Có hỗ trợ cấu trúc SSE2,công nghệ Enhanced SpeedStep,

và công nghệ Execute Disable,socket 478 và 479.

Trang 5

3, Ứng dụng:

* Intel đã hướng cho PM gia nhập thị trường các thiết bị di động, ngành sản xuất mainboard như AOpen, DFI và MSI đã thiết kế cho Pentium M tương thích với các bản mạch dành cho những người quan tâm, HTPC, máy trạm và máy chủ.

* Pentium M là một vi xử lý của Intel hướng tới thị trường di động

và đã được sử dụng trong thế hệ đầu tiên của nền tảng Centrino

* Centrino không phải là một bộ vi xử lý cho laptop mà là một nền tảng kết hợp giữa 3 yếu tố:

- Vi xử lý intel Pentium M

- Intel wireless LAN

- Một chipset Intel (855 hoặc tương tự)

* 3 thành phần này làm việc cùng nhau một cách thông minh giúp tiết kiệm điện năng tiêu thụ cho laptop

Trang 6

II, Kiến trúc vi xử lý Pentium M:

1, Sơ đồ khối:

Trang 7

2, Các thành phần chính và hoạt động:

Trang 8

* Pipeline trong Pentium M:

- Các giai đoạn và hoạt động

+ Pipeline là một danh sách các giai đoạn mà một lệnh cho trước phải đi qua để có thể được thực hiện đầy đủ.

+ So với PPro, P2, P3, PM cũng có các giai đoạn chính:

– Dự đoán rẽ nhánh, đọc lệnh.

– Giải mã lệnh.

– Register renaming (tránh việc tuần tự hóa một cách không cần thiết của các thao tác chương trình bằng việc tái sử dụng các thanh ghi) – Reorder buffer read.

– Reservation station(mỗi toán hạng trong mỗi lệnh trong hàng đợi có một vị trí trong các file thanh ghi ).

– Các cổng thực thi.

– Bộ đệm ghi lại.

– Giai đoạn nghỉ.

Trang 10

- Hiện tượng thắt nút cổ chai:

+ Truy cập bộ nhớ: PM có 6 cổng ghi, việc có nhiều hơn 6 thao tác ghi liền lúc cũng khiến cho quá trình xử lý bị chậm lại vài chu kỳ clock

+ Tìm nạp và giải mã lệnh: Các lệnh nên được tổ chức để sao cho không

có quá 6 vi lệnh được sinh ra sau giải mã, tránh các lệnh có nhiều hơn 1 tiền tố

+ Hợp các vi lệnh: cho phép các vi lệnh chứa nhiều thông tin hơn.

+ Các cổng thực thi: Các vi lệnh hợp sau khi được tách ra phải được

phân bổ đều về 5 cổng Cổng 0 và 1 dễ trở thành một nút cổ chai trong một đoạn mã có một vài thao tác với bộ nhớ

+ Dự đoán rẽ nhánh: Bộ đệm rẽ nhánh đích (BTB) trong PM nhỏ hơn trong các bộ xử lý khác vì vậy nên tránh các lệnh nhảy không cần thiết để hạn chế tải trên BTB

Trang 12

- Đơn vị tìm nạp lệnh: chia làm 3 giai đoạn

+ Tải một dòng(32 byte) vào trong bộ đệm dòng lệnh(ISB), + Instruction Length Decoder nhận dạng ranh giới các

lệnh trong vòng 16 byte Các lệnh x86 không có độ dài

cố định , giai đoạn này đánh dấu nơi lệnh bắt đầu và

kết thúc trong vòng nạp 128 bit Nếu có bất kỳ lệnh rẽ

nhánh nào trong số các bit này, địa chỉ của nó sẽ được

lưu lại tại Branch Target Buffer(BTB) để CPU có thể sử

dụng chúng trong các mạch dự đoán rẽ nhánh BTB có

512 lối vào

+ Giai đoạn Decoder Alignment đánh dấu vị trí của đơn

vị giải mã lệnh mà mỗi lệnh được gửi tới.

Trang 13

3, Bộ giải mã lệnh và đổi tên thanh ghi:

Trang 14

* Bộ giải mã lệnh:

- Có thể chuyển đổi 3 lệnh x86 trong mỗi chu kỳ clock, một lệnh phức tạp tại bộ giải mã 0 và hai lệnh đơn giản ở bộ gải mã 1 và 2, trả

về hàng đợi lệnh đã được giải mã 6 vi lệnh mỗi chu kỳ clock

Một lệnh x86 cực kỳ phức tạp có thể cần vài chu kỳ clock để giải mã, phụ thuộc vào bao nhiêu vi lệnh được sinh ra

- Mỗi vi lệnh dài 118 bit, PM thay vì làm việc với các vi lệnh

118bit, nó làm việc với vi lệnh 236bit (gộp lại từ hai lệnh 118 bit)

=>

Để tiết kiệm năng lượng và tăng hiệu năng

CPU cũng ít ngốn điện hơn kho có ít vi lệnh trong

mạch hơn.

Trang 15

* Đổi tên thanh ghi

- Đổi tên và nội dung của thanh ghi mà chương trình sử dụng thành một trong 40 thanh ghi bên trong ( mỗi thanh rộng 80 bit vì vậy nhận cả dữ liệu kiểu nguyên và kiểu

thực)

- Cho phép các lệnh chạy ở cùng một thời điểm với các lệnh khác cũng đang sử dụng thanh ghi đó, điều này cho phép lệnh thứ hai có thể chạy trước lệnh thứ nhất ngay cả khi chúng dùng chung thanh ghi.

Trang 16

4, Bộ đệm sắp xếp:

* Khi các vi lệnh đến ROB, cúng có thể được tải và

được thực hiện không đúng bởi đơn vị thi hành.

*Sau khi được thi hành, các lệnh được gửi trả lại bộ đêm sắp xếp Sau đó tại trạng thái nghỉ, các lệnh đã được thi

hành sẽ được ra khỏi bộ đệm với thứ tự y nguyên khi

chúng được đẩy vào

Trang 17

5, Reservation station và đơn vị thực thi:

* Pentium M sử dụng các

vi lệnh hợp từ đơn vị giải

mã gửi tới các cổng đặt tạitrạm đăng ký(RS) RS sẽphân tích các hợp lệnh này

* PM có 5 cổng gửi đi

đánh số từ 0 đến 4 trên

trạm đăng ký Mỗi cổngkết nối với một hoặc nhiềuĐơn vị thực thi, có thể thấytrong hình

Trang 18

6, Đơn vị tính toán và số học ALU:

* ALU là một mạch điện tử thực hiện các thao tác

số học và logic.

* Hầu hết các ALU đều có thể thực hiện các thao tác

Sau

- Các phép toán với bit (AND,NOT, OR, XOR)

Các thao tác với số nguyên : (cộng, trừ, nhân, chia)

- Các phép dịch bit

- Các kiến trúc sư có thể thiết kế ALU để tính toán bất

kỳ phép toán nào, ví dụ như tính toán căn bình phương của một số

Trang 19

7, Đơn vị xử lý dấu phảy động FPU (Floating

Point Unit):

* Là một bộ phận của hệ thống máy tính được thiết kế

để tính toán trên các số dấu phảy động.

* Hoạt động chính của các FPU bao gồm các phép tính toán số học thông thường như cộng, nhân

* Một số FPU có thể thực hiện các chức năng

phức tạp hơn như số mũ, logarit và lượng

giác…

Trang 20

8, Bộ nhớ Cache.

 Cache cho phép máy tính thực hiện các tác vụ

nhanh chóng hơn Máy tính có thể thực hiện các

thao tác trong một khoảng thời gian cực ngắn Thời gian để bộ xử lý truy xuất tới bộ nhớ RAM chỉ

khoảng 60 nano giây (1 nano giây bằng một phần tỉ giây)

 Pentium M có 2 cache L1, một cho dữ liệu và một cho các lệnh, sử dụng SRAM tốc độ cao thay vì

DRAM rẻ nhưng chậm.

 L2 Cache là một chip nhớ nằm giữa L1 Cache ngay trên nhân CPU và bộ nhớ hệ thống.

Trang 21

 Khi CPU xử lý, L1 Cache sẽ tiến hành kiểm tra L2 Cache xem có dữ liệu mình cần không trước khi truy cập vào bộ nhớ hệ thống Vì thế, bộ nhớ đệm càng lớn, CPU càng xử lý nhanh hơn.

 Do giá rất đắt, nên dung lượng Cache không thể tăng ồ ạt được Bộ nhớ cache chính L1 Cache vẫn chỉ ở mức từ 8 tới 32 KB Trong khi, L2 Cache

thì được đẩy lên dần tới hiện nay cao nhất

là Pentium M Dothan 2 MB (cho máy tính xách tay) và Pentium 4 Prescott 1 MB

(máy để bàn)

Trang 22

9, Giao diện bus:

 Kiến trúc Dual Independent Bus (DIB - hai tuyến bus độc lập), bus

hệ thống dùng chung được tách thành Frontside Bus (FSB - tuyến bus trước) và Backside Bus (BSB

- tuyến bus sau)

+ FSB là nhịp cầu quan trọng nối

bộ xử lý với bộ nhớ chính và tuyến bus ngoại vi.

+ BSB chỉ tập trung chuyển tải

dữ liệu giữa bộ xử lý với bộ đệm thứ cấp

=> Kiến trúc P6 tách bus hệ thống thành 2 kênh độc lập góp phần tăng hiệu năng xử lý nhờ cho

phép bộ xử lý truy xuất đồng thời trên cả hai kênh giao tiếp quan trọng

Trang 23

III, Kiến trúc tập lệnh:

 Kiến trúc lệnh chung của Intel Pentium M:

 Sử dụng kiến trúc lệnh x86, độ dài chỉ lệnh không cố định.

 Các phép toán có thể thực hiện với 8 , 16, 32, 64 bit tùy theo thế

Trang 24

1, MMX (MultiMedia eXtentions):

Gồm 57 lệnh multimedia do Intel phát triển năm 1997

Mục đích: nâng cao hiệu quả xử lý các lệnh lặp về âm thanh, hình ảnh và đồ họa

Một dòng lệnh đơn có thể xử lý đồng thời một số mục dữ

liệu

MMX (năm 1996), hiên bản cải tiến của Pentium với công nghệ MMX được Intel phát triển để đáp ứng nhu cầu về ứng dụng đa phương tiện và truyền thông

MMX kết hợp với SIMD (Single Instruction Multiple Data) cho phép xử lý nhiều dữ liệu trong cùng chỉ lệnh, làm tăng khả năng xử lý trong các tác vụ đồ họa, đa phương tiện

MMX chỉ cung cấp các thao tác với số nguyên Vào thời kỳ đầu, nó chỉ phục vụ cho toán học thông thường!

Trang 25

2, SSE (Single SIMD Extentions):

Gồm 70 lệnh mà Intel đưa vào Pentium III để phục vụ việc xử

Nhóm lệnh SSE đại diện một phần mở rộng của mô hình thực thi SIMD với công nghệ MMX SSE chỉ có thể thực thi trên

các vi xử lí Intel 64 và IA-32 mà hỗ trợ các mở rộng SSE

Trang 26

3, SSE2 (Streaming SIMD Extensions 2):

SSE2 là sự mở rộng khả năng tính toán của MMX hoạt độngtrên các thanh ghi XMM.Phần mở rộng bao gồm một bộ

điều khiển bộ nhớ cache nhằm mục đích chủ yếu để giảm thiểu

dư thừa dữ liệu không cần thiết lúc bộ nhớ cache khi xử lý

dòng thông tin vô hạn, và bổ sung một tính toán tinh vi chuyểnđổi định dạng số

SSE2 mở rộng tập lệnh MMX để hoạt động trên các thanhghi XMM Vì vậy, nó có thể chuyển đổi tất cả các mã hiện cócủa MMX sang SSE2 dưới dạng tương đương Do thanh ghiXMM dài gấp đôi thanh ghi MMX, nên vòng lặp đếm và truycập bộ nhớ phải thay đôi để phù hợp với thanh đổi này

Trang 27

IV, Chế độ định địa chỉ

Intel đã không tiết lộ các nguyên lý của Pentium M, chính vì vậy

sẽ nói về nguyên lý của Pentium III Nguyên lý của Pentium M

có thể sẽ có nhiều tầng hơn so với Pentium III nhưng việc phântích nó sẽ cho chúng ta có được ý tưởng về kiến trúc của

Pentium M làm việc như thế nào

Trên hình 1 bạn có thể thấy được nguyên lý 11 tầng của Pentium III

Trang 28

Dưới đây chúng tôi sẽ giải thích một cách cơ bản về mỗi tầng, giải thích sẽ làm sáng tỏ cách mỗi chỉ lệnh được gán được thực hiện như thế nào bởi các bộ vi xử lý lớp P6 Điều này sẽ không quá

phức tạp như bạn nghĩ Đây chỉ là tóm tắt và những giải thích cụ thể dễ hiểu sẽ được chúng tôi đưa ra bên dưới.

• IFU1: Nạp một dòng (32 byte tương đương với 256 bit) từ chỉ lệnh L1 cache và lưu nó vào trong bộ đệm luồng chỉ lệnh

(Instruction Streaming Buffer)

• IFU2: Nhận dạng các chỉ lệnh đường biên (16byte tương đương với 128bit) Vì các chỉ lệnh x86 không có một chiều dài cố định nên tầng này đánh dấu vị trí mà mỗi chỉ lệnh bắt đầu và kết thúc bên trong 16byte đã được nạp Nếu có bất kỳ nhánh nào bên trong

16byte thì địa chỉ có nó sẽ được lưu tại Branch Target Buffer (BTB), chính vì vậy CPU có thể sử dụng những thông tin này sau trên

mạnh tiên đoán nhánh của nó

Trang 29

• IFU3: Đánh dấu đơn vị giải mã chỉ lệnh của mỗi chỉ lệnh phải được gửi Có ba khối giải mã chỉ lệnh khác nhau mà chúng ta sẽ đề cập đến chúng trong phần dưới

• DEC1: Giải mã chỉ lệnh x86 thành những chỉ lệnh nhỏ RISC (các hoạt động

nhỏ) Vì CPU có đến 3 bộ giải mã chỉ lệnh nên nó có thể giải mã được đến 3 chỉ lệnh cùng lúc

• DEC2: Gửi các chỉ lệnh nhỏ vừa được giải mã vào hàng đợi chỉ lệnh đã giải mã (Decoded Instruction Queue), hàng đợi này có khả năng lưu trữ được đến 6 chỉ lệnh nhỏ Nếu chỉ lệnh đã được chuyển đổi nhiều hơn 6 chỉ lệnh nhỏ thì tầng này cần phải được lặp lại để không bỏ sót chúng

• RAT: Vì kiến trúc P6 thực hiện việc thi hành out-of-order (không tuân theo thứ

tự, viết tắt là OOO), nên giá trị của thanh ghi đã cho có thể được thay đổi bởi một chỉ lệnh được thực thi trước vị trí chương trình diễn ra, sửa dữ liệu cần thiết cho chỉ lệnh khác Chính vì vậy để giải quyết được kiểu xung đột này, tại tầng này, thanh ghi gốc được sử dụng bởi chỉ lệnh sẽ được thay đổi thành 40 thanh ghi bên trong mà kiến trúc siêu nhỏ mà P6 có

Trang 30

• ROB: Tại tầng này, ba chỉ lệnh nhỏ được giải mã sẽ nạp vào Reorder

Buffer (ROB) Nếu tất cả dữ liệu đều cần thiết cho việc thực thi của một chỉ lệnh nhỏ đã được cung cấp và nếu có một khe mở tại hàng đợi chỉ lệnh

đã giải mã Reservation Station thì chỉ lệnh này sẽ được chuyển vào hàng đợi này

• DIS: Nếu chỉ lệnh đã giải mã này lại không được gửi đến hàng đợi trên thì nó có thể được thực hiện tại tầng này Chỉ lệnh giải mã sẽ được gửi

đến khối thực thi thích hợp

• EX: Chỉ lệnh được giải mã sẽ được thực thi tại khối thực thi này Mỗi một chỉ lệnh đã giải mã này chỉ cần một chu kỳ xung nhịp để được thực thi

• RET1: Kiểm tra tại bộ đệm Reorder Buffer xem có bất kỳ chỉ lệnh đã giải

Mã nào được đánh dấu như “đã thực thi” không

Trang 31

• RET2: Khi tất cả các chỉ lệnh đã giải mã có liên quan đến chỉ lệnh x86 thực sự đã được xóa hết khỏi bộ đệm Reorder Buffer và tất cả các chỉ lệnh nhỏ (đã được giải mã) có liên quan với chỉ lệnh x86 hiện hành đã được thực thi, thì các chỉ lệnh này sẽ được xóa khỏi bộ

đệm Reorder Buffer và các thanh ghi x86 sẽ được nâng cấp (tiến

trình được quay trở về tầng RAT) Tiến trình trở lại làm việc phải

được thực hiện theo thứ tự Ba chỉ lệnh đã giải mã có thể được xóa khỏi bộ đệm Reorder Buffer trong mỗi một chu kỳ clock.

Trang 32

V, Kết Luận:

Vi xử lý Pentium M có thiết kế điện nhiệt tối đa là 5-27W phụ thuộc vào từng mẫu, hướng đến sử dụng trong các

dòng laptop

Trên pentium M, mỗi bộ giải mã nối hai lệnh đã giải mã

thành một, chúng chỉ được tách ra khi được thực thi, tại

tầng thực thi Pentium M cũnng giới thiệu công nghệ

Speedstep nâng cao (Enhanced speedstep technology)

Dựa trên nền tảng Pentium M thì Inel củng rất thành công khi tung ra nền tảng Centrino cho máy tính xách tay, các máy tính xách tay thời này sử dụng bộ xử lý Pentium M tên

mã Banias (130nm) và Dothan 90nm với mức điện năng

thiêu thụ tối đa chỉ 27W

Trang 33

Pentium M là một bộ xử lý hội tụ đầy đủ những ưu điểm của

cả 2 dòng Pentium 4 và Pentium 4M, vì vậy máy tính xách tay sử dụng bộ vi xử lý này vừa có sức mạnh tính toán của Pentium 4 vừa tiết kiệm pin như Pentium 4M

Tuy là Pentium III cải biên ( chữ M có nghĩa là

“Modification” tức “cải biên” ) nhưng Pentium M đạt sức mạnh tương đương với Pentium 4-M có xung nhịp đồng hồ cao hơn 400MHz Thí dụ như Pentium M 1.3GHz thì có sức mạnh tương đương như Pentium 4 M 1.7GHz.

Ngày đăng: 26/02/2023, 18:29

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w