Cấu trúc ARM (viết tắt từ tên gốc là Advanced RISC Machine) là một loại cấu trúc vi xử lý 32bit kiểu RISC được sử dụng rộng rãi trong các thiết kế nhúng. Do có đặc điểm tiết kiệm năng lượng, các bộ CPU ARM chiếm ưu thế trong các sản phẩm điện tử di động, mà với các sản phẩm này việc tiêu tán công suất thấp là một mục tiêu thiết kế quan trọng hàng đầu. Ngày nay, hơn 75% CPU nhúng 32bit là thuộc họ ARM, điều này khiến ARM trở thành cấu trúc 32bit được sản xuất nhiều nhất trên thế giới. CPU ARM được tìm thấy khắp nơi trong các sản phẩm thương mại điện tử, từ thiết bị cầm tay (PDA, điện thoại di động, máy đa phương tiện, máy trò chơi cầm tay, và máy tính cầm tay) cho đến các thiết bị ngoại vi máy tính (ổ đĩa cứng, bộ định tuyến để bàn.) Một nhánh nổi tiếng của họ ARM là các vi xử lý Xscale của Intel. Chính vì những ưu điểm đó, nhóm em đã sử dụng vi điều khiển STM32F407VG để hoàn thiện đề tài “Lập trình ma trân LED”. Chúng em trân trọng cảm ơn thầy đã hướng dẫn chúng em nhiệt tình để chúng em hoàn thành bài tập lớn này Trong quá trình hoàn thành bài tập này, nhóm rất mong được sự đóng góp ý kiến nhiệt tình và chân thành từ thầy và các bạn để chúng em có thể hoàn thành bài tập một cách xuất sắc nhất
Trang 1TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN
LẬP TRÌNH NHÚNG CƠ BẢN Tên đề tài: “Lập trình ma trận LED”
Giảng viên hướng dẫn: Th.S Phạm Văn Hà
Mai Ngân SơnLUANGPASERT Vilaiphone
Hà Nội, 12/2015
Trang 2MỤC LỤC
Trang 3LỜI NÓI ĐẦU
Cấu trúc ARM (viết tắt từ tên gốc là Advanced RISC Machine) là một loại cấutrúc vi xử lý 32-bit kiểu RISC được sử dụng rộng rãi trong các thiết kế nhúng Do cóđặc điểm tiết kiệm năng lượng, các bộ CPU ARM chiếm ưu thế trong các sản phẩmđiện tử di động, mà với các sản phẩm này việc tiêu tán công suất thấp là một mục tiêuthiết kế quan trọng hàng đầu
Ngày nay, hơn 75% CPU nhúng 32-bit là thuộc họ ARM, điều này khiến ARM trởthành cấu trúc 32-bit được sản xuất nhiều nhất trên thế giới CPU ARM được tìm thấykhắp nơi trong các sản phẩm thương mại điện tử, từ thiết bị cầm tay (PDA, điện thoại
di động, máy đa phương tiện, máy trò chơi cầm tay, và máy tính cầm tay) cho đến cácthiết bị ngoại vi máy tính (ổ đĩa cứng, bộ định tuyến để bàn.) Một nhánh nổi tiếng của
họ ARM là các vi xử lý Xscale của Intel
Chính vì những ưu điểm đó, nhóm em đã sử dụng vi điều khiển STM32F407VG
để hoàn thiện đề tài “Lập trình ma trân LED”
Chúng em trân trọng cảm ơn thầy đã hướng dẫn chúng em nhiệt tình để chúng emhoàn thành bài tập lớn này!
Trong quá trình hoàn thành bài tập này, nhóm rất mong được sự đóng góp ý kiếnnhiệt tình và chân thành từ thầy và các bạn để chúng em có thể hoàn thành bài tập mộtcách xuất sắc nhất!
Trang 4CHƯƠNG I Tổng quan về vi điều khiển stm32f4
1.Sơ lược về STM32:
STM32 là chip của ST, dựa trên nền lõi ARM Cortex-M Dòng ARM
Cortex™-M là thế hệ mới, thiết lập các tiêu chuẩn mới về hiệu suất, chi phí, ứng dụng chocác thiết bị cần tiêu thụ năng lượng thấp, và đáp ứng yêu cầu thời gian thực khắc
khe
Ứng dụng STM32:
Ứng dụng rộng nhỉ: từ điện tử dân dụng (tivi, đầu máy, máy giặt ), xe hơi đời
mới, game, mobile, laptop chỗ nào ARM cũng có mặt
Trang 6Tính năng nổi bật:
• Tiêu thụ năng lượng cực thấp:
• Hiệu suất cực cao:
• Coding cực dễ: Với sự đồ sộ về ngoại vi (GPIO, I2C, SPI, ADC, USB,Ethernet, CAN ), ST cung cấp cho chúng ta các thư viện trực tiếp cho mỗidòng ARM (gọi là CMSIS - Cortex Microcontroller Software InterfaceStandard), nhiệm vụ của chúng ta không thể dễ dàng hơn: khai báo và sửdụng mà thôi
• Giá tiền cực rẻ: STM32F100x giá khoảng 29K (~ 1 chú ATMega8) mà STM32F100x chạy tốc độ 24Mhz
Trang 8cơ ô tô, hệ thống kiểm soát công nghiệp và hệ thống mạng không dây Thêm vào đó làviệc lập trình được đơn giản hóa đáng kể giúp kiến trúc ARM trở thành một lựa chọntốt cho ngay cả những ứng dụng đơn giản nhất.
2.1.1 Hiệu suất cao
Để đạt được hiệu suất cao hơn, bộ vi xử lý có thể làm việc nhiều hơn hoặc làmviệc thông minh hơn Đẩy tần số hoạt động cao hơn có thể làm tăng hiệu suất nhưngcũng đi kèm với việc tiêu thụ năng lượng nhiều hơn và việc thiết kế cũng phức tạphơn Nói cách khác, cùng thực hiện những tác vụ đó nhưng bằng cách nâng cao hiệuquả tính toán trong khi vẫn hoạt động ở tần số thấp sẽ dẫn đến sự đơn giản hóa trongviệc thiết kế và ít tốn năng lượng hơn Trung tâm của bộ vi xử lý Cortex-M4 là một lõi
có cấu trúc đường ống tiên tiến 3 tầng, dựa trên kiến trúc Harvard, kết hợp nhiều tínhnăng mới mạnh mẽ như suy đoán việc rẽ nhánh, phép nhân được thực thi trong mộtchu kỳ và phép chia được thực hiện bằng phần cứng tạo nên một hiệu năng vượt trội(điểm Dhrystone là 1,25 DMIPS/MHz) Bộ vi xử lý Cortex-M4 hỗ trợ kiến trúc tậplệnh Thumb-2, giúp nó hoạt động hiệu quả hơn 70% cho mỗi MHz so với một bộ vi xử
lý ARM7TDMI-S thực thi với tập lệnh Thumb, và hiệu quả hơn 35% so với bộ xử lýARM7TDMI-S thực thi với tập lệnh ARM
2.1.2 Dễ sử dụng, phát triển ứng dụng nhanh chóng, hiệu quả
Tiêu chí quan trọng trong việc lựa chọn bộ vi xử lý là giảm thời gian và chi phíphát triển, đặc biệt là khả năng phát triển ứng dụng phải thật nhanh chóng và đơn giản
Bộ vi xử lý Cortex-M4 được thiết kế để đáp ứng mục tiêu trên Người lập trình khôngcần phải viết bất kì mã hợp ngữ nào (assembler code) hoặc cần phải có kiến thức sâu
Trang 9về kiến trúc để tạo ra một ứng dụng đơn giản Bộ vi xử lý có mô hình lập trình dựatrên ngăn xếp đã được đơn giản hoá để tương thích với kiến trúc ARM truyền thốngnhưng tương tự với hệ thống đã được triển khai trên kiến trúc 8 và 16-bit, giúp việcchuyển tiếp đến kiến trúc 32-bit dễ dàng hơn Ngoài ra một mô hình ngắt dựa trênphần cứng sẽ giúp việc viết các chương trình xử lý ngắt trở nên đơn giản hơn bao giờhết, chương trình khởi động có thể được viết trực tiếp bằng ngôn ngữ C mà không cầnbất kì một lệnh assembly nào so với kiến trúc ARM truyền thống Các tính năng chínhmới trong tập lệnh Thumb-2 bao gồm việc thực hiện mã lệnh C một cách tự nhiên hơn,thao tác trực tiếp trên các bit, phép chia phần cứng và lệnh If/Then Hơn nữa, nhìn từgóc độ phát triển ứng dụng, Thumb-2 tăng tốc độ phát triển, đơn giản hóa việc bảo trì,
hỗ trợ các đối tượng biên dịch thông qua tối ưu hóa tự động cho cả hiệu suất và mật độ
mã mà không cần quan tâm đến việc mã được biên dịch cho chế độ ARM hoặcThumb Kết quả là lập trình viên có thể để mã nguồn của họ trong ngôn ngữ C màkhông cần tạo ra các thư viện đối tượng biên dịch sẵn, có nghĩa là khả năng tái sử dụng
mã nguồn lớn hơn nhiều
2.1.3 Giảm chi phí phát triển và năng lượng tiêu thụ
Chi phí luôn là rào cản lớn nhất cho sự lựa chọn một bộ vi xử lý hiệu suất cao Bộ
vi xử lý được thiết kế trên một diện tích nhỏ sẽ giảm chi phí đáng kể Bộ vi xử lý Cortex-M4 thực hiện điều này bằng cách cài đặt các lõi ARM nhỏ nhất từ trước đến nay, chỉ với 33.000 cổng (cổng có thể là NAND hoặc NOR… tuỳ vào công nghệ sản xuất) trong lõi trung tâm (0.18um G) và bằng cách kết hợp hiệu quả, chặt chẽ các thành phần trong hệ thống vi xử lý Bộ nhớ được tối giản bằng cách cài đặt bộ nhớ không thẳng hàng (unaligned), thao tác bit dễ dàng với kĩ thuật bit banding Tập lệnh Thumb-2 tiết kiệm bộ nhớ hơn 25%so với tập lệnh ARM
Để đáp ứng nhu cầu ngày càng tăng trong việc tiết kiệm năng lượng ở các ứng dụng mạng không dây…, bộ vi xử lý Cortex-M4 hỗ trợ mở rộng xung nhịp cho các cổng (cóthể ngừng cung cấp xung nhịp cho các cổng để tiết kiệm năng lượng) và tích hợp chế
độ ngủ Kết quả là bộ vi xử lý chỉ tiêu thụ 4.5mW điện năng và chiếm diện tích 0.3 mm2 (silicon footprint) khi triển khai ở tần số 50MHz trên quá trình công nghệ TSMC0.13G, sử dụng tế bào tiêu chuẩn ARM Metro
2.1.4 Tích hợp khả năng dò lỗi và theo vết trong lập trình
Hệ thống nhúng thường không có giao diện người dùng đồ họa (GUI) làm choviệc gỡ lỗi chương trình trở thành một thách thức thật sự đối các lập trình viên Banđầu, bộ ICE (In-circuit Emulator) đã được sử dụng để tạo một cửa sổ theo dõi hệ thống
Trang 10thông qua một giao diện quen thuộc như trên PC Tuy nhiên khi hệ thống ngày càngnhỏ và phức tạp hơn, phương pháp này không còn khả thi nữa Công nghệ gỡ lỗi của
bộ vi xử lý Cortex-M4 được cài đặt trong chính phần cứng của nó (kết hợp với một vàithành phần khác) giúp gỡ lỗi nhanh hơn với các tính năng trace & profiling,breakpoints, watchpoints và bản vá lỗi giúp rút ngắn thời gian phát triển ứng dụng.Ngoài ra, bộ vi xử lý còn cung cấp một mức nhìn cao hơn vào hệ thống thông quacổng JTAG truyền thống hoặc cổng SWD (Serial Wire Debug) chỉ sử dụng 2 đườngtín hiệu, thích hợp cho các thiết bị có kiểu đóng gói nhỏ gọn
2.1.5 Chuyển từ dòng xử lý ARM7 sang Cortex-M4 để hoạt động và sử dụng
năng lượng hiệu quả hơn
Trong gần một thập kỷ qua, dòng vi xử lý ARM7 đã được sử dụng rất rộng rãi Bộ
vi xử lý Cortex-M4 được xây dựng trên nền tảng này nên việc nâng cấp từ dòngARM7 lên Cortex-M4 là hợp lý và dễ dàng Lõi trung tâm làm việc hiệu quả hơn, môhình lập trình đơn giản, cách xử lý ngắt tất định (deterministic interrupt behaviour),việc tích hợp các thiết bị ngoại vi giúp nâng cao hiệu năng làm việc mà vẫn giữ đượcchi phí thấp
Bảng 1 So sánh ARM7TDMI-S và Cortex-M4 (100MHz - TSMC 0.18G)
(*: Không bao gồm các thiết bị ngoại vi (MPU & ETM) hoặc các thành phần tích hợpkhác)
Trang 11Hình 1 So sánh hiệu suất giữa ARM7TDMI-S (ARM) và Cortex-M4 (Thumb-2)
Hình 2 So sánh kích thước mã lệnh giữa ARM7TDMI-S (ARM) và Cortex-M4(Thumb-2)
2.2 Kiến trúc và tính năng vi xử lý Cortex-M4
Bộ vi xử lý Cortex-M4 dựa trên kiến trúc ARMv7-M có cấu trúc thứ bậc Nó tíchhợp lõi xử lý trung tâm, gọi là CM3Core, với các thiết bị ngoại vi hệ thống tiên tiến đểtạo ra các khả năng như kiểm soát ngắt, bảo vệ bộ nhớ, gỡ lỗi và theo vết hệ thống.Các thiết bị ngoại vi có thể được cấu hình một cách thích hợp, cho phép bộ vi xử lýCortex-M4 đáp ứng được rất nhiều ứng dụng và yêu cầu khắt khe của hệ thống Lõicủa bộ vi xử lý Cortex-M4 và các thành phần tích hợp (hình 3) đã được thiết kế đặcbiệt để đáp ứng yêu cầu bộ nhớ tối thiểu, năng lượng tiêu thụ thấp và thiết kế nhỏ gọn
2.2.1 Lõi Cortex-M4
Lõi trung tâm Cortex-M4 dựa trên kiến trúc Harvard, được đặc trưng bằng sự táchbiệt giữa vùng nhớ chứa dữ liệu và chương trình do đó có các bus riêng để truy cập
Trang 12(hình 3) Đặc tính này khác với dòng ARM7 dựa trên kiến trúc Von Neumann sử dụngchung vùng nhớ để chứa dữ liệu và chương trình, do đó dùng chung bus cho việc truyxuất Vì có thể đọc cùng lúc lệnh và dữ liệu từ bộ nhớ, bộ vi xử lý Cortex-M4 có thểthực hiện nhiều hoạt động song song, tăng tốc thực thi ứng dụng.
Hình 3 Bộ vi xử lý Cortex-M4
Lõi Cortex có cấu trúc đường ống gồm 3 tầng: Instruction Fetch, InstructionDecode và Instruction Execute Khi gặp một lệnh nhánh, tầng decode chứa một chỉ thịnạp lệnh suy đoán có thể dẫn đến việc thực thi nhanh hơn Bộ xử lý nạp lệnh dự định
rẽ nhánh trong giai đoạn giải mã Sau đó, trong giai đoạn thực thi, việc rẽ nhánh đượcgiải quyết và bộ vi xử lý sẽ phân tích xem đâu là lệnh thực thi kế tiếp Nếu việc rẽ
Trang 13nhánh không được chọn thì lệnh tiếp theo đã sẵn sàng Còn nếu việc rẽ nhánh đượcchọn thì lệnh rẽ nhánh đó cũng đã sẵn sàng ngay lập tức, hạn chế thời gian rỗi chỉ cònmột chu kỳ.
Lõi Cortex-M4 chứa một bộ giải mã cho tập lệnh Thumb truyền thống và
Thumb-2 mới, một ALU tiên tiến hỗ trợ nhân chia phần cứng, điều khiển logic, và các giaotiếp với các thành phần khác của bộ xử lý
Bộ vi xử lý Cortex-M4 là một bộ vi xử lý 32-bit, với độ rộng của đường dẫn dữliệu 32 bit, các dải thanh ghi và giao tiếp bộ nhớ Có 13 thanh ghi đa dụng, hai con trỏngăn xếp, một thanh ghi liên kết, một bộ đếm chương trình và một số thanh ghi đặcbiệt trong đó có một thanh ghi trạng thái chương trình
Bộ vi xử lý Cortex-M4 hỗ trợ hai chế độ hoạt động (Thread và Handler) và haimức truy cập tài nguyên của lõi xử lí (đặc quyền và không đặc quyền), tạo điều kiệncho việc cài đặt các hệ thống mở và phức tạp nhưng vẫn bảo mật Những dòng mãkhông đặc quyền bị giới hạn hoặc không cho phép truy cập vào một số tài nguyênquan trọng (một số lệnh đặc biệt và các vùng nhớ nhất định) Chế độ Thread là chế độhoạt động tiêu biểu hỗ trợ cả mã đặc quyền và không đặc quyền Bộ vi xử lý sẽ vàochế độ Handler khi một ngoại lệ (exception) xảy ra và tất cả các mã là đặc quyền trongchế độ này Ngoài ra, tất cả các hoạt động trong bộ vi xử lý đều thuộc một trong haitrạng thái hoạt động: Thumb cho chế độ thực thi bình thường và Debug cho việc gỡlỗi
Bộ vi xử lý Cortex-M4 là một hệ thống ánh xạ bộ nhớ đơn giản, quản lí vùng nhớ
cố định lên tới 4 gigabyte với các địa chỉ định nghĩa sẵn, dành riêng cho mã lệnh (vùng
mã lệnh), SRAM (vùng nhớ), bộ nhớ/thiết bị bên ngoài, thiết bị ngoại vi bên trong vàbên ngoài Ngoài ra còn có một vùng nhớ đặc biệt dành riêng cho nhà cung cấp
Trang 14Hình 4 Bản đồ bộ nhớ
Bộ vi xử lý Cortex-M4 cho phép truy cập trực tiếp đến từng bit dữ liệu trong các
hệ thống đơn giản bằng cách thực thi một kỹ thuật được gọi là bit-banding (hình 5) Bộnhớ bao gồm hai vùng bit-band (mỗi vùng 1MB) trong SRAM và vùng bí danh 32MBcủa vùng không gian ngoại vi (Mỗi byte trong vùng bí danh sẽ tương ứng với một bittrong vùng bit-band) Mỗi hoạt động nạp/lưu tại một địa chỉ trong khu vực bí danh(alias region) sẽ trực tiếp tương ứng với hoạt động trên bit được đại diện bởi bí danh
đó Cụ thể, khi ghi giá trị 0x01 vào một địa chỉ trên vùng bí danh thì có nghĩa là xácđịnh bit tương ứng sẽ có giá trị là 1, tương tự giá trị 0x00 sẽ xác định bit tương ứng cógiá trị 0 Còn đọc giá trị tại một địa chỉ vùng bí danh có nghĩa là đọc được giá trị củabit tương ứng Một vấn đề cần chú ý nữa là hoạt động này mang tính nguyên tử (khôngchia nhỏ được nữa), không thể bị gián đoạn bởi các hoạt động khác trên bus
Trang 15Các hệ thống cũ dựa trên ARM7 chỉ hỗ trợ truy xuất dữ liệu thẳng hàng, chỉcho phép lưu trữ và truy xuất dữ liệu của một khối bộ nhớ mà mỗi phần tử có đơn vị làmột word Bộ vi xử lý Cortex-M4 hỗ trợ truy xuất dữ liệu không thẳng hàng, cho phépchuyển dữ liệu không thẳng hàng trong một truy xuất đơn Thực tế, việc chuyển dữliệu không thẳng hàng được biến thành việc chuyển nhiều lần dữ liệu thẳng hàng và cótính trong suốt đối với lập trình viên (nghĩa là lập trình viên hoàn toàn không cần quantâm đến điều này) Ngoài ra bộ vi xử lý Cortex-M4 cũng hỗ trợ phép nhân 32-bit hoạtđộng trong một chu trình đơn và các phép chia có dấu, không dấu với các lệnh SDIV
và UDIV, mất từ 2 đến 12 chu kỳ phụ thuộc vào kích thước của toán hạng Phép chiađược thực thi nhanh hơn nếu số chia và số bị chia có kích thước tương tự nhau Nhữngcải tiến trong khả năng toán học giúp Cortex-M4 trở thành bộ vi xử lý lý tưởng chocác ứng dụng thiên về tính toán như đọc cảm biến hoặc các hệ thống mô phỏng
2.2.2 Kiến trúc tập lệnh Thumb-2
ARMv7-M là cấu hình vi điều khiển của kiến trúc ARMV7 và khác với các kiếntrúc ARM trước đó ở chỗ nó chỉ hỗ trợ tập lệnh Thumb-2 Tập lệnh Thumb-2 là sự phatrộn giữa tập lệnh 16 và 32 bit, đạt được hiệu suất của các lệnh ARM 32 bit, đồng thờiphù hợp với mật độ mã cũng như tương thích ngược với tập lệnh gốc Thumb 16 bit
Trang 16CHƯƠNG II Giới thiệu về Coocox IDE
1 Hướng dân cài đặt
Đầu tiên mình vào trang chủ Coocox.org để tải Coocox IDE bản mới nhất:
Tải về tại đâyChọn Download the latest CooCox CoIDE Chúng ta download CoCenter-1.4.9.exe cài vào máy
Sau đó Open và download các phần mềm chính bao gồm IDE; CooCox smart chúng
ta có thể download tất cả các phần này về tùy nhu cầu sử dụng của các bạn.Sau khi đã tải xong trên cửa sổ CoCenter sẽ có tag install nhấn install để cài đặt
Bước 1: Tạo project mới ->Creat new project
Trang 17Bước 2: Đặt tên projectBước 3: Tùy theo các bạn làm chip hay là KIT có sẵn, ở đây mình dùng
KIT STM32F0 Discovery
Trang 18Bước 4: Config lại chip cho đúng vs KIT mà ta sử dụng
Trang 19Bước 5: Chọn thư viện ngoại vi mà chúng ta sử dụng như hình:
Bước 6: Chúng ta bắt đầu add example mà nó gợi ý xem sao:
Trang 20Bước 7: Sau khi Add xong, chúng ta Buil nó bằng phím F7 hoặc Project->BuildNhưng khi build nó sẽ xuất hiên thông báo chưa có bộ TRÌNH DỊCH GNU, trình dịch
mình sử dụng là GCC
Trang 21chúng ta khắc phục nó như sau:
B7.1 Tải theo link mà mình đã up:
arm-2011.03-coocoxTải về giải nén vào thư mục cài đặt của bạnB7.2 Chọn Ok, nó sẽ bảo chúng ta dẫn đến thư mục có file "arm-none-eabi-gcc", các
bạn dẫn đến thư mục bin mà các bạn đã giải nén lúc nảy
Trang 22sau đó các bạn sẽ Buil được
Bước 8: Debug nó và Run cho nó chạy lên KIT thôi
Khi Run nó sẽ có kết quả là 2 led pc8 và pc9 chớp tắt