1. Trang chủ
  2. » Giáo Dục - Đào Tạo

TRÍ TUỆ NHÂN tạo TRONG BOBOT NHẬN DIỆN, PHÂN LOẠI rác SINH HOẠT

19 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Trí Tuệ Nhân Tạo Trong Bobot Nhận Diện, Phân Loại Rác Sinh Hoạt
Tác giả Nguyễn Quang Sáng, Vương Sỹ Phúc
Người hướng dẫn TS. Nguyễn Xuân Thuận, TS. Hoàng Hồng Hải
Trường học Trường Đại Học Công Nghệ Thông Tin và Truyền Thông
Chuyên ngành Trí tuệ nhân tạo
Thể loại Báo cáo thực hiện đề tài
Năm xuất bản 2018
Thành phố Hà Nội
Định dạng
Số trang 19
Dung lượng 2,13 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

3.Cơ sở lý thuyết mạng • Về Google Colab: Google Colab Google Colaboratory là trang web online cho hỗ trợ chạy code Python trực tiếp thông qua trình duyệt , phù hợp với Data analysis phâ

Trang 1

TRÍ TUỆ NHÂN TẠO

TRONG BOBOT

Trang 2

NHẬN DIỆN, PHÂN LOẠI RÁC

SINH HOẠT

Nguyễn Quang Sáng - 20184600

Vương Sỹ Phúc - 20184579

Môn học : Trí tuệ nhân tạo trong robot

GVHD : TS Nguyễn Xuân Thuận

TS Hoàng Hồng Hải

Sinh viên thực hiện

Trang 3

1 Lý do chọn đề tài:

• Phân loại rác ở Việt Nam chưa được chú trọng.

Trang 4

2 Mục tiêu:

• Hoàn thành đề tài.

• Nhận biết và phân loại được các sản phẩm rác như: đồ

nhựa, chai lọ thủy tinh, pin và rác hữu cơ,….

Trang 5

3.Cơ sở lý thuyết mạng

• Về Google Colab:

Google Colab (Google Colaboratory) là trang web online cho hỗ trợ chạy code Python trực tiếp thông qua trình duyệt , phù hợp với Data analysis (phân tích dữ liệu),

machine learning (máy học) và giáo dục

Không đòi hỏi cấu hình máy tính mà sử dụng tài nguyên máy tính từ các hệ thống sẵn có (CPU, GPUs, TPUs)

Trang 6

• Về mạng nơ ron tích chập (CNN- Convolution Neural Network)

- Giới thiệu:

+Trong mạng neural, mô hình mạng neural tích chập (CNN) là 1 trong những mô

hình để nhận dạng và phân loại hình ảnh

+CNN phân loại hình ảnh bằng cách lấy 1 hình ảnh đầu vào, xử lý và phân loại nó theo

các hạng mục nhất định

Máy tính coi hình ảnh đầu vào là 1 mảng pixel ,dựa trên độ phân giải hình ảnh, máy

tính sẽ thấy H x W x D (H: Chiều cao, W: Chiều rộng, D: Độ dày)

Mảng ma trận RGB 6x6x3 (3 -giá trị RGB)

3.Cơ sở lý thuyết mạng

Trang 7

+Mô hình CNN để training và kiểm tra, mỗi hình ảnh đầu vào sẽ chuyển nó qua 1 loạt các lớp tích chập với các bộ lọc (Kernals), tổng hợp lại các lớp được kết nối đầy đủ (Full

Connected) và áp dụng hàm Softmax để phân loại đối tượng có giá trị xác suất giữa 0 và 1

3.Cơ sở lý thuyết mạng

Luồng CNN để xử lý hình ảnh đầu vào và phân loại các đối tượng dựa trên giá trị

Trang 8

3.Cơ sở lý thuyết mạng

-Lớp tích chập (Convolution Layer)

Mỗi nơ ron tích chập(filter/kernel) chỉ kết nối cục bộ với dữ liệu đầu vào, là lớp đầu tiên

để trích xuất các tính năng từ hình ảnh đầu vào Chiều sâu của nơ-ron tích chập bằng

chiều sâu của khối dữ liệu đầu vào

Nơ ron tích chập trượt từ trái sang phải, từ trên xuống dưới khối dữ liệu đầu vào và tính toán để sinh ra một bản đồ kích hoạt ( activation map )

Trang 9

3.Cơ sở lý thuyết mạng

-Bước nhảy ( Stride )

Stride là số pixel thay đổi trên ma trận đầu vào Khi stride là 1 thì ta di chuyển các kernel

1 pixel Khi stride là 2 thì ta di chuyển các kernel đi 2 pixel và tiếp tục như vậy

-Đường viền (Padding)

Đôi khi kernel không phù hợp với hình ảnh đầu vào,ta có thể chèn thêm các số 0 vào 4 đường biên của hình ảnh (zero padding)

Trang 10

3.Cơ sở lý thuyết mạng

Giả sử có thêm nơ-ron tích chập khác thì nó cũng hoạt động tương tự và sinh ra bản

đồ kích hoạt thứ hai( trọng số khác nhau) Các bản đồ kích hoạt ghép với nhau thành

một “ảnh mới”

Mạng nơ-ron tích chập là một dãy các lớp tích chập nối liên tiếp nhau xen kẽ bởi các hàm kích hoạt (ví dụ ReLU)

Trang 11

3.Cơ sở lý thuyết mạng

-Hàm phi tuyến (ReLU)

ReLU viết tắt của Rectified Linear Unit, là 1 hàm phi tuyến Với đầu ra là: ƒ (x) = max (0, x) ,

nó chuyển các giá trị âm thành 0 và giữ nguyên giá trị dương

-Lớp gộp (Pooling Layer)

Giúp giảm độ phân giải của khối dữ liệu để giảm bộ nhớ và khối lượng tính toán

Hoạt động độc lập trên từng bản đồ kích hoạt

Pooling có thể có nhiều loại khác nhau: Max Pooling ,Average Pooling ,Sum Pooling

Trang 12

3.Cơ sở lý thuyết mạng

Lớp gộp max pooling giúp mạng biểu diễn bất biến đối với các thay đổi tịnh tiến

(translation invariance) hoặc biến dạng (deformation invariance) của dữ liệu đầu vào

Max pooling lấy phần tử lớn nhất từ ma trận đối tượng

Trang 13

• Đầu vào của lớp tích chập là hình ảnh

• Chọn đối số, áp dụng các bộ lọc với các bước nhảy, padding nếu cần Thực hiện tích chập cho hình ảnh và áp dụng hàm kích hoạt ReLU cho ma trận hình ảnh

• Thực hiện MaxPooling để giảm kích thước cho hình ảnh

• Thêm nhiều lớp tích chập sao cho phù hợp

• Xây dựng đầu ra và dữ liệu đầu vào thành 1 lớp được kết nối đầy đủ (Full Connected)

• Sử dụng hàm kích hoạt để tìm đối số phù hợp và phân loại hình ảnh

3.Cơ sở lý thuyết mạng

Trang 14

4.Code và kết quả thu được

Trang 15

4.Code và kết quả thu được

Trang 16

4.Code và kết quả thu được

Trang 17

4.Code và kết quả thu được

Trang 18

4.Code và kết quả thu được

Trang 19

THANK YOU !

Ngày đăng: 25/12/2022, 05:02

🧩 Sản phẩm bạn có thể quan tâm

w