1. Trang chủ
  2. » Luận Văn - Báo Cáo

hỗ trợ quyết định học chuyển giao

34 6 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 34
Dung lượng 754,45 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Các ví dụ này sau đó được sử dụng làm "giáo viên" bởi một thuật toán máy học để "đào tạo" một mô hình có thể được áp dụng cho dữ liệu mới.. Sau đó, một hệ thống máy học có thể sử dụng nh

Trang 1

VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC

HÀ NỘI - 2020

Trang 2

Mục lục

Lời nói đầu

1.1 Khái niệm 1

1.1.1 AI, máy học và học chuyển giao 1

1.1.2 Các vấn đề nghiên cứu cơ bản trong học chuyển giao 4

1.2 Ứng dụng của học chuyển giao 5

1.2.1 Hiểu hình ảnh 5

1.2.2 Tin sinh học và hình ảnh sinh học 5

1.2.3 Hệ thống đề xuất và lọc cộng tác 6

1.2.4 Robotics và ô tô tự hành 6

1.2.5 NLP và Khai thác văn bản 6

1.2.6 Ghi chú lịch sử 7

2 Học chuyển giao dựa trên mẫu 8 2.1 Giới thiệu 8

2.2 Phương pháp phi quy nạp 9

2.2.1 Phân biệt dữ liệu nguồn và đích 10

2.2.2 Phương pháp nhân phù hợp 10

2.3 Phương pháp quy nạp 11

2.3.1 Tích hợp của miền nguồn và sự tổn thất miền đích 11

2.3.2 Phương pháp Boosting-Style 13

2.3.3 Phương pháp tạo thế hệ 14

3 Học chuyển giao dựa trên đặc trưng 15 3.1 Giới thiệu 15

3.2 Sai lệch tối thiểu của miền 16

3.2.1 Sai lệch trung bình tối đa 16

3.2.2 Khoảng cách Bregman dựa trên Regularization 18

3.2.3 Đo lường với các giả định về phân phối cụ thể 19

3.2.4 Đo lường sự chênh lệch miền phụ thuộc dữ liệu 19

3.3 Tìm hiểu về các đặc trưng phổ biến 20

3.3.1 Học mã hóa universal 21

3.3.2 Đặc trưng universal sâu 21

3.4 Đặc trưng tăng cường 22

Trang 3

4 Học dựa trên mô hình 24

4.1 Giới thiệu 24

4.2 Chuyển giao qua các thành phần chung 25

4.2.1 Học chuyển giao thông qua các quá trình Gauss 26

4.2.2 Chuyển giao thông qua các mô hình Bayes 27

4.3 Học chuyển giao qua chính quy hóa 27

Trang 4

Lời nói đầu

Ngày nay,cùng với sự phát triển của kinh tế xã hội, không ai có thể phủ nhận vai trò đặc biệt của AItrong những tiến bộ công nghệ hiện đại AI đang có mặt ở mọi lĩnh vực từ y tế,ngân hàng tới giải trí Ngày nay đa phần các công việc được máy móc, phần mềm hay các quy trình tự động hóa đảm trách

Do đó,máy học đã phát triển từ một môn học tối nghĩa thành một lực lượng công nghiệp và chính thốngtrong việc tự động hóa các quyết định từ thương mại trưc tuyến và hướng đến giáo dục, chăm sóc sứckhỏe Mặc dù một mô hình máy học có thể được thực hiện để có chất lượng cao nhưng nó cũng có thểmắc lỗi, đặc biệt là khi mô hình được áp dụng cho các kịch bản khác nhau từ môi trường đào tạo của nó.Điều này dẫn đến hiệu suất giảm cho thấy mô hình có thể bị lỗi thời và cần cập nhật khi có tình huốngmới xảy ra Cần phải cập nhật hoặc chuyển các mô hình từ kịch bản này sang kịch bản khác là vô cùngquan trọng

Bài báo cáo nghiên cứu về nội dung Học chuyển giao Nội dung của báo cáo được trình bày trong 4phần

1 Phần 1: Giới thiệu : Giới thiệu khái quát về học chuyển giao bao gồm các khái niệm, các vấn đềnghiên cứu cơ bản, và ứng dụng của học chuyển giao

2 Phần 2: Học chuyển giao dựa trên mẫu: Giới thiệu cơ bản và các phương pháp của học chuyển giaodựa trên mẫu

3 Phần 3: Học chuyển giao dựa trên đặc trưng: Giới thiệu cơ bản về học chuyển giao dựa trên đặctrưng, sự sai lệch tối thiểu của miền và tìm hiểu về các đặc trưng phổ biến

4 Phần 4: Học chuyển giao dựa trên mô hình: Giới thiệu cơ bản về học chuyển giao dựa trên mô hình

và chuyển giao qua các thành phần chung

Trong quá trình thực hiện báo cáo cùng với sự giúp đỡ, chỉ bảo tận tình của thầy Lê Chí Ngọc, nhóm 6chúng em đã có những hiểu biết cơ bản về Học chuyển giao Quá trình làm báo cáo không thể tránh khỏisai sót, chúng em rất nhận được sự đóng góp từ thầy để bài báo cáo hoàn thiện hơn

Chúng em xin chân thành cảm ơn

Trang 5

Chương 1

Giới thiệu

1.1.1 AI, máy học và học chuyển giao

AI là một tầm nhìn do Alan Turing khởi xướng khi anh đặt câu hỏi nổi tiếng: "Máy móc có nghĩ đượckhông?" Câu hỏi này đã thúc đẩy các thế hệ nhà nghiên cứu khám phá những cách để khiến máy móchoạt động thông minh Trong suốt lịch sử gần đây, Al đã trải qua nhiều thăng trầm, phần lớn trong số

đó phát triển xung quanh câu hỏi thường gặp về cách máy móc có thể thu nhận kiến thức từ thế giới bênngoài

Nỗ lực làm cho máy móc nghĩ như con người đã đi một chặng đường dài, từ các cơ sở tri thức giốngnhư quy tắc bắt buộc cho đến học máy từ dữ liệu Do đó, máy học đã phát triển từ một môn học tốinghĩa thành một lực lượng công nghiệp và chính thống trong việc tự động hóa các quyết định từ thươngmại trực tuyến và hướng đến giáo dục và chăm sóc sức khỏe Học máy đang trở thành một công nghệchung cho thế giới nhờ khả năng mạnh mẽ của nó để cung cấp kiến thức cho máy móc bằng cách chophép chúng học và thích nghi thông qua dữ liệu được dán nhãn và không nhãn Máy học tạo ra các môhình dự đoán từ dữ liệu, do đó thường yêu cầu dữ liệu được xác định rõ ràng như là giáo viên dạy dữliệu để giúp điều chỉnh các mô hình thống kê Các mẫu dữ liệu trong các ví dụ đào tạo thường được "dánnhãn", điều đó có nghĩa là các quan sát và kết quả của các dự đoán trong cung dữ liệu đào tạo được kếthợp và tương quan Các ví dụ này sau đó được sử dụng làm "giáo viên" bởi một thuật toán máy học để

"đào tạo" một mô hình có thể được áp dụng cho dữ liệu mới

Người ta có thể tìm thấy nhiều ví dụ minh họa về học máy trong thế giới thực Một ví dụ là tronglĩnh vực nhận dạng khuôn mặt trong phân tích hình ảnh dựa trên máy tính Giả sử rằng chúng tôi đãthu được một kho ảnh lớn được chụp trong nhà Sau đó, một hệ thống máy học có thể sử dụng những

dữ liệu này để huấn luyện một mô hình báo cáo xem một bức ảnh mới có tương ứng với một người xuấthiện trong nhóm hay không Một ứng dụng của mô hình này sẽ là một hệ thống an ninh cổng cho mộttòa nhà, trong đó một nhiệm vụ sẽ là xác định xem khách truy cập có phải là nhân viên trong tổ chứchay không

Mặc dù một mô hình máy học có thể được thực hiện để có chất lượng cao, nó cũng có thể mắc lỗi,đặc biệt là khi mô hình được áp dụng cho các kịch bản khác nhau từ môi trường đào tạo của nó Ví dụ:nếu một bức ảnh mới được chụp từ môi trường ngoài trời với cường độ ánh sáng và mức độ nhiễu khácnhau như bóng, ánh sáng từ các thiên thần khác nhau và sự tắc nghẽn của người qua đường, thì khả năngnhận dạng của hệ thống có thể giảm mạnh Điều này là do mô hình được đào tạo bởi hệ thống máy học

Trang 6

được áp dụng cho một kịch bản "khác" Hiệu suất giảm này cho thấy các mô hình có thể bị lỗi thời vàcần cập nhật khi có tình huống mới xảy ra Cần phải cập nhật hoặc chuyển các mô hình từ kịch bản nàysang kịch bản khác là có tầm quan trọng.

Nhu cầu học chuyển giao không giới hạn trong việc hiểu hình ảnh Một ví dụ khác là hiểu các tin nhắnvăn bản Twitter bằng các kỹ thuật xử lý ngôn ngữ tự nhiên (NLP) Giả sử chúng tôi muốn phân loại cáctin nhắn Twitter thành các tâm trạng người dùng khác nhau như vui hay buồn theo nội dung của nó.Khi một mô hình được xây dựng bằng cách sử dụng một tập hợp các thông điệp Twitter và sau đó được

áp dụng cho dữ liệu mới, hiệu suất sẽ giảm đáng kể vì một cộng đồng người khác sẽ rất có thể đưa ra ýkiến khác nhau Điều này xảy ra khi chúng ta có thanh thiếu niên trong một nhóm và trưởng thành trongmột nhóm khác Như các ví dụ trước đã chứng minh, một thách thức lớn trong việc thực hành học tậptrong nhiều ứng dụng là các mô hình không hoạt động tốt trong các lĩnh vực nhiệm vụ mới Lý do tạisao chúng không hoạt động tốt có thể là do một trong nhiều lý do: thiếu dữ liệu đào tạo mới do tháchthức dữ liệu nhỏ, thay đổi hệ thống và thay đổi nhiệm vụ Ví dụ, trong một tình huống mới, dữ liệu đàotạo chất lượng cao có thể bị thiếu hụt nếu không thường không thể lấy được để đào tạo lại mô hình, nhưtrong trường hợp chẩn đoán y khoa và dữ liệu hình ảnh y tế Mô hình học máy không thể làm tốt nếukhông có đủ dữ liệu đào tạo Thu thập và ghi nhãn dữ liệu mới thường tốn nhiều công sức và tài nguyêntrong một miền ứng dụng mới, đây là một trở ngại lớn trong việc hiện thực hóa Al trong thế giới thực

Có các hệ thống AI được thiết kế tốt mà không cần dữ liệu đào tạo cần thiết giống như có một chiếc xethể thao mà không cần năng lượng Cuộc thảo luận này nêu bật một rào cản lớn trong việc đưa máy họcvào thế giới thực tế: không thể thu thập số lượng lớn dữ liệu trong mỗi miền trước khi áp dụng học máy

Ở đây chúng tôi tóm tắt một số lý do để phát triển phương pháp học chuyển giao như sau:

1 Nhiều ứng dụng chỉ có dữ liệu nhỏ: sự thành công hiện tại của việc học máy phụ thuộc vào sự sẵn cócủa một lượng lớn dữ liệu được dán nhãn Tuy nhiên, dữ liệu được dán nhãn chất lượng cao thường

bị thiếu Các phương pháp học máy truyền thống thường không thể khái quát tốt cho các kịch bảnmới, dẫn đến hiện tượng “overfitting” và thất bại trong nhiều trường hợp như vậy

2 Các mô hình học máy cần phải mạnh mẽ: học máy truyền thống gồm mười người đưa ra giả địnhrằng cả dữ liệu đào tạo và kiểm tra đều được rút ra từ cùng một phân phối Tuy nhiên, giả địnhnày quá mạnh để nắm giữ nhiều kịch bản thực tế Trong nhiều trường hợp, phân phối thay đổi theothời gian và không gian và khác nhau giữa các tình huống, vì vậy chúng tôi có thể không bao giờ

có quyền truy cập vào dữ liệu đào tạo mới để đi cùng phân phối thử nghiệm Trong các tình huốngkhác với dữ liệu huấn luyện, các mô hình được đào tạo cần điều chỉnh trước khi chúng có thể được

sử dụng

3 Cá nhân hóa và chuyên môn hóa là những vấn đề quan trọng điều quan trọng và có thể cung cấpdịch vụ được cá nhân hóa cho mọi người dùng theo thị hiếu và nhu cầu cá nhân Trong nhiều ứngdụng trong thế giới thực, chúng tôi chỉ có thể thu thập rất ít dữ liệu cá nhân từ một người dùng

cá nhân Kết quả là, các phương pháp nghiêng máy truyền thống bị các vấn đề khởi động lạnh khichúng ta cố gắng thích ứng một mô hình chung với một tình huống cụ thể

4 Quyền riêng tư và bảo mật dữ liệu của người dùng là những vấn đề quan trọng: thường trong cácứng dụng của chúng tôi, chúng tôi phải làm việc với các tổ chức khác bằng cách tận dụng nhiều bộ

dữ liệu Thông thường các bộ dữ liệu này có chủ sở hữu khác nhau và không thể tiết lộ cho nhau vềquyền riêng tư hoặc bảo mật Khi xây dựng một mô hình cùng nhau, chúng tôi mong muốn tríchxuất "bản chất" của từng bộ dữ liệu và điều chỉnh chúng trong việc xây dựng một mô hình mới Vídụ: nếu chúng ta có thể điều chỉnh mô hình chung ở "cạnh" của mạng thiết bị, thì dữ liệu được lưutrữ trên thiết bị không cần phải được tải lên để nâng cao mô hình chung, do đó, có thể đảm bảoquyền riêng tư của thiết bị cạnh

Các mục tiêu này cho các hệ thống thông minh đã thúc đẩy sự phát triển của học chuyển, Tóm lại, chuyểngiao liên quan đến mô hình học máy trong đó một thuật toán trích xuất kiến thức từ một hoặc nhiều bối

Trang 7

cảnh ứng dụng để giúp tăng hiệu suất học tập trong kịch bản mục tiêu So với học máy thông thường, đòihỏi một lượng lớn dữ liệu đào tạo được xác định rõ làm đầu vào, học chuyển có thể được hiểu là một môhình học tập mới, phần còn lại của cuốn sách sẽ đề cập chi tiết Học chuyển giao cũng là một động lực đểgiải quyết cái gọi là sự cố thưa thớt dữ liệu và vấn đề bắt đầu lạnh ở nhiều quy mô lớn và ứng dụng (ví

dụ, dữ liệu xếp hạng người dùng được gắn nhãn trong các hệ thống khuyến nghị trực tuyến có thể quá ít

để cho phép các hệ thống trực tuyến này xây dựng mức cao hệ thống giới thiệu chất lượng) Học chuyển

có thể giúp thúc đẩy Al trong các lĩnh vực ứng dụng kém phát triển, cũng như các khu vực địa lý kémphát triển về mặt kỹ thuật ngay cả khi không có nhiều dữ liệu được cung cấp trong các lĩnh vực nhưvậy Ví dụ: giả sử chúng tôi muốn xây dựng một hệ thống giới thiệu sách trong một ứng dụng mua sắmtrực tuyến mới Giả sử rằng tên miền sách rất mới, chúng tôi không có nhiều giao dịch được ghi lại trongtài liệu này Nếu chúng tôi tuân theo phương pháp rút gọn có giám sát Khi xây dựng mô hình dự đoántrong đó chúng tôi sử dụng dữ liệu đào tạo không đủ trong miền mới, chúng tôi không thể có mô hình dựđoán đáng tin cậy cho lần mua tiếp theo của người dùng Tuy nhiên, với việc học chuyển, người ta có thểtìm đến một miền liên quan, được phát triển tốt nhưng khác nhau để được giúp đỡ, chẳng hạn như mộtmiền đề xuất phim hiện có Khai thác các kỹ thuật học chuyển, người ta có thể tìm thấy sự tương đồng

và khác biệt giữa các cuốn sách và các lĩnh vực phim Ví dụ, một số tác giả cũng biến sách của họ thànhphim và phim và sách có thể thu hút các nhóm người dùng tương tự Nhận thấy những điểm tương đồng

có thể

Định nghĩa 1.1.1 (Học chuyển giao)

Cho một miền nguồn Ds và nhiệm vụ học Ts , miền mục tiêu Dt và nhiệm vụ học Tt, học chuyển giaonhằm cải thiện việc học hàm dự đoán mục tiêu ft(.) cho miền đích sử dụng kiến thức trong Ds và Ts với

Trang 8

mô tả nhiệm vụ Hình này cho thấy một khái niệm chính về học chuyển: nó cho thấy sự thiếu hụt vấn đề

dữ liệu đào tạo trong mục tiêu chính với nhiều kiến thức thu được từ miền nguồn

Vì một miền chứa 2 thành phần D = X, Px điều kiện Ds6= Dt nghiã là Xs 6= Xt hoặc PX

s 6= PX

T Tương tự như một tác vụ được định nghĩa là một cặp thành phần T = Y, PY /X điều kiện Ts6= Ttnghĩa

là Ys 6= Yt hoặc PYs /Xs 6= PYt/Xt Khi miền đích và miền nguồn giống nhau nghĩa là Ds = Dt và cácnhiệm vụ học là như nhau, Ts= Tt, vấn đề học trở thành học truyền thống

Định nghĩa 1.1.2 (Học chuyển giao đồng nhất)

Cho một miền nguồn Ds và một nhiệm vụ học Ts, một miền mục tiêu Dt và một nhiệm vụ học Tt, họcchuyển giao đồng nhất nhằm cải thiện việc học hàm dự đoán mục tiêu ft(.) cho Dt sử dụng kiến thứctrong Ds và Ts với Xs∩ Xt6= ∅ và Ys= Ytnhưng PX

s 6= PX

t hoặc PYs/Xs 6= PYt/Xt.Định nghĩa 1.1.3 Học chuyển giao không đồng nhất)

Cho một miền nguồn Ds và một nhiệm vụ học Ts, một miền mục tiêu Dt và một nhiệm vụ học tập Tt,học tập chuyển giao không đồng nhất nhằm mục đích giúp cải thiện việc học chức năng dự đoán mục tiêu

ft(.) cho Dt sử dụng kiến thức trong Dsvà Ts, trong đó Xs∩ Xt6= ∅ hoặc Ys6= Yt

Học chuyển giao bao gồm: học chuyển giao bán giám sát, học chuyển giao có giám sát và học chuyển giaokhông giám sát.Trong học chuyển giao có giám sát, chỉ có dữ liệu được dán nhãn mới có sẵn trong miềnmục tiêu để đào tạo và không sử dụng dữ liệu không được phép để đào tạo Đối với việc học chuyển khônggiám sát, chỉ có dữ liệu không được cung cấp trong miền đích Trong học chuyển giao bán giám sát, dữliệu chưa được gắn nhãn và một vài dữ liệu được dán nhãn được cho là có sẵn trong miền đích

1.1.2 Các vấn đề nghiên cứu cơ bản trong học chuyển giao

Có ba vấn đề nghiên cứu về học chuyển, có tên là "chuyển gì", "cách chuyển" và "khi nào cần chuyển"

Vì mục đích của việc học chuyển là chuyển kiến thức qua các miền khác nhau, câu hỏi đầu tiên là hỏikiến thức nào trên các miền có thể được chuyển để tăng hiệu suất khái quát hóa của miền đích, được gọi

là "chuyển gì" vấn đề Sau khi xác định kiến thức nào sẽ được chuyển, một câu hỏi tiếp theo là làm thếnào để mã hóa kiến thức thành thuật toán học để chuyển, tương ứng với vấn đề "làm thế nào để chuyển".Vấn đề "khi nào cần chuyển" là hỏi xem trong trường hợp nào việc học chuyển nên được thực hiện hoặc

có thể được thực hiện một cách an toàn Một câu hỏi nghiên cứu cơ bản đằng sau ba vấn đề này là làmthế nào để đo "khoảng cách" giữa bất kỳ cặp miền hoặc nhiệm vụ nào Với thước đo khoảng cách giữacác miền hoặc tác vụ, người ta có thể xác định kiến thức phổ biến nào giữa các tác vụ có thể được sửdụng để giảm khoảng cách giữa các miền hoặc tác vụ, nghĩa là chuyển gì và tìm cách giảm khoảng cáchgiữa các miền hoặc tác vụ dựa trên xác định kiến thức chung, nghĩa là làm thế nào để chuyển Hơn nữa,với thước đo khoảng cách giữa các miền hoặc tác vụ, người ta có thể xác định một cách hợp lý "khi nàocần chuyển": nếu khoảng cách là rất lớn, không nên tiến hành học chuyển Do đó, một câu hỏi tiếp theolà: khái niệm đo khoảng cách như vậy nên ở dạng nào? Theo truyền thống, có nhiều loại biện pháp thống

kê khác nhau cho khoảng cách giữa hai phân phối xác suất bất kỳ Các biện pháp điển hình trong số đóbao gồm phân kỳ Kulback-Leibler, khoảng cách A (đo khoảng cách chính) và chênh lệch trung bình tối đa(MMD), để đặt tên cho một số Hãy nhớ lại rằng một miền chứa hai thành phần: không gian đặc trưng

và phân phối khả năng thăm dò cận biên và một tác vụ cũng chứa hai thành phần: không gian nhãn vàphân phối xác suất có điều kiện Do đó, các biện pháp thống kê hiện tại về khoảng cách giữa các phânphối xác suất có thể được sử dụng để đo lường sự khác biệt giữa các miền hoặc tác vụ bằng cách giả sử

Trang 9

miền nguồn (tác vụ) và miền đích (tác vụ) chia sẻ cùng một không gian tính năng (nhãn) Tuy nhiên, cómột số hạn chế trong việc sử dụng các biện pháp khoảng cách thống kê cho việc học chuyển Đầu tiên,những người tìm kiếm lại thấy rằng các biện pháp khoảng cách dựa trên phân phối chung này là thườngquá thô để phục vụ mục đích tốt trong việc đo khoảng cách trong độ xuyên sáng giữa hai miền hoặc tác

vụ Thứ hai, nếu các miền có các không gian tính năng và / hoặc không gian nhãn khác nhau, trước tiênngười ta phải chiếu dữ liệu lên cùng một tính năng và / hoặc không gian nhãn, sau đó áp dụng các thước

đo khoảng cách thống kê như một bước tiếp theo Do đó, cần có nhiều nghiên cứu hơn trên một kháiniệm chung về khoảng cách giữa hai miền hoặc nhiệm vụ

1.2.1 Hiểu hình ảnh

Nhiều nhiệm vụ hiểu hình ảnh từ nhận dạng đối tượng đến nhận dạng hoạt động đã được xem xét.Thông thường, các tác vụ thị giác máy tính này yêu cầu rất nhiều dữ liệu được yêu cầu để huấn luyệnmột mô hình, chẳng hạn như sử dụng bộ dữ liệu ImageNet nổi tiếng Tuy nhiên, khi các tình huống thịgiác máy tính thay đổi một chút, chẳng hạn như thay đổi từ trong nhà ra ngoài trời và từ máy ảnh tĩnhsang máy ảnh chuyển động, mô hình cần phải được điều chỉnh để tính toán cho các tình huống mới Họcchuyển là một kỹ thuật thường được sử dụng để giải quyết các vấn đề thích ứng này Trong phân tíchhình ảnh, nhiều công trình gần đây đã kết hợp kiến trúc leaming sâu với học chuyển Ví dụ, Long et al.(2015) khám phá kiến trúc học tập sâu trong đó khoảng cách miền được giảm thiểu giữa các miền nguồn

và miền đích Trong một bài báo được xuất bản bởi Facebook (Mahajan et al., 2018), Mahajan et al ápdụng học chuyển sang phân loại hình ảnh Cách tiếp cận liên quan đến việc đào tạo đầu tiên một môhình học tập sâu dựa trên bộ dữ liệu hình ảnh rất lớn Mô hình được xử lý trước này sau đó được tinhchỉnh cho các tác vụ cụ thể trong miền đích, bao gồm một lượng nhỏ dữ liệu được dán nhãn tương đối

Mô hình này là một mạng lưới tích chập sâu được đào tạo cho nhiệm vụ phân loại dựa trên các hashtagđược gán cho hàng tỷ xã hội hình ảnh phương tiện, và các nhiệm vụ mục tiêu là nhận dạng đối tượnghoặc phân loại hình ảnh Phân tích của họ cho thấy điều quan trọng là vừa tăng kích thước của tập dữliệu tiền xử lý cũng như chọn không gian nhãn liên quan chặt chẽ giữa các tác vụ nguồn và đích Quansát này cho thấy việc học chuyển giao đòi hỏi phải thiết kế các phương pháp "kỹ thuật không gian nhãn"

để phù hợp với các nhiệm vụ học tập nguồn và đích Công việc của họ cũng cho thấy những cải tiến vềnhiệm vụ mục tiêu có thể đạt được bằng cách tăng độ phức tạp của mô hình nguồn và kích thước tập

dữ liệu Học chuyển cũng cho phép phân tích hình ảnh đóng một vai trò quan trọng trong các ứng dụng

có tác động xã hội lớn Trong công việc Xie et al (2016), các tác giả từ Khoa học Trái đất của Đại họcStanford áp dụng học tập chuyển giao để dự đoán tỷ lệ nghèo trên trái đất dựa trên hình ảnh vệ tinh.Đầu tiên, họ sử dụng hình ảnh ban ngày để dự đoán hình ảnh ánh sáng ban đêm Mô hình kết quả sau

đó được chuyển sang dự đoán nghèo Điều này dẫn đến một mô hình dự đoán rất chính xác đòi hỏi nỗlực ghi nhãn của con người ít hơn nhiều so với các phương pháp dựa trên khảo sát truyền thống

1.2.2 Tin sinh học và hình ảnh sinh học

Trong sinh học, nhiều thí nghiệm rất tốn kém và dữ liệu rất ít Các ví dụ bao gồm hình ảnh sinh họckhi các bác sĩ cố gắng sử dụng máy tính để phát hiện ra các bệnh tiềm ẩn và khi các mô hình phần mềmđược sử dụng để quét các chuỗi DNA và protein phức tạp để tìm ra các mẫu để chỉ ra một bệnh hoặcphương pháp chữa trị cụ thể Học chuyển đã được sử dụng một cách hiệu quả để giúp tận dụng kiến thức

từ miền này sang miền khác để giải quyết khó khăn mà dữ liệu được dán nhãn trong sinh học là tốn kém

Ví dụ, Xu và Yang (2011) đưa ra một cuộc khảo sát sớm về học chuyển và học đa nhiệm trong các ứngdụng tin sinh học, và Xu et al (2011) trình bày quy trình tìm hiểu chuyển giao để xác định cấu trúc tếbào protein trong miền mục tiêu nơi dữ liệu được dán nhãn bị thiếu Trong phân tích hình ảnh y sinh,

Trang 10

một vấn đề khó khăn là thu thập đủ dữ liệu đào tạo để đào tạo một mô hình xác định các mẫu hình ảnhchỉ định các bệnh như ung thư Nhận dạng như vậy đòi hỏi một lượng lớn dữ liệu đào tạo Tuy nhiên,những dữ liệu này thường rất tốn kém để có được vì chúng đòi hỏi các chuyên gia nhân lực tốn kém đểdán nhãn Hơn nữa, dữ liệu cho các mô hình được sàng lọc trước và các mô hình trong tương lai thường

là từ các bản phân phối khác nhau Những vấn đề này truyền cảm hứng cho nhiều công trình nghiên cứu

để áp dụng học tập chuyển đổi để thích ứng mô hình dự phòng trong các nhiệm vụ mới Ví dụ, trongtác phẩm của Shin et al (2016), một mô hình được xử lý trước dựa trên dữ liệu ImageNet là mô hìnhmiền nguồn, sau đó được chuyển giaođể sử dụng trong một lĩnh vực hình ảnh y tế để phát hiện hạch bạchhuyết ngực và phân loại bệnh phổi kẽ, với thành công lớn

1.2.3 Hệ thống đề xuất và lọc cộng tác

Thông thường, hệ thống đề xuất sản phẩm trực tuyến rất khó thiết lập do sự cố khởi động nguội Vấn

đề này có thể được giảm bớt nếu chúng ta phát hiện ra sự tương đồng giữa các tên miền và điều chỉnh môhình đề xuất từ một miền chính xác sang miền mới Điều này thường tiết kiệm thời gian và tài nguyênkhiến cho nhiệm vụ không thể thành công Ví dụ, Li et al (2009b) và Pan et al (2010b) cung cấp chocác tài khoản sớm về việc áp dụng học chuyển đổi cho việc sửa đổi trực tuyến Trong các ứng dụng của

họ, các hệ thống đề xuất tên miền chéo chuyển các mô hình tùy chọn người dùng từ một miền hiện có(giả sử, miền giới thiệu sách) sang một miền mới (giả sử, miền khuyến nghị phim) Kịch bản tương ứngvới trường hợp kinh doanh trong đó một trang web thương mại trực tuyến mở ra một ngành kinh doanhmới và mong muốn nhanh chóng triển khai một mô hình đề xuất cho hoạt động trong ngành kinh doanhmới Để làm như vậy, nó phải khắc phục vấn đề thiếu dữ liệu giao dịch trong ngành nghề kinh doanhmới Một dòng công việc khác là tích hợp các hệ thống học tập và đề xuất củng cố để cho phép các mụcđược khuyến nghị vừa chính xác theo lịch sử vừa qua của người dùng và đa dạng để làm phong phú thêmlợi ích của người dùng Lấy ví dụ, Liu et al (2018) trình bày một thuật toán tên cướp cân bằng giữa độchính xác đề xuất và chủ đềGiới thiệu đa dạng, để cho phép một hệ thống khám phá các chủ đề mới cũngnhư phục vụ cho các lựa chọn gần đây của người dùng Liên quan đến học tập chuyển giao, công trìnhcho thấy rằng chiến lược khuyến nghị trong việc cân bằng giữa thăm dò và khai thác thực sự có thể đượcchuyển giao giữa hai lĩnh vực

ít nhiều, miền nguồn và sau đó tìm hiểu chính sách để đối phó với các sự kiện dự đoán trong miền đích

Mô hình miền đích có thể xử lý nhiều trường hợp hơn trong thế giới thực để xử lý thêm dữ liệu ồn ào

và khó lường hơn Khi các mô-đun thích nghi tốt, nhiều lao động và nhiều tài nguyên có thể được lưu

từ việc đào tạo lại mô hình miền đích Trong tác phẩm của Tai et al (2017), một công cụ lập kế hoạchchuyển động không có bản đồ được thiết kế dựa trên kết quả phạm vi thưa thớt mười chiều và được đàotạo về thuật toán học tăng cường sâu từ đầu đến cuối Sau đó, người lập kế hoạch đã học được chuyểnsang thế giới thực bằng cách khái quát hóa thông qua các mẫu trong thế giới thực

1.2.5 NLP và Khai thác văn bản

Khai thác văn bản là một ứng dụng tốt cho các thuật toán học chuyển Khai thác văn bản nhằm mụcđích khám phá kiến thức cấu trúc hữu ích từ văn bản và áp dụng cho các mục đích khác Trong số tất cảcác vấn đề trong khai thác văn bản, phân loại văn bản nhằm mục đích gắn nhãn tài liệu văn bản mới với

Trang 11

các thẻ lớp khác nhau Một phân loại văn bản điển hình là phân loại tình cảm Trên trang web, có rấtnhiều nội dung do người dùng tạo ra tại các trang web trực tuyến như diễn đàn trực tuyến, blog, mạng

xã hội, v.v Điều rất quan trọng là có thể tóm tắt ý kiến của người tiêu dùng về sản phẩm và dịch vụ.Phân loại tình cảm giải quyết vấn đề này bằng cách phân loại các quan điểm thành các loại tích cực vàtiêu cực Tuy nhiên, trên các tên miền khác nhau, chẳng hạn như các loại sản phẩm khác nhau, các loạitrang web trực tuyến khác nhau và các lĩnh vực kinh doanh khác nhau, người dùng có thể bày tỏ ý kiếncủa mình bằng các từ khác nhau Do đó, một bộ phân loại tình cảm được đào tạo trên một tên miền cóthể hoạt động kém trên các mục đích khác Trong trường hợp này, học chuyển giao có thể giúp điều chỉnhmột người xác định tình cảm được đào tạo tốt trên các lĩnh vực khác nhau Gần đây, công việc nghiêncứu trước đã đạt được những hiểu biết mới về bản chất của học chuyển Devlin và cộng sự (2018) nêubật một điều kiện thành công cho các ứng dụng học chuyển giao: có đủ số lượng dữ liệu đào tạo miềnnguồn Ví dụ: BERT hệ thống NLP của Google (Đại diện bộ mã hóa hai chiều từ Transformers) áp dụnghọc chuyển giao cho một số nhiệm vụ NLP, cho thấy rằng học chuyển với mô hình giả định mạnh mẽ cóthể giải quyết nhiều vấn đề khó khăn như vấn đề trả lời câu hỏi (Devlin et al., 2018) Nó đã đạt được kếtquả đáng ngạc nhiên khi dẫn đầu trong nhiều nhiệm vụ trong phiên bản mở SQUAD 2.0 (Rajpurkar etal., 2016) Miền nguồn bao gồm một tập hợp văn bản ngôn ngữ tự nhiên cực kỳ lớn, trong đó BERT đãđào tạo một mô hình dựa trên các máy biến áp hai chiều dựa trên cơ chế chú ý Mô hình liên quan cókhả năng đưa ra nhiều dự đoán trong mô hình ngôn ngữ chính xác hơn trước và sức mạnh dự đoán tănglên khi tăng lượng dữ liệu đào tạo trong miền nguồn Sau đó, mô hình BERT được áp dụng cho một tác

vụ cụ thể trong miền đích bằng cách thêm các lớp nhỏ bổ sung vào mô hình nguồn trong các tác vụ nhưphân loại Câu tiếp theo, Trả lời câu hỏi và Nhận dạng thực thể được đặt tên (NER Việc học chuyển giaoứng dụng mô phỏng dựa trên mô hình, trong đó hầu hết các siêu đường kính giữ nguyên nhưng một sốđường kính được chọn có thể được điều chỉnh với dữ liệu mới trong miền đích

1.2.6 Ghi chú lịch sử

Nhiều hoạt động học tập của con người theo phong cách học chuyển Chúng tôi quan sát rằng mọingười thường áp dụng kiến thức thu được từ các nhiệm vụ học tập trước đó để giúp học một nhiệm vụmới Ví dụ, một em bé có thể được quan sát trước tiên học cách nhận biết cha mẹ trước khi sử dụng kiếnthức này để giúp nó học cách nhận biết người khác Học chuyển giao có nguồn gốc sâu xa trong AI, tâm

lý học, lý thuyết giáo dục và khoa học hợp tác Trong AI, đã có nhiều hình thức học chuyển Học bằngcách tương tự là một trong những hiểu biết cơ bản của Al Con người có thể rút ra kinh nghiệm trongquá khứ để giải quyết vấn đề hiện tại rất tốt Ở Al, đã có những công trình đầu tiên về lý luận tương

tự như bộ nhớ động (Schank, 1983) Sử dụng sự tương tự trong giải quyết vấn đề, Carbonell (1981) vàWinston (1980) đã chỉ ra rằng lý luận tương tự ngụ ý rằng mối quan hệ giữa các thực thể phải được sosánh, không chỉ bản thân thực thể, để cho phép nhớ lại hiệu quả các kinh nghiệm trước đó Forbus vàcộng sự (1998) đã lập luận cho sự tương đồng về cấu trúc cấp cao như là một cơ sở của lý luận tương tự.Holyoak và Thagard (1989) đã phát triển một lý thuyết tính toán về lý luận tương tự bằng cách sử dụngchiến lược này, khi các quy tắc trừu tượng cho phép hai trường hợp được ánh xạ tới một biểu diễn thốngnhất được đưa vào Giải quyết vấn đề tương tự là nền tảng cho lý luận dựa trên trường hợp (CBR), nơinhiều hệ thống đã được phát triển Ví dụ, HYPO (Ashley, 1991) xử lý các trường hợp tương tự trong cơ

sở vụ án hợp pháp để tranh luận về việc hỗ trợ cho yêu cầu bồi thường hoặc đưa ra phản biện PRODIGY(Carbonell et al., 1991) sử dụng một tập hợp các trường hợp giải quyết vấn đề phổ biến làm cơ sở trườnghợp và lấy ra các trường hợp tương tự nhất để điều chỉnh Hầu hết các hệ thống hoạt động của lý luậntương tự như hệ thống CBR (Kolodner, 1993) đã dựa vào một giả định rằng các trường hợp trong quákhứ và vấn đề mục tiêu mới nằm trong cùng một không gian đại diện Đã có một số khảo sát về học tậpchuyển giao trong học máy Pan và Yang (2010) và Taylor và Stone (2009) đưa ra các khảo sát ban đầu

về công việc học chuyển trường, trong đó người đi trước tập trung vào học máy trong các lĩnh vực phânloại và hồi quy và giải quyết vấn đề học tập củng cố Cuốn sách này nhằm đưa ra một cuộc khảo sát toàndiện bao gồm cả hai lĩnh vực này, cũng như những tiến bộ gần đây của việc học chuyển với học sâu

Trang 12

"trực tiếp" các trường hợp miền nguồn không thể giúp giải quyết mục tiêu đề ra.

Một ý tưởng chung đằng sau các phương pháp học chuyển giao dựa trên mẫu là cho rằng một số dữliệu được gán nhãn tên miền vẫn hữu ích cho việc tìm hiểu một số mô hình chính xác cho miền đích trongkhi một số không hữu ích hoặc thậm chí có thể làm giảm hiệu suất của mô hình nếu được sử dụng Chúng

ta có thể sử dụng phân tích phương sai để hiểu ý tưởng này Khi tập dữ liệu miền đích nhỏ, mô hình cóthể có một mức phương sai cao và do đó sẽ ảnh hưởng đến mô hình Bằng cách thêm một phần của dữliệu miền nguồn dưới dạng tập dữ liệu phụ, phương sai của mô hình có khả năng giảm Tuy nhiên nếuphân phối dữ liệu của hai miền là khác nhau, mô hình học tập mới có thể có độ lệch cao Vì vậy nếuchúng ta có thể chọn ra các miền nguồn theo phân phối tương tự như phân phối trong miền đích chúng

ta có thể sử dụng lại chúng và khi đó phương sai và độ lệch của mô hình học tập sẽ giảm

Tóm lại có hai vấn đề cần giải quyết trong việc sử dụng học chuyển giao dựa trên mẫu Vấn đề thứnhất là làm thế nào để chọn ra các trường hợp được gán nhãn miền nguồn và miền đích, bởi vì các trườnghợp này rất hữu ích để đào tạo mô hình miền đích Vấn đề thứ hai là làm thế nào để sử dụng “giống” cáctrường hợp được gán nhãn tên miền trong thuật toán để tìm hiểu chính xác hơn mô hình học tập dựatrên mẫu

Hãy nhớ rằng một miền D = {X, PX} có hai không gian thành phần: một không gian đặc trưng X vàmột phân phối xác suất cận biên PX

Cho D và T = {Y, PY |X} có hai thành phần: nhãn Y và phân phốixác suất có điều kiện PY |X Một giả thiết chung đằng sau hầu hết các phương pháp học chuyển giao dựatrên mẫu trong các trường hợp là các giá trị đầu vào của miền nguồn và miền đích có hỗ trợ tương tựhoặc rất giống nhau, có nghĩa là các tính năng cho hầu hết các trường hợp có một giá trị tương ứng Hơnnữa các nhãn đầu ra của nguồn và đích là như nhau Giả thiết này đảm bảo rằng kiến thức có thể chuyểnđổi trên các miền thông qua các trường hợp

Khi PX

s 6= PX

t nhưng PY |Xs = PY |Xt , ta đề cập đến cài đặt vấn đề là học chuyển giao phi quy nạp

Trang 13

2.2 Phương pháp phi quy nạp

Như đã đề cập trước đó, trong học chuyển giao phi quy nạp, học tập nguồn và đích được giả sử làgiống nhau và sự hỗ trợ giữa các miền được coi là giống nhau hoặc rất giống nhau, nghĩa là Xs= Xt Chỉ

có sự khác biệt giữa các tên miền là do phân phối biên của đầu vào tức là PX

i=1, bởi định nghĩa β(x) = Pt (x)

Ps(x), một xấp xỉ của (2.3) và có thể được viết lại thành

θ∗t = arg min

θt∈Θ

n sXi=1β(xsi)l(xsi, ysi, θt) (2.4)

Vì vậy để sử dụng lại đúng cách dữ liệu được gán nhãn nguồn để tìm hiểu mô hình đích, chúng tacần ước lượng trọng số β(xsi) Như trong công thức (2.4) để ước lượng β(xsi), đó là tỉ lệ mật độ chỉ cáctrường hợp đầu vào không có nhãn từ miền nguồn và tên miền đích là bắt buộc Một giải pháp đơn giản

để ước lượng tham số β(xs i) cho mỗi tên miền nguồn là ước lượng PXt và PXs, sau đó tính tỉ lệ Pt(xsi)

Ps(xsi)cho từng miền cụ thể xsi tuy nhiên đây là một điều khó khăn đặc biệt khi dữ liệu có kích thước lớn.Theo cách này, lỗi do mật độ ước lượng sẽ được truyền đến ước lượng tỉ lệ mật độ

Trong tài liệu (Quionero - Canada 2009) các giải pháp hứa hẹn được đề xuất để ước lượng P

X t

PXstrựctiếp bỏ qua bước ước lượng mật độ Sau đây chúng tôi xin giới thiệu cách ước tính trực tiếp tỷ lệ mật độbằng cách xem xét một số phương pháp đại diện

Trang 14

2.2.1 Phân biệt dữ liệu nguồn và đích

Một cách tiếp cận đơn giản và hiệu quả để tìm hiểu các trọng số là biến đổi vấn đề ước lượng tỉ lệ mật

độ xác suất cận biên đến vấn đề phân biệt xem dữ liệu đó là từ miền nguồn hay miền đích Điều này cóthể được coi như là một vấn đề phân loại nhị phân với các trường hợp dữ liệu từ miền nguồn được gánnhãn là 1 và những tên miền nguồn được gán nhãn là 0

Ví dụ Zadrozny (2004) đề xuất phương pháp lấy mẫu từ chối do sự sai lệch lựa chọn mẫu Quá trìnhlấy mẫu được định nghĩa như sau Một biến ngẫu nhiên nhị phân δ ∈ 1, 0 được gọi là biến lựa chọntrong phần giới thiệu ở trên Trường hợp x được lấy mẫu từ phân phối biên PX

t với xác suất Pt(x) hay

Pt(x) = P (x|δ = 0) Tương tự Ps(x) có thể viết lại thành Ps(x) = P (x|δ = 1) x được chấp nhận bởimiền nguồn với xác suất P (δ = 1|x) hoặc bị từ chối với xác suất P (δ = 0|x) Trong toán học với giá trị δmới tỷ lệ mật độ cho mỗi trường dữ liệu x có thể được xác định là

Theo ý tưởng của Zadrozny (2004), Bickel (2007) đề xuất một khung để tích hợp bước ước lượng tỷ lệmật độ và bước đào tạo mô hình với trường hợp dữ liệu nguồn phát lại Với PX là mật độ xác suất của

x trong tập dữ liệu hợp nhất của miền nguồn và miền đích Chúng tôi có thể sử dụng bất kỳ phân loạinào để ước lượng tham số P (δ = 1|x) Giả sử bộ phân loại là tham số hóa bởi v và các tham số cho môhình học tập cuối cùng được đào tạo về dữ liệu nguồn được xem lại ký hiệu bởi w Tất cả các tham số cóthể được tối ưu hóa bằng cách sử dụng tối đa cách tiếp cận sau (MAP)

[w, v]M AP = argmax P (w, v|Ds, Dt)trong đó Ds, Dt biểu thị tập dữ liệu nguồn và tập dữ liệu đích tương ứng Lưu ý rằng P (w, v|Ds, Dt) tỷ

lệ với P (Ds|w, v)P (Ds, Dt|v)P (w)P (v), do đó giải pháp MAP có thể được tìm thấy bằng cách tối đahóa P (Ds|w, v)P (Ds, Dt|v)P (w)P (v)

2.2.2 Phương pháp nhân phù hợp

Một cách tiếp cận hiệu quả khác để ước lượng tỷ lệ mật độ là sử dụng các kỹ thuật nhúng nhãn phânphối (Smola 2007) Chẳng hạn Huang (2006) đề xuất phương pháp kết hợp trung bình (KMM) để tìmhiểu trực tiếp tỷ lệ mật độ bằng cách căn chỉnh giá trị trung bình của các dữ liệu miền nguồn với tỷ lệcủa các dữ liệu miền đích trong không gian Hilbert (RKHS)

Trang 15

trung bình tối đa (MMD) giữa các bản phân phối Với hai bản mẫu dựa trên MMD khoảng cách giữa haiphân phối mẫu chỉ đơn giản là khoảng cách giữa hai yếu tố trung bình trong RKHS Do đó KMM nhằmmục đích tìm hiểu các trọng số của trường hợp miền nguồn bằng cách khớp với giá trị trung bình củamiền nguồn được xem lại trong trường hợp miền đích trong RKHS

min

βkµ(PX

t ) − EPXt [βxΦ(x)]k với βx≥ 0, EPX

t [βxΦ(x)] = 1 (2.6)trong đó Φ chuyển đổi dữ liệu miền nguồn thành RKHS và T và µ(PXt ) là kỳ vọng của miền đích trongRKHS nghĩa là µ(PX

t ) = EPX

t [Φ(x)]

Trong thực tế ta có thể tối ưu hóa nghiệm sau đây

minβ1

ns

n sXi=1

βiΦ(xsi) − 1

nt

n tXi=1Φ(xti)

2với βi≥ 0,

1

ns

n sXi=1

βi− 1

i=1,một tập hợp nhỏ dữ liệu được gán nhãn tên miền Dt= {(Xsi, ysi)}nt

i=1 cũng được yêu cầu làm đầu vào.Mục tiêu vẫn là tìm hiểu một mô hình dự đoán chính xác cho dữ liệu không xác định được miền nguồn

2.3.1 Tích hợp của miền nguồn và sự tổn thất miền đích

Một giải pháp trực quan để sử dụng cả dữ liệu được gán nhãn miền nguồn và và dữ liệu được gánnhãn miền đích để đào tạo một mô hình cho miền đích là phân tách hàm mất thành hai phần: một làdành cho dữ liệu được gán nhãn miền nguồn và phần còn lại cho tên miền đích Một tham số đánh đổithường được giới thiệu để cân bằng tác động của hai tổn thất

Ngay từ rất sớm Wu và Dietterich (2004) đề xuất một mẫu phân loại K-láng giềng (KNN) dựa trên

cá thể tối ưu hóa độ chính xác phân loại trên cả miền nguồn và miền đích Cụ thể trong một trình phânloại KNN truyền thống giat thiết h(x) được xác định bởi k trường hợp dữ liệu huấn luyện gần nhất vớitừng trường hợp kiểm tra x Trong phương pháp học chuyển giao quy nạp dựa trên KNN được đề xuất,

Ksthể hiện miền nguồn gần nhất và Kt thể hiện mục tiêu gần nhất được xác định đầu tiên cho dữ liệukiểm tra miền đích xti Sau đó với mỗi nhãn lớp y tổng số phiếu trong trường hợp xti ký hiệu là V (y) đượcđặt là V (y) = θVt (y)

Kt

+ (1 − θ)Vt (y)

Kt

trong đó Vt(y) và Vs(y) là số phiếu bầu trên lớp y từ Ktvà Kscác trường hợp gần nhất từ miền đích và miền nguồn tương ứng và θ là tham số đánh đổi để kiểm soáttầm quan trọng tương đối của miền nguồn gần nhất Một ý tưởng như vậy có thể được áp dụng cho phânloại cơ sở khác ngoài KNN Wu và Dietterich (2004) cũng đề xuất cách tiếp cận dựa trên máy véc tơ hỗ

Trang 16

trợ (SVM) cho phương pháp học chuyển giao quy nạp dựa trên mẫu Hãy nhớ rằng mục tiêu của SVM là

minXj

yjαjK(xj, xi+ b)

≥ 1 − i∀i, αj≥ 0

trong đó αjs là các tham số mô hình của một SVM, js là các biến để lưu các lỗi và C là một tham số

để kiểm soát mức độ lỗi được thực hiện trong các ví dụ được phân loại sai Trong cài đặt học chuyển giaoquy nạp Wu và Dietterich (2004) đã đề xuất sửa đổi hàm mục tiêu và các ràng buộc tham số bằng cáchxem xét dữ liệu được gán nhãn miền nguồn và dữ liệu được gán nhãn miền đích là khác nhau Giả sử αs

j

và s

j biểu thị các tham số mô hình và các biến trong miền xs

j với j ∈ {1, 2, , ns} tương ứng Tương tự

αsj và sj biểu thị tham số và biến của miền đích xtj tương ứng với j ∈ {1, 2, , nt} Các tham số Csvà Ct

là các tham số cân bằng.Sau đó ta xấy dựng được chức năng của SVM như sau:

min

n sXj

αsj+

n tXj

αtj+ Cs

n sXj=1

sj+ Ct

n tXj=1

yitαtjK(xtj, xti) +

nsXj

yitαtjK(xtj, xsi) +

nsXj

Tóm lại SVM kết nối với các nhãn dữ liệu của cả miền nguồn và miền đích

Liao (2005) tiếp tục mở rộng ý tưởng này đến hồi quy logistic và đề xuất thuật toán "Migratory Logit"

Mô hình Migratory Logit thể hiện sự khác biệt giữa hai miền bằng cách giới thiệu một biến phụ mới µjđối với mỗi phiên bản dữ liệu nguồn (xsi, yis) Tham số µj có thể được hiểu về mặt hình học là "thuậtngữ chặn" Điều đó làm cho (xsi di chuyển về phía lớp yistrên miền đích Nó đo sai số dữ liệu miền nguồn

xsi là liên quan đến miền đích phân phối PXt và do đó kiểm soát tầm quan trọng của các trường hợp dữliệu nguồn Đối với dữ liệu miền nguồn (xti, yti), xác suất của nhãn yti là giống nhau như hồi quy logistictruyền thống nghĩa là P (yti|xt

i; w) = δ(ytiwTxti) với w là tham số véc tơ và δ(a) = 1

1 + exp(−a) là hàmSigmoid Đối với một nguồn thể hiện tên miền (xs

i, ys

i), khi đó xác suất của ys

i được định nghĩa như sau:

ln δ(yitwTxti) +

nsXi=1

ln δ(ysiwTxsi + yisµi)

Sau đó, tất cả các tham số có thể được học bằng cách tối đa hóa khả năng đăng nhập với vấn đề tối

đa hóa được đưa ra bởi công thức sau:

maxw,µ L(w, µ, Ds∪ Dt) với 1

ns

nsXi=1

yisµi≤ C, ys

iµi≥ 0, ∀i ∈ {1, 2, , ns},với C là một siêu tham số để kiểm soát tầm quan trọng của tập dữ liệu

Trang 17

Các cạnh tiếp cận đã nói ở trên cho rằng trong miền đích nhãn dữ liệu có sẵn như là đầu vào cho cácthuật toán học chuyển giao Trong nhiều kịch bản, nhiều dữ liệu chưa được gán nhãn cũng có thể có sẵntrong miền đích.

Jiang và Zhai (2007) đề xuất một phương pháp học bán giám sát chung là học chuyển giao quy nạp,trong đó cả dữ liệu được gắn nhãn và không gắn nhãn trong tên miền đích được sử dụng với dữ liệu đượcgán nhãn miền nguồn để đưa ra mô hình dự đoán

Trong công trình của Jiang và Zhai (2007) một tham số αi được giới thiệu cho mỗi tên miền nguồn(xsi, yis) ∈ Ds để xác định Ps(ysi|xs

λs

Cs

nsXi=1

αiβi log P (yis|xs

i; θ) + λt,l

Ct,l

n t,lXj=1log P (yjt,l|xt,lj ; θ)

+λt,u

Ct,u

n t,uXk=1Xy∈Y

γk(y) log(P (y|xt,uk ; θ)) + log P (θ),

trong đó Cs=Pn s

i=1αiβi, Ct,l= nt,lvà Ct,u=Pnt,u

k=1Py∈Yγk(y) là khía cạnh để chuẩn hóa các tham

số chính quy λs, λt,l, λt,u điều khiển quan trọng của mỗi phần với tổng bằng 1 Theo cách này dữ liệumiền nguồn được gán nhãn và miền đích cũng vậy Dữ liệu không được gán nhãn được sử dụng để tối ưuhóa giá trị θ

2.3.2 Phương pháp Boosting-Style

Một nhóm các phương pháp khác của học chuyển giao quy nạp dựa trên mẫu tăng cường nhằm xácđịnh tên miền nguồn sai lệch bằng cách cập nhật lại giá trị trọng số Chẳng hạn thuật toán TrAdaBoostđược đề xuất bởi Dai (2007) là thuật toán tăng kiểu đầu tiên cho việc thiết lập học chuyển giao quy nạp.TrAdaBoost áp dụng cách tái tạo ví dụ tương tự được sử dụng trong TrAdaBoost để tìm ra các trườnghợp dữ liệu hữu ích từ miền nguồn Cụ thể, TrAdaBoost đào tạo một mô hình h dựa trên sự kết hợp của

Dsvà Dt Sau đó nó sử dụng h để đưa ra các dự đoán trên dữ liệu miền đích và tính toán tổn thất trungbình trên miền đích là:

Với các quy tắc cập nhật này, TrAdaBoost lặp lại cả hai nguồn dữ liệu được gán nhãn tên miền đích

để giảm tác động của các trường hợp dữ liệu sai lệch trong miền nguồn và tìm hiểu một loạt các phânloại để xây dựng một bộ phân loại đồng bộ cho miền đích

... cácthuật tốn học chuyển giao Trong nhiều kịch bản, nhiều liệu chưa gán nhãn có sẵntrong miền đích.

Jiang Zhai (2007) đề xuất phương pháp học bán giám sát chung học chuyển giao quy nạp,trong... tiếp cận dựa máy véc tơ hỗ

Trang 16

trợ (SVM) cho phương pháp học chuyển giao quy nạp dựa mẫu Hãy... trình phânloại KNN truyền thống giat thiết h(x) xác định k trường hợp liệu huấn luyện gần vớitừng trường hợp kiểm tra x Trong phương pháp học chuyển giao quy nạp dựa KNN đề xuất,

Ksthể

Ngày đăng: 04/08/2020, 00:41

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w