1. Trang chủ
  2. » Giáo Dục - Đào Tạo

LUẬN VĂN TỐT NGHIỆP ỨNG DỤNG CÔNG NGHỆ SEMANTIC WEB NHẰM TĂNG THỨ HẠNG CỦA DOANH NGHIỆP NAM ĐẶNG HOÀNG TRÊN MÔI TRƯỜNG CÔNG CỤ TÌM KIẾM.pdf

81 8 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Ứng dụng Công nghệ Semantic Web nhằm Tăng Thứ Hạng của Doanh Nghiệp Nam Đặng Hoàng trên Môi Trường Công Cụ Tìm Kiếm
Tác giả Nam Đặng Hoàng
Người hướng dẫn TS. ...
Trường học Trường Đại học FPT
Chuyên ngành Quản trị kinh doanh
Thể loại Luận văn tốt nghiệp
Năm xuất bản 2021
Thành phố Hà Nội
Định dạng
Số trang 81
Dung lượng 1,3 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Tuy nhiên hiệu quả của hoạt động này đem lại chưa tương xứng với tiềm năng hiện có của thị trường, các thông tin mà doanh nghiệp cung cấp chưa đáp ứng được thị trường số với lượng người

Trang 1

FPT EXECUTIVE MBA PROGRAM (FeMBA) Chương trình Thạc sĩ Quản trị kinh doanh – Trường Đại học FPT

LUẬN VĂN TỐT NGHIỆP

ỨNG DỤNG CÔNG NGHỆ SEMANTIC WEB NHẰM TĂNG THỨ HẠNG CỦA DOANH NGHIỆP “NAM ĐẶNG HOÀNG” TRÊN MÔI TRƯỜNG

Trang 2

FPT EXECUTIVE MBA PROGRAM (FeMBA) Chương trình Thạc sĩ Quản trị kinh doanh – Trường Đại học FPT

Bài luận văn này được nộp cho

VIỆN QUẢN TRỊ KINH DOANH (FSB)

(TRƯỜNG ĐẠI HỌC FPT)

BẢN LUẬN VĂN LÀ MỘT PHẦN BẮT BUỘC

TRONG CHƯƠNG TRÌNH ĐÀO TẠO THẠC SĨ QUẢN TRỊ KINH DOANH

Trang 3

sỹ Quản trị kinh doanh

Giáo viên hướng dẫn Các thành viên hội đồng

Trang 4

CAM KẾT

Tôi xin cam kết rằng nội dung của bản luận văn này chưa được nộp cho bất kỳ chương

trình cấp bằng cao học nào cũng như bất kỳ một chương trình đào tạo cấp bằng nào

khác

Tôi cũng xin cam kết rằng bản luận văn này là nỗ lực cá nhân của tôi Các kết quả,

phân tích, kết luận trong luận văn này (ngoài các phần được trích dẫn) đều là kết quả

làm việc của cá nhân tôi

Chữ ký của học viên

Trang 5

LỜI CẢM ƠN

Tôi xin gửi lời cảm ơn chân thành tới Viện Quản trị kinh doanh FSB – Trường Đại học FPT, các Quý thầy cô đã giúp tôi trang bị kiến thức, tạo điều kiện thuận lợi cho tôi trong suốt quá trình học tập và thực hiện luận văn này

Với lòng kính trọng và biết ơn, tôi xin được bày tỏ lời cảm ơn tới TS

……… đã quan tâm, khuyến khích, và chỉ dẫn cho tôi trong quá trình thực hiện luận văn này

Xin chân thành cảm ơn các thành viên trong tập thể lớp FeMBA 19 và các lãnh đạo, đồng nghiệp tại Công ty TNHH Thương mại dịch vụ Nam Đặng Hoàng đã hỗ trợ tôi trong quá trình thực hiện luận văn này

Tôi xin gửi lời tri ân sâu sắc đến gia đình và những người bạn đã động viên, hỗ trợ tôi rất nhiều trong suốt quá trình học tập và hoàn thành luận văn

Trang 6

DANH MỤC TỪ VIẾT TẮT

P.O.E Mô hình truyền thông hội tụ Paid – Owned – Earned

Công ty Công ty TNHH Thương mại dịch vụ Nam Đặng Hoàng

Trang 7

DANH MỤC BIỂU ĐỒ

Biểu đồ 2 1: Khung phân tích 20

Biểu đồ 3 1: Quy trình nghiên cứu 22 Biểu đồ 3 2: DN đã ứng dụng các kênh truyền thông trên nền tảng nào? 25

Biểu đồ 3 3: Tỷ trọng sử dụng ngân sách cho các kênh truyền thông của DN? 25

Biểu đồ 3 4: Tỷ trọng sử dụng ngân sách cho các kênh truyền thông của DN? 26

Biểu đồ 3 5: Các khó khăn DN gặp phải hiện nay trên nền tảng số digital? 27

Biểu đồ 4 1: Phân tích SWOT 35 Biểu đồ 4 2: Báo cáo các trang có vị trí thấp so với các kết quả tìm kiếm của Google 47

Biểu đồ 4 3: Sơ đồ tri thức cho website DN 52

Biểu đồ 5 1: Báo cáo của Wearesocial 54 Biểu đồ 5 2: Website được người dùng Việt ghé thăm nhiều nhất 54

Biểu đồ 5 3: Sơ đồ biểu diễn gán các kiểu cho tài nguyên và liên kết trong website của NĐH 56

Biểu đồ 5 4:Báo cáo hiệu suất của Google Search Console cho website Nhà thuốc thân thiện từ 1/12/2020 - 1/7/021 57

Biểu đồ 5 5: Giải pháp tiêu chuẩn nội dung có hệ thống cho website DN NĐH 58

Biểu đồ 5 6: Cụm chủ đề website DN NĐH 60

Biểu đồ 5 7: Tổng quan về đối tượng người dùng Facebook 61

Biểu đồ 5 8: Tổng quan về đối tượng người dụng Instagram 61

Trang 8

Biểu đồ 5 9: Sơ đồ tri thức của website doanh nghiệp Nam Đặng Hoàng 63 Biểu đồ 5 10: Báo cáo các chỉ số website nhathuocthanthien.com.vn từ Ahref tháng 7/ 2021 64

Trang 9

DANH MỤC HÌNH ẢNH

Hình 2 1: Các lớp cấu trúc Semantic Web 6

Hình 2 2: Sử dụng URIs để đặt tên cho nguồn thông tin Sử dụng URIs để đặt tên cho nguồn thông tin 7

Hình 2 3: XML khai báo tiền tố không gian tên 7

Hình 2 4: Đồ thị RDFs đơn giản 8

Hình 2 5: Cấu trúc đồ thị chính thức của RDF 9

Hình 2 6: Bộ 3 RDF 9

Hình 2 7: Bản thể các phương tiện 10

Hình 2 8: Đồ thị của một bản thể học RDFs đơn giản 10

Hình 2 9: Các lớp Web ngữ nghĩa phụ thuộc quy quy tắc đơn giản 12

Hình 2 10: Mối quan hệ dữ liệu qua RDF 15

Hình 4 1: Cửa hàng vật lý của doanh nghiệp Nam Đặng Hoàng với tên Nhà thuốc thân thiện 31 Hình 4 2: Mô hình kinh doanh của doanh nghiệp NĐH 32

Hình 4 3: NĐH đi bài trên báo Sức khỏe và Đời sống với tên Nhà thuốc thân thiện 38

Hình 4 4: Nam Đặng Hoàng trên báo Gia đình với tên Nhà thuốc thân thiện 39

Hình 4 5: Nam Đặng Hoàng trên báo VTC với tên Nhà thuốc thân thiện 39

Hình 4 6: Nam Đặng Hoàng trên báo 24H với tên Nhà thuốc thân thiện 40

Hình 4 7: Nam Đặng Hoàng trên báo Dân trí với tên Nhà thuốc thân thiện 40

Trang 10

Hình 4 8: Hiệu suất tìm kiếm website DN qua báo cáo của Google Search Console 41 Hình 4 9: Trang fanpage chính thức của Nam Đặng Hoàng với tên Nhà thuốc thân thiện 42 Hình 4 10: Nam Đặng Hoàng trên Instagram với tên Nhà thuốc thân thiện 42 Hình 4 11: Nam Đặng Hoàng trên Linkedin với tên Nhà thuốc thân thiện 43 Hình 4 12: Trang chủ của website doanh nghiệp NĐH với tên Nhà thuốc thân thiện 43 Hình 4 13: Nam Đặng Hoàng trên mạng xã hội Twitter với tên Nhà thuốc thân thiện 44 Hình 4 14: Nam Đặng Hoàng trên Youtube với tên Nhà thuốc thân thiện 44 Hình 5 1: Lớp chữ ký điện tử của NTTT 56

Trang 11

MỤC LỤC

CHƯƠNG 1: PHẦN MỞ ĐẦU 1

1.1 Tính cấp thiết của đề tài 1

1.2 Mục tiêu nghiên cứu 2

1.3 Câu hỏi nghiên cứu 3

1.4 Đối tượng và phạm vi nghiên cứu 3

1.4.1 Đối tượng nghiên cứu 3

1.4.2 Phạm vi nghiên cứu 4

1.5 Ý nghĩa lý luận và thực tiễn đề tài 4

1.5.1 Ý nghĩa lý luận 4

1.5.2 Thực tiễn đề tài 4

1.6 Kết cấu đề tài 4

CHƯƠNG 2: TỔNG QUAN TÀI LIỆU VÀ CƠ SỞ LÝ LUẬN 5

2.1 Tổng quan về Semantic Web 5

2.1.1 Khái niệm về Semantic Web 5

2.1.2 Thành phần của Semantic Web 5

2.2 Ứng dụng Semantic trên công cụ tìm kiếm 14

2.3 Cơ sở lý luận 18

2.3.1 Cách hoạt động của công cụ tìm kiếm Google 18

2.3.2 Các nền tảng marketing kỹ thuật số 19

Trang 12

2.4 Khung phân tích 20

CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU 22

3.1 Phương pháp nghiên cứu 22

3.1.1 Quy trình nghiên cứu 22

3.1.2 Phương pháp thu thập dữ liệu sơ cấp 22

3.1.3 Phương pháp thu thập dữ liệu thứ cấp 23

3.1.4 Phương pháp phân tích dữ liệu 23

3.1.5 Phương pháp xử lý, tổng hợp và phân tích dữ liệu 24

3.2 Phương pháp nghiên cứu được áp dụng trong đề tài 24

3.2.1 Phương pháp thu thập dữ liệu sơ cấp 24

3.2.2 Phương pháp thu thập dữ liệu thứ cấp 28

3.2.3 Phương pháp định tính 29

3.2.4 Phương pháp định lượng 29

3.2.5 Phương pháp xử lý, tổng hợp và phân tích dữ liệu 29

CHƯƠNG 4: THỰC TRẠNG DOANH NGHIỆP NAM ĐẶNG HOÀNG 31

4.1 Doanh nghiệp Nam Đặng Hoàng 31

4.1.1 Khái quát về DN 31

4.1.2 Mô hình kinh doanh BMC 32

4.1.3 Phân tích SWOT doanh nghiệp 35

4.2 Thực trạng DN NĐH trên môi trường công cụ tìm kiếm 37

Trang 13

4.2.1 Sơ đồ cấu trúc website doanh nghiệp 37

4.2.2 Những đặc thù nội dung của ngành dược trên môi trường CCTK 37

4.2.3 Sự hiện diện của DN trên các nền tảng marketing kỹ thuật số 38

4.2.4 Liên kết website DN với các kênh truyền thông kỹ thuật số 45

4.3 Nhận định về thứ hạng của DN NĐH trên môi trường CCTK khi áp dụng Web ngữ nghĩa 46

4.4 Đánh giá chung 47

4.4.1 Thành tựu 47

4.4.2 Hạn chế 49

4.4.3 Nguyên nhân 50

CHƯƠNG 5: GIẢI PHÁP ỨNG DỤNG CÔNG NGHỆ SEMANTIC WEB CHO DN NĐH TRÊN MÔI TRƯỜNG CCTK 53

5.1 Bối cảnh số của doanh nghiệp 53

5.2 Giải pháp ứng dụng công nghệ Web ngữ nghĩa cho DN 55

5.2.1 Sơ đồ cấu trúc website DN 55

5.2.2 Tiêu chuẩn nội dung cho website DN NĐH 58

5.2.3 Sự hiện diện của DN trên các nền tảng kỹ thuật số 60

5.2.4 Liên kết của DN với các kênh truyền thông kỹ thuật số 62

KẾT LUẬN 65

TÀI LIỆU THAM KHẢO 67

Trang 14

CHƯƠNG 1: PHẦN MỞ ĐẦU

1.1 Tính cấp thiết của đề tài

Sự phát triển của kinh tế số là xu hướng tất yếu của các nước trên thế giới và Việt Nam cũng không nằm ngoài xu thế đó Hiện nay, có khá nhiều quan điểm, khái niệm về kinh tế số Theo TS Phạm Việt Dũng (2020), thuật ngữ “kinh tế số” đã được đề cập từ khá lâu trước khái niệm Cách mạng công nghiệp (CMCN) 4.0 Tuy nhiên, chỉ khi CMCN 4.0 xuất hiện thì kinh tế số mới được nhắc đến nhiều hơn và trở thành xu thế phát triển, vì nó gắn với công nghệ hiện đại như: Trí tuệ nhân tạo,

dữ liệu lớn, tài sản số Trong nền kinh tế số tại Việt Nam, các doanh nghiệp sẽ đổi mới quy trình sản xuất, kinh doanh truyền thống sang mô hình theo hệ sinh thái, liên kết từ khâu sản xuất, thương mại đến sử dụng và điều này sẽ làm tăng năng suất, cũng như hiệu quả lao động

Nhận thấy tầm quan trọng của việc phát triển kinh tế số, Nam Đặng Hoàng đặt mục tiêu phát triển thành doanh nghiệp công nghệ số của Việt Nam Doanh nghiệp

tổ chức phương thức ứng dụng công nghệ Semantic Web vào xây dựng website nhằm tăng thứ hạng trên môi trường công cụ tìm kiếm, phát triển doanh nghiệp trên môi trường số hiện nay

John Naisbitt đã nói:" Chúng ta đang chìm ngập trong thông tin nhưng lại khát khao tri thức " World Wide Web (gọi tắt là Web) đã trở thành một kho tàng thông tin khổng lồ của nhân loại và là một môi trường chuyển tải thông tin không thể thiếu được trong thời đại công nghiệp 4.0 Sự phổ biến và bùng nổ thông tin trên Web đặt ra những thách thức mới, làm thế nào để khai thác được thông tin trên Web một cách hiệu quả, mà cụ thể là làm thế nào để máy tính có thể trợ giúp xử

lý tự động được chúng Muốn vậy, trước hết máy tính phải hiểu được thông tin trên các tài liệu Web, trong khi thế hệ Web hiện tại thông tin được biểu diễn dưới dạng chỉ con người mới đọc hiểu được

Trang 15

Các chuyên gia dự đoán, bề nổi của Web (Surface Web) chứa đến hàng chục tỷ trang tài liệu trong khi, ở phần sâu của Web thì chứa đến ngàn tỷ trang tài liệu Có khoảng hơn nửa số thông tin này thuộc các cơ sở dữ liệu có chủ đề riêng biệt Các trang Web hiện nay có ít đường liên kết tới các trang Web khác nên việc tìm kiếm là khó khăn Ngoài ra, thông tin tìm kiếm được không theo chủ đề mà chỉ là vấn đề tìm thoả theo từ khoá đơn thuần, kết quả tìm kiếm phải do con người chọn lại theo chủ đề mong muốn Những vấn đề này đã thúc đẩy sự ra đời của ý tưởng Web ngữ nghĩa (Semantic Web), một thế hệ mới của Web, mà chính cha đẻ của World Wide Web là Tim Berners-Lee đề xuất vào năm 1998

Nắm bắt được xu thế và thị trường phát triết của môi trường công cụ tìm kiếm, trong thời gian qua hoạt động marketing trên môi trường số đã được doanh nghiệp NĐH đặc biệt quan tâm và chú trọng Tuy nhiên hiệu quả của hoạt động này đem lại chưa tương xứng với tiềm năng hiện có của thị trường, các thông tin mà doanh nghiệp cung cấp chưa đáp ứng được thị trường số với lượng người dùng trên môi trường công cụ tìm kiếm hiện tại Vấn đề cấp thiết đặt ra hiện nay đối với doanh nghiệp là đưa ra được giải pháp nhằm tăng thứ hạng của website doanh nghiệp trên môi trường công cụ tìm kiếm, tăng hiện hiện diện được nhiều người dùng biết đến

và tự chủ thông tin doanh nghiệp Khai thác tiềm năng cho hiệu quả kinh doanh bền vững, lâu dài của doanh nghiệp là việc hết sức quan trọng

Tuy nhiên, doanh nghiệp NĐH có ngân sách cho quảng cáo lớn về nguồn lực cho

kỹ thuật quảng cáo, nguồn lực cho nội dung chiến dịch để hiệu suất trong kết quả tìm kiếm 9 tháng đầu tạo lập website DN

Vì vậy, đề tài “Ứng dụng công nghệ Semantic Web nhằm tăng thứ hạng doanh nghiệp Nam Đặng Hoàng trên môi trường công cụ tìm kiếm” để DN chủ động truyền thông kinh doanh, không phụ thuộc vào công nghệ quảng cáo Đề tài vừa

có ý nghĩa ứng dụng thực tế, vừa có ý nghĩa về mặt khoa học và đề xuất được mô hình ứng dụng công nghệ mới vào hoạt động marketing cho doanh nghiệp

1.2 Mục tiêu nghiên cứu

Trang 16

Đề tài “Ứng dụng công nghệ Semantic Web nhằm tăng thứ hạng doanh nghiệp Nam Đặng Hoàng trên môi trường công cụ tìm kiếm” là nghiên cứu về các lớp của Web ngữ nghĩa và thực tế ứng dụng các lớp Semantic trong việc tăng thứ hạng website doanh nghiệp trên công cụ tìm kiếm Google

Đề tài nghiên cứu về các lớp của web ngữ nghĩa, ứng dụng của Semantic Web trong việc xây dựng bộ máy tin và ứng dụng trong thư viện số của doanh nghiệp Nam Đặng Hoàng Ứng dụng này sẽ giúp doanh nghiệp chủ động quản trị dữ liệu thông tin và chủ động tạo nội dung hấp dẫn người tiêu dùng có những hành động

mà doanh nghiệp mong đợi như: sự tương tác, đăng ký, dùng thử hay mua hàng Ứng dụng công nghệ Semantic Web giúp doanh nghiệp có thể chủ động kiểm soát nội dung, thông tin và trải nghiệm của khách hàng Các dạng website nói chung là cốt lõi của Owned Platform – nơi doanh nghiệp tạo ra trải nghiệm phù hợp với định vị, hình ảnh và thương hiệu doanh nghiệp mà không chịu sự phụ thuộc nào

1.3 Câu hỏi nghiên cứu

Với mục tiêu đề ra, tôi cần tìm hiểu các nền tảng kỹ thuật số, các kênh truyền thông

số và cấu trúc các lớp của Semantic Web, đánh giá về thực trạng doanh nghiệp và giải pháp Web ngữ nghĩa cho Nam Đặng Hoàng trên môi trường công cụ tìm kiếm Google ứng với hoạt động quản trị kinh doanh của doanh nghiệp Nam Đặng Hoàng

Các câu hỏi nghiên cứu phục vụ đề tài:

1) DN đã ứng dụng các kênh truyền thông trên nền tảng nào?

2) Tỷ trọng sử dụng ngân sách cho các kênh truyền thông của DN?

3) Đánh giá hiệu quả khi sử dụng các kênh marketing kỹ thuật số hiện tại của DN? (Mức độ hiệu quả từ 1 đến 5: rất không hài lòng, không hài lòng, bình thường, hài lòng, rất hài lòng)

4) Nhận xét về mức độ hiệu quả của kênh truyền thống (traditional) và kênh số (Digital) của DN?

5) Các khó khăn DN gặp phải hiện nay trên nền tảng số digital?

6) Mong muốn cải thiện thứ hạng website doanh nghiệp là gì?

1.4 Đối tượng và phạm vi nghiên cứu

1.4.1 Đối tượng nghiên cứu

Trang 17

Đối tượng nghiên cứu của đề tài là: Web ngữ nghĩa, doanh nghiệp (DN) Nam Đặng Hoàng, công cụ tìm kiếm Google, website nhathuocthanthien.com.vn

1.4.2 Phạm vi nghiên cứu

Nội dung nghiên cứu: Ứng dụng công nghệ Semantic Web nhằm tăng thứ hạng website doanh nghiệp Nam Đặng Hoàng trên môi trường công cụ tìm kiếm Giới hạn không gian: Nền tảng kỹ thuật số, các kênh truyền thông số, công cụ tìm kiếm Google và Website doanh nghiệp Nam Đặng Hoàng giai đoạn 2020 – 2021

1.5 Ý nghĩa lý luận và thực tiễn đề tài

1.5.1 Ý nghĩa lý luận

Đề phù hợp với nội dung, yêu cầu, mục đích của đề tài đề ra, lý luận được thực hiện trong quá trình nghiên cứu gồm: lý thuyết của mô hình truyền thông hội tụ (mô hình Paid – Owned – Earned hay còn gọi mô hình POE), 7 nền tảng kỹ thuật

số và cách hoạt động của công cụ tìm kiếm Google

1.5.2 Thực tiễn đề tài

Để tiến hành nghiên cứu, tác giả đã tiếp cận theo hướng đi từ lý luận đến thực tiễn:

Bước 1: Tiến hành nghiên cứu và thu thập các dữ liệu sơ cấp (điều tra bằng bảng

hỏi) và thứ cấp (dữ liệu báo cáo của Google Search Console

Bước 2: Sau khi có kết quả thu thập, tác giả tiến hành tổng hợp và xử lý kết quả

điều tra bằng bảng hỏi và các chỉ số báo cáo từ GSC

Bước 3: Tác giả phân tích các kết quả điều tra được khi thực hiện bản hỏi và dữ

liệu Google Search Console

Bước 4: Dựa vào kết quả phân tích các dữ liệu thu thập được, tác giả đưa ra kết

luận và đánh giá được thực trạng của doanh nghiệp

1.6 Kết cấu đề tài

Kết cấu của đề tài 5 chương:

Chương 1: Phần mở đầu

Chương 2: Tổng quan tài liệu và cơ sở lý luận

Chương 3: Phương pháp luận

Chương 4: Thực trạng doanh nghiệp Nam Đặng Hoàng trên công cụ tìm kiếm Chương 5: Giải pháp áp dụng công nghệ semantic web cho doanh nghiệp Nam

Đặng Hoàng trên công cụ tìm kiếm

Trang 18

CHƯƠNG 2: TỔNG QUAN TÀI LIỆU VÀ CƠ SỞ LÝ LUẬN

2.1 Tổng quan về Semantic Web

2.1.1 Khái niệm về Semantic Web

Web có ngữ nghĩa hay Semantic Web là thế hệ mở rộng của Web hiện tại Mục tiêu ban đầu của Semantic Web là hỗ trợ người dùng tìm kiếm thông tin trên mạng một cách nhanh chóng, chính xác và thông minh hơn so với các công cụ tìm kiếm truyền thống Kể từ đó đến nay, các kỹ thuật liên quan đến Semantic Web không ngừng được hoàn thiện Các ứng dụng Semantic Web được mở rộng như: phát triển các chuẩn công nghệ chung để biểu diễn thông tin và cho phép máy tính có thể hiểu được một số thông tin trên Web, hỗ trợ tìm kiếm thông minh hơn, hỗ trợ việc khám phá, tách chiết xuất thông tin, tích hợp dữ liệu và tự động hóa một số công việc thay cho con người

Xét về mặt bản chất, Semantic Web chỉ là một công cụ để con người cũng như máy tính sử dụng để biểu diễn thông tin Hay nói chính xác hơn thì Semantic Web chỉ là một dạng dữ liệu trên Web Khác với các dạng thức dữ liệu được trình bày trong HTML, dữ liệu trong Semantic Web được đánh dấu, phân lớp, mô hình hóa

và được bổ sung thêm các thuộc tính, các mối liên hệ theo các lĩnh vực cụ thể, qua

đó giúp cho các phần mềm máy tính có thể hiểu được dữ liệu và tự động xử lý được những dữ liệu đó Chẳng hạn, với cụm từ “Nguyễn Ngọc Anh Phương”, trong không gian Semantic Web, nó cũng có thể được suy luận tới cái nick có tên:

"kiep_oan_hon", với các thuộc tính cụ thể như: năm sinh, địa chỉ, số điện thoại, email

Vì vậy, vai trò của Semantic Web trong môi trường số hiện nay là vô cùng quan trọng đối với doanh nghiệp muốn tăng thứ hạng trên môi trường số và nâng tầm giá trị thương hiệu, đặc biệt với Nam Đặng Hoàng

2.1.2 Thành phần của Semantic Web

Semantic Web là một tập hợp (stack) các ngôn ngữ và bao gồm các lớp cấu trúc cấu thành Tất cả các lớp của Web ngữ nghĩa được sử dụng để đảm bảo độ an toàn

và bảo vệ giá trị thông tin trở nên tốt nhất

World Wide Web (gọi tắt là Web) đã trở thành kho tàng có khối lượng thông tin khổng lồ của nhân loại Và đây cũng là một môi trường truyền tải thông tin không

Trang 19

thể thiếu trong thời đại công nghệ thông tin ngày nay Điều đó cũng là thách thức

để khai thác chính xác thông tin trên web mà mình mong muốn Cụ thể là làm thế nào để máy tính có thể trợ giúp tổng hợp, xử lý được lượng thông tin khổng lồ đó Muốn vậy, web phải có khả năng mô tả các thông tin theo cách mà máy tính có thể

“hiểu được” Hiện nay, hầu hết các trang web được lấp đầy thông tin và các tags liên quan Các tags này chủ yếu thể hiện về mặt định dạng như <H1> Một số trang

có gắn tag để tạo ra ngữ nghĩa như <META> Tuy nhiên tất cả các thẻ này thiếu liên kết với nhau để cung cấp ngữ nghĩa cho trang web

Cần phải mở rộng thế hệ Web hiện tại để máy tính có thể hiểu, tích hợp dữ liệu, cũng như tái sử dụng dữ liệu thông qua các ứng dụng khác nhau Chính những vấn

đề này đã thúc đẩy cho sự ra đời của web ngữ nghĩa (Semantic Web), một thế hệ mới và tiên tiến của web Cha đẻ của ý tưởng này là Tim Berners-Lee đề xuất vào năm 1998

2.1.2.1 Các lớp cấu trúc của Semantic Web

Hình 2 1: Các lớp cấu trúc Semantic Web (Liyang Yu, 2014)

Trang 20

Theo Liyang Yu (2014) nghiên cứu về các lớp cấu trúc của web ngữ nghĩa: Khi các định dạng dữ liệu trước chủ yếu có thể đọc được bằng máy, chúng có thể được liên kết từ các trang web có thể đọc được của con người, hoặc được tích hợp vào các trang web có thể đọc được dưới dạng chú thích ngữ nghĩa chẳng hạn như: microformats, RDFa, or HTML5 microdata

Các lớp cấu trúc quan trọng của Semantic Web

a Lớp định danh tài nguyên Unicode & URI

Lớp Unicode & URI: Bảo đảm việc sử dụng tập kí tự quốc tế và cung cấp phương tiện nhằm định danh các đối tượng trong Semantic Web URI đơn giản chỉ là một định danh Web giống như các chuỗi bắt đầu bằng giao thức “http” hay “ftp” thường xuyên thấy trên mạng (ví dụ: http://www.liyanggu.com)

Hình 2 2: Sử dụng URIs để đặt tên cho nguồn thông tin Sử dụng URIs để đặt tên

cho nguồn thông tin (Liyang Yu, 2014)

Bất kỳ ai cũng có thể tạo một URI, và có quyền sở hữu chúng Vì vậy chúng đã hình thành nên một công nghệ nền tảng lý tưởng để xây dựng một hệ thống mạng toàn cầu thông qua đó

b Lớp XML

Lớp XML cùng với các định nghĩa về vùng tên gọi (namespace) và lược đồ (schema) bảo đảm rằng chúng ta có thể tích hợp các định nghĩa Semantic Web với các chuẩn dựa trên XML khác

Hình 2 3: XML khai báo tiền tố không gian tên (Liyang Yu, 2014)

Trang 21

Khi một URI đầy đủ thường được viết tắt bằng cách thay thế nó bằng tên đủ điều kiện XML (Qname) của nó Trong XML, Qname chứa tiền tố ánh xạ tới URI không gian tên, theo sau là không gian tên và sau đó là một tên miền W3C đã xác định một số không gian tên tiêu chuẩn để sử dụng với công nghệ Web, bao gồm xsd: cho định nghĩa lược đồ XML; xmlns: dành cho không gian tên XML; và như thế Semantic Web được xử lý theo cùng một cách, với các định nghĩa không gian tên cho các lớp chính của Semantic Web (theo Dean Allemang, Fabieng Gandon James nhận định năm 2020)

c Lớp RDF [RDF] và RDFSchema [RDFS]

Dữ liệu RDF (Resource Description Framework) là nền tảng của web ngữ nghĩa

và có thể được coi là linh hồn của web ngữ nghĩa Leslie F Sikos năm 2015 (trong sách Mastering Structured Data on the Semantic Web from HTML5 Microdata to Linked Open Data) có nói rằng: RDF dựa trên một giản đồ dữ liệu hướng đồ thị đơn giản theo ví dụ sau:

Hình 2 4: Đồ thị RDFs đơn giản (Leslie F Sikos, 2015)

Trang 22

Đồ thị RDF đơn giản này có thể được mở rộng với các thuộc tính từ các từ vựng bên ngoài khác, nhưng khái niệm vẫn giữ nguyên Khi doanh nghiệp đã tạo tệp RDF của mình, doanh nghiệp có một tệp siêu dữ liệu và các tài nguyên mà máy

có thể đọc được khi tải lên trang web

Hình 2 5: Cấu trúc đồ thị chính thức của RDF (Leslie F Sikos, 2015)

Lớp RDF [RDF] và RDFSchema [RDFS]: ta có thể tạo các câu lệnh (statement)

để mô tả các đối tượng với những từ vựng và định nghĩa của URI, và các đối tượng này có thể được tham chiếu đến bởi những từ vựng và định nghĩa của URI ở trên Đây cũng là lớp mà chúng ta có thể gán các kiểu (type) cho các tài nguyên và liên kết Và cũng là lớp quan trọng nhất trong kiến trúc Semantic Web

Hình 2 6: Bộ 3 RDF (Leslie F Sikos, 2015)

Mô hình dữ liệu RDF dựa trên các câu lệnh để mô tả và đặc trưng cho các tài nguyên, đặc biệt là tài nguyên web, dưới dạng các biểu thức vị từ - đối tượng con (tài nguyên-thuộc tính-giá trị) được gọi là các câu lệnh RDF bộ ba hoặc RDF

Vị ngữ (thuộc tính) mô tả mối quan hệ giữa chủ ngữ và tân ngữ Ví dụ, câu ngôn ngữ tự nhiên “Trang chủ của Leslie là http://www.lesliesikos.com” có thể được diễn đạt như trong hình 2.6 Tất cả các phần tử của bộ ba là tài nguyên được xác định bởi một URI duy nhất

Trang 23

d Lớp Ontology

Lớp Ontology: hỗ trợ sự tiến hóa của từ vựng vì nó có thể định nghĩa mối liên

hệ giữa các khái niệm khác nhau Một Ontology (bản thể luận trong logic) định nghĩa một bộ từ vựng mang tính phổ biến & thông thường, nó cho phép các nhà nghiên cứu chia sẻ thông tin trong một hay nhiều lĩnh vực

Có các bản thể học dành riêng cho các tài nguyên phương tiện, chẳng hạn như tệp nhạc và video, như được tóm tắt như trong hình 2.7 bởi Leslie F Sikos (2015)

Hình 2 7: Bản thể các phương tiện (Leslie F Sikos, 2015)

Hình 2 8: Đồ thị của một bản thể học RDFs đơn giản (Marko A Rodriguez &

Mohammad N Alm Muhammad A Ali, Syamimi A Lim, 2020)

Trang 24

Ví dụ đặc tả RDFS này mô hình hóa sự tồn tại của một món ăn Thái Lan “cà ri thái rau” dựa trên nước cốt dừa Ví dụ này là kiến thức khẳng định và đưa ra các mệnh đề về thực thể cụ thể của một lĩnh vực chủ đề Lớp Ontologies trong RDF

và RDF schema trong mô hình hóa biểu diễn sự tồn tại của một món ăn Thái Lan “cà ri thái rau” dựa trên nước cốt dừa Ví dụ này là kiến thức khẳng định

và đưa ra các mệnh đề về thực thể cụ thể của một lĩnh vực chủ đề Lớp Ontology

có thể định nghĩa mối liên hệ giữa các khái niệm khác nhau trong một hay nhiều lĩnh vực

Các Ontology và các luật lập luận: Ở lớp này, dữ liệu mới có thể được suy ra từ những dữ liệu đã có theo các luật logic Theo Marko A Rodriguez (2020 –Emergent Web Intelligence: Advanced Semantic Technologies) có nói rằng: Thực chất, dữ liệu bây giờ thông minh đủ để được mô tả với các quan hệ cụ thể

và các dạng hình thức phức tạp Điều này cho phép kết hợp hoặc tái kết hợp dữ liệu nguyên thuỷ nhiều hơn và sự phân tích về dữ liệu mịn hơn

e Lớp Digital Signature

Rivest, R., Shamir, A., Adleman, L.: A method for obtaining digital signatures and public-key cryptosystems Communications of the ACM 21(2), 120–126 (1978) phát biểu rằng: “Lớp chữ ký điện tử (Digital Signature) hay còn gọi là lớp mật mã cryptograpphy: được dùng để xác định chủ thể của tài liệu (ví dụ: tác giả hay nhan đề của một loại tài liệu) nhằm chống vi phạm bản quyền vể sở hữu thông tin hay sở hữu trí tuệ tác giả

Bởi theo TS Dương Anh Đức – ThS Trần Minh Triết nghiên cứu về Mã hóa và Ứng dụng, mật mã (Cryptography) là ngành khoa học là ngành nghiên cứu các

kỹ thuật toán học nhằm cung cấp các dịch vụ bảo vệ thông tin Đây là ngành khoa học quan trọng, có nhiều ứng dụng trong đời sống – xã hội Với sự phát triển ngày càng nhanh chóng của Internet và các ứng dụng giao dịch điện tử trên mạng, nhu cầu bảo vệ thông tin trong các hệ thống và ứng dụng điện tử ngày càng được quan tâm và có ý nghĩa quan trọng Các kết quả của khoa học mật

mã ngày càng được triển khai trong nhiều lĩnh vực khác nhau của đời sống – xã

Trang 25

hội, trong đó phải kể đến rất nhiều những ứng dụng đa dạng trong lĩnh vực dân

sự, thương mại

Trong kiến trúc của Semantic Web, chữ ký điện tử đóng một vai trò rất quan trọng Nó gắn liền với các tầng của kiến trúc Semantic Web kể từ tầng thứ ba RDF, với vai trò là mở rộng cho các tầng này để đảm bảo rằng những thông tin trong các tài liệu này là xác thực do một nhà cung cấp nào đó Điều này giúp ngăn chặn sự sụp đổ của Web ngữ nghĩa do chính đặc tính đơn giản và phổ cập của nó mang đến

f Các lớp Logic, Proof, Trust

Các lớp Logic, Proof, Trust: Lớp thống nhất (logic) cho phép viết ra các luật (rule) trong khi lớp thử nghiệm (proof) thi hành các luật và cùng với lớp chấp nhận (trust) đánh giá nhằm quyết định nên hay không nên chấp nhận những vấn

đề đã thử nghiệm

Hình 2 9: Các lớp Web ngữ nghĩa phụ thuộc quy quy tắc đơn giản (Pascal Hitzler,

Markus Krötzsch, Sebastian Rudol, 2010)

Cụ thể, lớp thống nhất (logic): việc biểu diễn các tài nguyên dưới dạng các bộ

từ vựng Ontology có mục đích là để máy có thể lập luận được Mà cơ sở lập luận chủ yếu dựa vào logic Chính vì vậy mà các Ontology được ánh xạ sang logic, cụ thể là logic mô tả để có thể hỗ trợ lập luận Vì logic mô tả có biểu diễn ngữ nghĩa hình thức (đặc trưng của lý thuyết mô hình), và cung cấp các dịch vụ lập luận, là cơ sở để hỗ trợ máy có thể lập luận và hiểu tài nguyên Lớp thử nghiệm (proof): lớp này đưa ra các luật để suy luận Cụ thể từ các thông tin đã

có có thể suy ra các thông tin mới Ví dụ: A là cha của B, A là em trai C thì khi

đó ta có thông tin mới là C là bác của B Để có được các suy luận này thì cơ sở

là FOL (First Order-Logic) Và tầng này hiện nay các nhà nghiên cứu đang xây dựng các ngôn ngữ luật cho nó như: SWRL, RuleML Lớp chấp nhận (trust): nhằm đảm bảo tính tin cậy của các ứng dụng trên Web ngữ nghĩa Ví dụ: có một người bảo x là xanh, một người khác lại nói x không xanh, như thế Web ngữ

Trang 26

nghĩa là không đáng tin cậy? Câu trả lời ở đây được xem xét trong các ngữ cảnh Mỗi ứng dụng trên Web ngữ nghĩa sẽ có một ngữ cảnh cụ thể, chính vì thế các mệnh đề trên có thể nằm trong các ngữ cảnh khác nhau khi đó ngữ nghĩa tương ứng khác nhau nên các mệnh đề đó vẫn đúng, đáng tin cậy trong ngữ cảnh của

nó Để có được sự chứng minh về độ tin cậy thì các lập luận được áp dụng là không đơn điệu và có các cơ chế kiểm tra chứng minh kết hợp với công nghệ chữ ký điện tử để xác nhận độ tin cậy Các ngôn ngữ chứng minh là ngôn ngữ chứng minh một mệnh đề là đúng hay sai

2.1.2.2 Các ngôn ngữ của Semantic Web

a XML

XML: Cho phép thiết kế định dạng một dữ liệu và sau đó viết một bài theo định dạng đó Phần cốt yếu của tài liệu XML là bộ từ vựng của các thẻ và sự kết hợp được cho phép theo khung cố định, nhưng có thể được xác định thông qua mỗi ứng dụng XML

XML trong Semantic Web: Cho phép người dùng thêm cấu trúc tùy ý cho các tài liệu của họ, nhưng không đề cập gì đến ý nghĩa của các cấu trúc Tên các tag không cung cấp ý nghĩa Semantic Web chỉ dùng XML cho mục đích cú pháp Theo James (2020, tr 201): Đối với một hệ thống, một ngôn ngữ lược đồ cho phép người ta thể hiện tập hợp các định dạng được phép cho một tài liệu Đối với một lược đồ nhất định, có thể xác định (thường tự động) liệu một tài liệu cụ thể có tuân theo lược đồ đó hay không Đây là khả năng chính được cung cấp bởi các định nghĩa của lược đồ XML và ngôn ngữ XML Trình phân tích cú pháp XML có thể tự động xác định xem một tài liệu XML cụ thể tuân theo một lược đồ nhất định

b RDF Schema

RDF Schema định nghĩa bộ từ vựng của RDF: các quan hệ has Name, has Price, author Of Các class, subclass; Domain; Properties, subproperties; Range RDF - RDF Schema: Giải pháp dùng siêu dữ liệu (Metadata) để mô tả dữ liệu trên Web, máy có thể đọc và hiểu được Siêu dữ liệu là một dạng dữ liệu dùng

để mô tả dữ liệu khác Hay nói cách khác siêu dữ liệu là những thông tin mô tả

Trang 27

tài nguyên trên Web Chẳng hạn, sách là một loại tài nguyên trên Web, khi đó các thông tin mô tả cho tài nguyên này như tên tác giả, tên sách, ngày xuất bản chính là siêu dữ liệu

Theo Fabien Gandom James (2020, tr 203, 204) RDF “mở rộng” RDF schema bằng cách giới thiệu một tập hợp các tài nguyên phân biệt vào ngôn ngữ Điều này tương tự như cách mà một ngôn ngữ lập trình truyền thống có thể được mở rộng bằng cách xác định các từ khóa mới do ngôn ngữ xác định Vì vậy, bằng cách xác định một số tài nguyên cụ thể là “từ khóa mới”, ngôn ngữ này đơn giản

là xác định một số bộ ba nhất định có một ý nghĩa đặc biệt, như được định nghĩa bởi một tiêu chuẩn

c DAML + OIL

Leslie Sikos (2015 tr 46) Ngôn ngữ Bản thể học Web (OWL) là một ngôn ngữ biểu diễn tri thức được thiết kế đặc biệt để tạo các bản thể luận web với một tập hợp phong phú các công cụ xây dựng mô hình, giải quyết các hạn chế của RDFS Việc phát triển phiên bản đầu tiên của OWL được bắt đầu vào năm 2002, và phiên bản thứ hai, OWL2, vào năm 2008 OWL trở thành Khuyến nghị của W3C vào năm 2004, và OWL2 được chuẩn hóa vào năm 2009 OWL dựa trên RDF, mở rộng về mặt ngữ nghĩa RDF và RDFS, cũng như ngôn ngữ tiền nhiệm của ngôn ngữ này

DAML + OIL cung cấp các nguyên mẫu lập mô hình thường thấy trong các ngôn ngữ dựa trên khung DAML + OIL (tháng 3 năm 2001) mở rộng DAML + OIL (tháng 12 năm 2000) với các giá trị từ kiểu dữ liệu lược đồ XML DAML + OIL được xây dựng từ ngôn ngữ bản thể học DAML gốc là DAML-ONT (tháng 10 năm 2000) với nỗ lực kết hợp nhiều thành phần ngôn ngữ của OIL Ngôn ngữ có một ngữ nghĩa và được xác định rõ ràng cho một lĩnh vực nào đó nhằm vào việc biểu diễn và trao đổi thông tin OWL là một bộ từvựng mở rộng của khung mô tả tài nguyên (RDF) và được kế thừa từ ngôn ngữ DAML+OIL Web ontology – một dự án được hỗ trợ bởi W3C

2.2 Ứng dụng Semantic trên công cụ tìm kiếm

Trang 28

Hình 2 10: Mối quan hệ dữ liệu qua RDF (Leslie F Sikos, 2015)

Theo Leslie F Sikos (2015, tr 40, 41) R2RML: Cơ sở dữ liệu quan hệ với RDF Phần lớn nội dung trang web động được cung cấp bởi cơ sở dữ liệu quan hệ (RDB) như Microsoft SQL, MySQL, Oracle, IBM DB2 hoặc PostgreSQL RDB2RML (R2RML) là một tiêu chuẩn để ánh xạ trực tiếp cơ sở dữ liệu quan

hệ sang RDF, giúp dữ liệu dễ truy cập hơn trên Semantic Web

Mô hình dữ liệu của Web ngữ nghĩa là RDF RDF là một mô hình dữ liệu trừu tượng để đại diện cho các tài nguyên web trong web ngữ nghĩa Nó được thiết

kế để máy móc có thể đọc được và quan trọng nhất là hiểu được nhằm cung cấp khả năng tương tác tốt hơn giữa các ứng dụng máy tính với nhau RDF cấu trúc

dữ liệu dưới dạng chủ đề, vị từ và đối tượng, được gọi là bộ ba Chủ thể xác định tài nguyên đang được mô tả, vị từ là thuộc tính được mô tả liên quan đến tài nguyên và đối tượng là giá trị của thuộc tính Các ứng dụng đơn lẻ, hay các phần mềm trên trình duyệt web đều phải thông qua các ngôn ngữ truy vấn SPARQL và GeoSPARQL SPARQL và GeoSPARQL, là các ngôn ngữ truy vấn cho dữ liệu trong RDF trong web ngữ nghĩa và web ngữ nghĩa không gian địa lý tương ứng SPARQL là một tiêu chuẩn của W3C, trong khi GeoSPARQL

là một tiêu chuẩn của Open Geospatial Consortium (OGC) Và GeoSPARQL là một từ vựng nhỏ để mô tả thông tin không gian địa lý để cung cấp cho web ngữ nghĩa không gian địa lý cũng như một phần mở rộng không gian địa lý của ngôn ngữ truy vấn web ngữ nghĩa của SPARQL Nó có thể được kết hợp với các bản thể học dựa trên miền khác để đáp ứng nhu cầu về dữ liệu RDF không gian địa

lý GeoSPARQL triển khai một lõi cơ bản để đại diện và truy cập dữ liệu không

Trang 29

gian địa lý được xuất bản ở định dạng máy có thể đọc và xử lý được trong web ngữ nghĩa không gian địa lý

Semantic Web gồm: Video Meta Web và Video Linked Data Và Metaweb là 1 công ty phát triển cơ sở dữ liệu dựa trên cơ sở Semantic Web – Một cơ sở dữ liệu mở và chia sẻ kiến thức của thế giới Tương ứng với các lớp của Semantic Web là các thuật toán của Google cũng phát triển theo thời gian

Năm 2010, Google đã mua lại và sáp nhập Metaweb vào trong bộ máy tìm kiếm của nó Với mục đích để làm nền tảng hoạt động cho Google Knowledge Graph

& Thuật toán Hummingbird “Plug in to metaweb to get great content from the web’s best sources” - Hãy cắm vào metaweb để nhận nội dung tuyệt vời hơn từ các nguồn tốt nhất của web Tận dụng những yếu tố từ Semantic Web; kỹ thuật Entity building sẽ giúp cho Google có được một cơ sở dữ liệu về các lĩnh vực chủ đề Biến doanh nghiệp Việt thành một thương hiệu thức và lớn của Google Cùng với đó, Google sẽ hiểu rõ hơn về các thông tin trên website của mỗi doanh nghiệp

Google Knowledge Graph: Khi có thực thể Entity thì sơ đồ tri thức Google

Knowledge Graph sẽ xuất hiện để thu thập dữ liệu về từ khóa mà người dùng tìm kiếm trên internet và ý nghĩa đằng sau các từ khóa đó Với sơ đồ tri thức này, Google kết nối các sự kiện, sự vật, sự việc và con người lại với nhau Tất

cả giúp tạo ra các kết quả tìm kiếm được kết nối với nhau chính xác và có liên quan mật thiết với nhau Bởi, sứ mệnh của Google là sắp xếp lại các thông tin của Thế giới và biến nó trở nên hữu dụng và dễ dàng tiếp cận nhất (Google mission is to organize the world's information and make it universally accessible and useful)

Thuật toán Google RankBrain: Không dừng lại ở việc chỉ thu thập dữ liệu mà

các thuật toán Google phát triển ngày càng thông minh hơn Từ thuở sơ khai của web 1.0; web 2.0 đến web 3.0; các thuật toán lần lượt xuất hiện Google Panda (2011), Google Penguin (2012) và Google HummingBirds (2013) Phát triển hơn, Google HummingBirds ra đời để giúp cho Google hiểu hơn về “ý

Trang 30

nghĩa” đằng sau các từ ngữ mà người dùng tìm kiếm trên mạng Từ 2013 – 2015, Google chưa thúc đẩy quá mạnh thuật toán, đến giữa năm 2016 khi Google bắt đầu triển khai “RankBrain” làm cho bảng xếp hạng kết quả tìm kiếm bị ảnh hưởng mạnh mẽ

Thuật toán RankBrain là tên của một hệ thống AI (trí tuệ nhân tạo) giúp cho việc phân tích kết quả lên Top Google (sử dụng việc phân tích content khá nhiều

để hiểu hơn về nghĩa cũng như giá trị bài viết

Nhiệm vụ chính của RankBrain: Hiểu được truy vấn của người dùng: Mỗi từ ngữ hiện tại sẽ được phân tích trong bài viết và được đối chiếu với dữ liệu của chính Google Google sẽ phân tích nghĩa, mối quan hệ của từ khóa cũng như giá trị của bài viết (entity) Đo lường sự hài lòng của người dùng với kết quả tìm kiếm: đánh giá các chỉ số CTR, Time on site, bounce rate với từng kết quả hiển thị, từ đó sắp xếp lại kết quả hiển thị đúng với yêu cầu của người dùng RankBrain có khả năng tự thay đổi thuật toán một cách vi diệu Dựa trên từ khóa, RankBrain sẽ tăng hoặc giảm tầm quan trọng của các yếu tố quyết định thứ hạng của từ khóa truy vấn có trong bài viết Ví dụ như: sự mới mẻ của nội dung, backlinks, độ dài bài viết, tính tin cậy của domain Google RankBrain đọc hiểu tốt hơn các truy vấn của người dùng Thuật toán này không chỉ dừng lại ở việc khớp truy vấn tìm kiếm với từ khóa trong trang đích Nó đặt truy vấn tìm kiếm của người dùng trong một bối cảnh cụ thể và cố gắng tìm những trang đích thể hiện được bối cảnh mong muốn

RankBrain đo lường sự hài lòng của người dùng Thuật toán có thể cố gắng hiểu được những từ khóa mới Thậm chí, nó có thể vặn thuật toán theo chiều hướng

mà nó thấy tốt hơn Khi người dùng gõ từ khóa tìm kiếm vào Google, RankBrain

sẽ hiển thị một danh sách kết quả tìm kiếm phù hợp liên quan mà nó nghĩ người dùng sẽ thích Nếu nhiều người thích một trang bất kỳ trong danh sách, nó sẽ cho trang đích đó lên thứ hạng cao hơn Còn khi người dùng không thích trang đích đó, RankBrain sẽ cho trang đích đó tự hạng và thay thế vào đó bằng một trang đích khác Và lần tới, nếu ai đó tìm kiếm từ khóa này (hoặc từ khóa truy

Trang 31

vấn tương tự), nó sẽ lại tiếp tục cân đo chất lượng của trang đích vừa được thay thế

2.3 Cơ sở lý luận

2.3.1 Cách hoạt động của công cụ tìm kiếm Google

Thời đại công nghệ thông tin phát triển mạnh mẽ, các công cụ tìm kiếm gắn liền với cuộc sống, khi người dùng thực hiện tìm kiếm thông tin trên thanh tìm kiếm, công cụ tìm kiếm có nhiệm vụ trả về các kết quả liên quan nhết với truy vấn của người dùng Có rất nhiều công cụ tìm kiếm khác nhau như Google, Bing, Coccoc, Yandex Trong đó, Google được xem là nổi bật nhất, là lựa chọn hàng đầu ngay khi người dùng có nhu cầu tìm kiếm một thông tin nào đó Theo thống

kê của Net Market Share (2019) Google Search chiếm hơn 70% tổng thị phần trên toàn Thế giới và có hơn 2.4 tỷ lượt tìm kiếm mỗi năm thông qua Google Theo Trung tâm phát triển Google, cách thức hoạt động của Google tìm kiếm theo quá trình như sau:

1) Google lấy thông tin và thu thập dữ liệu từ nhiều nguồn khác nhau: các trang web, nội dung do người dùng gửi (chẳng hạn như nội dung người dùng gửi trong Google Doanh nghiệp của tôi và Maps), nội dung quét từ sách, các cơ

sở dữ liệu công khai trên Internet và nhiều nguồn khác Tuy nhiên, công cụ tìm kiếm Google tập trung vào các nguồn trang web Google thực hiện 3 bước

cơ bản để tạo ra các kết quả từ các trang web: thu thập dữ liệu, lập chỉ mục

và xếp hạng Cách cải thiện kết quả thu thập dữ liệu trang web: xác minh rằng Google có thể truy cập các trang trên trang web và những trang đó hiển thị đúng cách theo sơ đồ trang web

2) Lập chỉ mục sau được Google thực hiện sau khi tìm thấy một trang và tìm hiểu nội dung của trang sso Google phân tích nội dung trang, lập danh mục hình ảnh và tệp videp nhúng trên trang và cố gắng tìm hiểu trang theo cách khác Thông tin này được lưu trữ trong chỉ mục của Google – một cơ sở dữ liệu khổng lồ trữ trong rất nhiều máy tính

Trang 32

3) Xếp hạng các câu trả lời phù hợp nhất trong chỉ mục của Google dựa trên nhiều yếu tốt để trả về các kết quả khi người dùng nhập cụm từ tìm kiếm Các

cơ sở dữ liệu công khai trên Internet

2.3.2 Các nền tảng marketing kỹ thuật số

Theo Handbook of Research on Innovation and Development of E-Commerce and E-Business in ASEAN (2020) có 7 nhóm nền tảng trong truyền thông số như sau:

1) Website: Là cốt lõi của Owned Platform, nền tảng thiết yếu và trọng tâm của Digital Đây là nơi đón nhận thông tin và tạo ra trải nghiệm người dùng với khả năng tương tác - chuyển đổi (Engage and Convert) Bạn dễ dàng nhận thấy khi click vào một banner, một đường link quảng cáo, tất cả sẽ đều chuyển về Website của thương hiệu

2) Social media: Ngôi nhà trực tuyến của các thương hiệu, kết nối với bạn qua mạng xã hội bằng những câu chuyện, sẵn sàng chia sẻ niềm vui nỗi buồn với khách hàng Truyền thông mạng xã hội - cốt lõi của Earned platform, giúp thương hiệu tương tác và lan tỏa trên mạng xã hội với nhiều người dùng tương tác hàng ngày Bằng sự lắng nghe (social listening), thương hiệu có thể cải thiện và tạo ra những trải nghiệm khách hàng tốt hơn

3) Digital media: Cốt lõi của Paid platform (quảng cáo trực tuyến), là cánh cửa tiếp cận và lôi kéo người dùng từ các kênh truyền thông đại chúng về cho doanh nghiệp Những loại quảng cáo như Facebook ads, Google ads, các banner trên một trang web, những video xuất hiện khi xem phim chính là những hình thức của digital media Đây là trọng tâm của Paid Platform, với vai trò tăng độ nhận biết của thương hiệu đến người dùng trên nền tảng số Tuy nhiên, muốn Digital media hoạt động hiệu quả, chúng ta phải biết kết hợp tất cả các platform với nhau

4) Search: Đây là nền tảng tìm kiếm với những công cụ rất phổ biến như Google, Bing, Coccoc nhiệm vụ của thương hiệu là phải xuất hiện khi khách hàng tìm kiếm trên những công cụ này

Trang 33

5) Email marketing: Khi doanh nghiệp thu thập được một số lượng lớn data của khách hàng Email là platform có thể tiếp cận đến người dùng đúng mục tiêu với chi phí rẻ nhất

6) Mobile: Là một nền tảng hiện đại, có thể kể đến từ SMS Marketing, đến trải nghiệm thực tế ảo, QR code GPS Marketing Với số lượng người sử dụng hàng đầu, đây sẽ là nền tảng cực kỳ tiềm năng ở tương lai

7) Game: Được chia thành 2 loại, quảng cáo trong trò chơi (In Game Ads) và trò chơi hóa (Gamification) Gamification (Game hoá) là cách thương hiệu biến trải nghiệm người dùng thành trò chơi, giúp khách trở nên thích thú và tăng khả năng chuyển đổi

2.4 Khung phân tích

Biểu đồ 2 1: Khung phân tích (Nghiên cứu của tác giả, 2021)

Từ các tài liệu nghiên cứu về Semantic Web, tác giả rút ra được các chủ điểm

lý thuyết để thực hiện nghiên cứu gồm: (i) thành phần các lớp cấu trúc của Web ngữ nghĩa; (ii) các thuật toán ứng dụng cho công cụ tìm kiếm; (iii) sự hiện diện của DN trên các nền tảng kỹ thuật số; (iv) liên kết các kênh truyền thông số của

DN trên môi trường CCTK

Từ thành phần trong Semantic Web tác giả nghiên cứu sự tương ứng của cấu trúc website DN với các ngôn ngữ của Web ngữ nghĩa Với chủ điểm lý thuyết

là các thuật toán, tác giả nghiên cứu sự phù hợp của các lớp trong Semantic với các bản cập nhật của công cụ tìm kiếm Đối với khung lý thuyết về nền tảng

Trang 34

trong Web ngữ nghĩa, tác giả nghiên cứu sự hiện của DN trên các nền tảng dựa vào mô hình truyền thông hội tụ P.O.E Có lý thuyết liên kết trong Semantic, tác đi sâu vào nghiên cứu sự kết nối các kênh truyền thông của DN trên các nền tảng kỹ thuật số

Trang 35

CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU

3.1 Phương pháp nghiên cứu

3.1.1 Quy trình nghiên cứu

Biểu đồ 3 1: Quy trình nghiên cứu (Nghiên cứu của tác giả, 2021)

Để tiến hành nghiên cứu, tác giả đã tiếp cận theo hướng đi từ lý luận đến thực tiễn:

Bước 1: Tiến hành nghiên cứu và thu thập các dữ liệu sơ cấp (điều tra bằng

bảng hỏi) và thứ cấp (dữ liệu báo cáo của Google Search Console

Bước 2: Sau khi có kết quả thu thập, tác giả tiến hành tổng hợp và xử lý kết

quả điều tra bằng bảng hỏi và các chỉ số báo cáo từ GSC

Bước 3: Tác giả phân tích các kết quả điều tra được khi thực hiện bản hỏi và

dữ liệu Google Search Console

Bước 4: Dựa vào kết quả phân tích các dữ liệu thu thập được, tác giả đưa ra

kết luận và đánh giá được thực trạng của doanh nghiệp

3.1.2 Phương pháp thu thập dữ liệu sơ cấp

Nhằm đánh giá đúng thực trạng các hoạt động trên môi trường CCTK của NĐH

để đưa ra giải pháp và ứng dụng công nghệ Web ngữ nghĩa vào phát triển website trong thời gian tới, tác giả điều tra thu thập các ý kiến của các khách hàng về các hoạt động Marketing trên môi trường số thông qua Bảng câu hỏi khảo sát:

Trang 36

• Đối tượng điều tra:

- Lãnh đạo doanh nghiệp của NĐH

- Bộ phận chịu trách nghiệm phát triển website và truyền thông doanh nghiệp trên môi trường số

3.1.3 Phương pháp thu thập dữ liệu thứ cấp

Nguồn dữ liệu thứ cấp rất phong phú và đa dạng, nó có thể là các ấn bản thống

kê chính thống của cơ quan quản lý nhà nước hoặc các phân tích đánh giá của các cá nhân, tổ chức, hiệp hội Trong thời đại internet bùng nổ như hiện nay, hầu như mọi thông tin đều có thể tìm kiếm trên môi trường mạng nên tác giả chủ yếu thu thập dữ liệu từ việc tìm kiếm trên mạng kết hợp với thu thập các báo cáo của nội bộ DN

Nhóm dữ liệu được sử dụng một cách trực tiếp hoặc có xử lý đơn giản (chia tỷ lệ) để so sánh, đánh giá Việc phân loại sẽ giúp đưa ra những nội dung cơ bản của từng loại tài liệu để làm căn cứ phân tích

Cách phân tích dữ liệu và trình bày kết quả:

• Đưa ra các đánh giá tổng quát, đánh giá chung với các thống kê, mô tả

• Đưa ra các biểu đồ, đồ thị, hình vẽ minh họa dựa trên số liệu thu thập được

So sánh mối liên hệ giữa các đại lượng để đưa ra những đánh giá sâu hơn và rút

ra kết luận

3.1.4 Phương pháp phân tích dữ liệu

Dữ liệu sơ cấp được phân ra làm 2 loại là định tính và định lượng Đối với mỗi loại sẽ có phương pháp phân tích và tổng hợp khác nhau

Nghiên cứu định tính nhằm xây dựng mô hình nghiên cứu các yếu tố ảnh hưởng đến hoạt động kinh doanh trên website và các yếu tố ảnh hưởng đến thứ hạng của website trên môi trường CCTK của DN Nam Đặng Hoàng Nghiên cứu định tính sửa dụng kỹ thuật thảo luận nhóm tập trung Mục đích nhằm thẩm định mô

Trang 37

hình nghiên cứu đề xuất, hiệu chỉnh, bổ sung và hoàn thiện thang đo cho mô hình đề xuất Tiến hành thảo luận nhóm để khám phá các yếu tố ảnh hưởng đến thứ hạng website và đề xuất giải pháp phù hợp nhằm khám phá, hiệu chỉnh và

bổ sung để tăng thứ hạng website NĐH trên môi trường công cụ tìm kiếm Nghiên cứu định lượng: Công tác xử lý dữ liệu gồm (i) thu thập dữ liệu, (ii) phân tích dữ liệu để đánh giá thực trạng DN (iii) đưa ra giải pháp cải thiện (iv) ứng dụng CN Web ngữ nghĩa

3.1.5 Phương pháp xử lý, tổng hợp và phân tích dữ liệu

Thông tin và các số liệu sau khi thu thập được sẽ được tiến hành tổng hợp theo các phương pháp như sau:

• Phương pháp thống kê mô tả: Tổng hợp các ý kiến của khách hàng đã thu thập được để phản ánh tình hình hoạt động marketing và thực trạng doanh nghiệp trên môi trường số

• Phương pháp phân tích dãy số biến động theo thời gian: là dãy các trị số số liệu thống kê báo cáo theo thời gian đúng, để phản ánh quá trình phát triển trong các hoạt động truyền thông trên môi trường số của DN

3.2 Phương pháp nghiên cứu được áp dụng trong đề tài

Tác giả sử dụng quy trình nghiên cứu, phương pháp nghiên cứu thu thập dữ

liệu sơ cấp và thứ cấp, phương pháp định tính, phương pháp định lượng, phương pháp xử lý, tổng hợp và phân tích thông tin

3.2.1 Phương pháp thu thập dữ liệu sơ cấp

Tác giả điều tra thu thập các ý kiến của các khách hàng về các hoạt động Marketing trên môi trường số thông qua bảng câu hỏi khảo sát:

• Đối tượng điều tra:

- Lãnh đạo doanh nghiệp của NĐH

- Bộ phận chịu trách nghiệm phát triển website và truyền thông doanh nghiệp trên môi trường số

• Cách chọn mẫu:

- Chọn mẫu đa cấp: từ lãnh đạo đến các chuyên viên thực hiện vận hành truyền thông số

Trang 38

- Chọn mẫu ngẫu nhiên: một số nhân viên trong lĩnh vực marketing kỹ thuật

Tác giả thu được kết quả câu trả lời cho khảo sát như sau:

Biểu đồ 3 2: DN đã ứng dụng các kênh truyền thông trên nền tảng nào? (Nghiên cứu

của tác giả, 2021)

Qua kết quả khảo sát thu được, tác giả nhận thấy rằng: Doanh nghiệp NĐH hiện đang ứng dụng dụng nhiều nhất các kênh truyền thông Digital media (bao gồm: Google Ads, Youtube ads) và social media (Instagram, Twitter, Linked) Kết quả cho thấy, DN đang bị phụ thuộc nhiều vào các kênh truyền thông quảng cáo trả phí và các trang mạng xã hội

Biểu đồ 3 3: Tỷ trọng sử dụng ngân sách cho các kênh truyền thông của DN?

(Nghiên cứu của tác giả, 2021)

Trang 39

Qua kết quả khảo sát tỷ trọng sử dụng ngân sách trên các kênh truyền thông,

DN đang chi nhiều ngân sách cho kênh digital media với tỷ trọng >50%, tiếp theo là social media với tỷ trọng trung bình 30% và kênh website (SEO) đang chiếm tỷ trọng ít nhất với <20%

Biểu đồ 3 4: Tỷ trọng sử dụng ngân sách cho các kênh truyền thông của DN?

(Nghiên cứu của tác giả, 2021)

Qua khảo sát đánh giá hiệu quả sử dụng cac kênh marketing kỹ thuật số hiện tại của doanh nghiệp, có 66.7% đáp viên hài lòng với kênh truyền thông trả phí của doanh nghiệp (bao gồm Google Ads, Youtube ads, bài PR trên các báo online, diễn đàn, blog, …) Có 16.7% đáp viên rất hài lòng với các kênh truyền thông

số hiện tại và có 16.7% bày tỏ thái đánh giá bình thường khi DN sử dụng các kênh truyền thông này trong hoạt động kinh doanh tại DN

Câu hỏi 4: Nhận xét về mức độ hiệu quả của kênh truyền thống (traditional) và kênh số (Digital) của DN

Với câu hỏi mở nhận xét về mức độ hiệu quả của kênh truyền thống (traditional)

và kênh số (Digital) của DN, tác giả thu về được các câu trả lời từ đáp viên như sau: “Kênh số hiệu quả hơn tuy nhiên vẫn cần kênh truyền thống”, “Kênh số hiệu quả nhanh hơn nhưng vẫn cần kết hợp với kênh truyền thống”, “Có hiệu quả khi áp dụng kênh truyền thông trả phí như bài PR trên báo online, Google ads, youtube ad Nhưng ngân sách cao, tốn chi phí doanh nghiệp”, “Digital cơ bản là hiệu quả nhanh hơn nhưng không thay thể được traditional”

Trang 40

Biểu đồ 3 5: Các khó khăn DN gặp phải hiện nay trên nền tảng số digital? (Nghiên

cứu của tác giả, 2021)

Với kết quả tác giả thu về được khi khảo sát các khó khăn DN đang gặp phải hiện nay khi triển khai hoạt động kinh doanh trên nền tảng số là: Chi phí cho công nghệ quảng cáo cao, việc tìm kiếm nhân sự có chuyên môn khó và đội ngũ nhân sự hiện tại có chuyên môn không cao

Câu 6: Mong muốn cải thiện thứ hạng website doanh nghiệp là gì?

Với tình hình hoạt động kinh doanh và triển khai các hoạt động marketing trên môi trường số, các đáp viên mong muốn cải thiện thứ hạng website để đạt được các kết quả (kết quả đại diện): “Lên top 1 để có được khách hàng mới tăng chuyển đổi”, “Mong muốn xây dựng 1 website tăng trưởng về nội dung và người dùng để chuyển hóa thành khách hàng”, “Website có lượng traffic tự nhiên, không phụ thuộc vào quảng cáo để tiết kiệm ngân sách SEO để nâng thứ hạng website và tăng hiện diện thương hiệu hơn trên Google”, “Cải thiện thứ hạng để khách hàng có nhu cầu dễ dàng tìm thấy và gọi điện cũng như đặt hàng”,

“Chuyển đổi khách hành tiềm năng truy cập website thành khách hàng và khách hàng thân thiết”

Kết luận:

Từ các kết quả thu thập được từ các câu trả lời của đáp viên, tác giả nhận thấy thực trạng của doanh nghiệp NĐH chuyển đổi số từ việc marketing truyền thống

Ngày đăng: 03/01/2023, 22:58

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w