LỜI MỞ ĐẦU Cuộc cách mạng công nghiệp mới, nền kinh tế tri thức đã phát triển mạnh trong thế kỷ XXI. Nhờ sự phát triển mạnh mẽ của Internet, nhu cầu tìm kiếm và nghiên cứu thông tin đang có xu hướng đi lên ngày càng nhanh. Không thể phủ nhận, trong thời đại phát triển công nghệ số, công nghệ thông tin là phương tiện và giải pháp hỗ trợ báo mạng điện tử hoạt động hiệu quả hơn. Càng ngày càng có nhiều trang báo mạng cũng như các cổng thông tin điện tử được thành lập, nhằm phục vụ cho nhu cầu của người đọc. Góp phần giúp người đọc thuận tiện và tiết kiệm thời gian trong khâu tìm kiếm thông tin. Tuy nhiên đi đôi với sự thuận lợi ấy có một vấn đề được đặt ra là chúng ta làm thế nào để truy cập và khai phá được nguồn tài nguyên ấy hiệu quả nhất. Từ vấn đề trên đã có nhiều nghiên cứu và tạo ra bộ máy tìm kiếm các trang web chứa thông tin. Hệ thống này có khả năng tìm kiếm thông tin linh hoạt , nhanh chóng và rất dễ sử dụng . Người sử dụng chỉ cần đặt câu hỏi truy vấn về vấn đề cần quan tâm là có được tập kết quả liên quan đến câu hỏi truy vấn đó. Tuy nhiên, trong một số trường hợp cụ thể nhất định, việc tìm kiếm thông tin theo những kiểu trên vẫn không hiệu quả , chiếm nhiều thời gian vì: Khối lượng dữ liệu khổng lồ và tính động của các trang báo mạng, nên bộ máy tìm kiếm chỉ có thể sắp xếp một phần các chỉ mục của báo mạng. Kết quả tìm kiếm báo mạng là chung chung. Từ ảnh hưởng hai nhân tố trên tập kết quả tìm kiếm báo mạng có thể từ hàng nghìn đến hàng triệu tài liệu, do đó tìm được đúng tài liệu mình cần là công việc vô cùng khó khăn. Nội dung tiểu luận nhằm chỉ ra một loại hình nghiên cứu về công nghệ thông tin mà có hiệu quả rất lớn, tuy nhiên hiện nay nhận thức của người thiết kế và quản trị báo mạng tại Việt Nam tới việc tối ưu hóa trang báo tại các bộ máy tìm kiếm rất ít. Người sử dụng không ý thức được tầm quan trọng của việc tối ưu hóa website, hoặc các phương thức để các máy tìm kiếm trỏ đến. SEO có thể coi như là một kỹ thuật, một bí quyết thực sự đối với mỗi người quản trị, xây dựng trang báo mạng hay đơn thuần là người làm trong lĩnh vực truyền thông.
Trang 1Mục lục
LỜI MỞ ĐẦU 3
PHẦN I 5
GIỚI THIỆU VỀ SEARCH ENGINE VÀ PHƯƠNG THỨC TÌM KIẾM 5
1 Search Engine là gì? 5
2 Định nghĩa SEO 5
3 Các thành phần của một cỗ máy tìm kiếm tự động 6
4 Đặc điểm và phân loại search engine 7
5 Vài đặc thù của các search engines thông dụng 9
PHẦN II 10
Sự ảnh hưởng của SEO tới báo mạng điện tử 10
1 Thực trạng, tầm quan trọng và vai trò phát triển của SEO trong Báo mạng điện tử 10
2 Lợi ích của SEO – Tối ưu hoá website 11
KẾT LUẬN 13
TÀI LIỆU THAM KHẢO 14
Trang 2LỜI MỞ ĐẦU
Cuộc cách mạng công nghiệp mới, nền kinh tế tri thức đã phát triển mạnh trong thế kỷ XXI Nhờ sự phát triển mạnh mẽ của Internet, nhu cầu tìm kiếm và nghiên cứu thông tin đang có xu hướng đi lên ngày càng nhanh Không thể phủ nhận, trong thời đại phát triển công nghệ số, công nghệ thông tin là phương tiện và giải pháp hỗ trợ báo mạng điện tử hoạt động hiệu quả hơn
Càng ngày càng có nhiều trang báo mạng cũng như các cổng thông tin điện tử được thành lập, nhằm phục vụ cho nhu cầu của người đọc Góp phần giúp người đọc thuận tiện và tiết kiệm thời gian trong khâu tìm kiếm thông tin Tuy nhiên đi đôi với sự thuận lợi ấy có một vấn đề được đặt ra là chúng ta làm thế nào để truy cập và khai phá được nguồn tài nguyên ấy hiệu quả nhất
Từ vấn đề trên đã có nhiều nghiên cứu và tạo ra bộ máy tìm kiếm các trang web chứa thông tin Hệ thống này có khả năng tìm kiếm thông tin linh hoạt , nhanh chóng và rất dễ sử dụng Người sử dụng chỉ cần đặt câu hỏi truy vấn về vấn đề cần quan tâm là có được tập kết quả liên quan đến câu hỏi truy vấn đó
Tuy nhiên, trong một số trường hợp cụ thể nhất định, việc tìm kiếm thông tin theo những kiểu trên vẫn không hiệu quả , chiếm nhiều thời gian vì:
- Khối lượng dữ liệu khổng lồ và tính động của các trang báo mạng, nên
bộ máy tìm kiếm chỉ có thể sắp xếp một phần các chỉ mục của báo mạng
- Kết quả tìm kiếm báo mạng là chung chung
Từ ảnh hưởng hai nhân tố trên tập kết quả tìm kiếm báo mạng có thể từ hàng nghìn đến hàng triệu tài liệu, do đó tìm được đúng tài liệu mình cần là công việc vô cùng khó khăn
Trang 3Nội dung tiểu luận nhằm chỉ ra một loại hình nghiên cứu về công nghệ thông tin mà có hiệu quả rất lớn, tuy nhiên hiện nay nhận thức của người thiết kế và quản trị báo mạng tại Việt Nam tới việc tối ưu hóa trang báo tại các
bộ máy tìm kiếm rất ít Người sử dụng không ý thức được tầm quan trọng của việc tối ưu hóa website, hoặc các phương thức để các máy tìm kiếm trỏ đến
SEO có thể coi như là một kỹ thuật, một bí quyết thực sự đối với mỗi người quản trị, xây dựng trang báo mạng hay đơn thuần là người làm trong lĩnh vực truyền thông
Trang 4PHẦN I GIỚI THIỆU VỀ SEARCH ENGINE VÀ PHƯƠNG THỨC TÌM
KIẾM
1 Search Engine là gì?
Search engine (Công cụ tìm kiếm) là một công cụ phần mềm nhằm tìm ra các trang website trên mạng dựa vào các thông tin mà nó có Dữ lượng thông tin của search engine thực chất là một loại cở sở dữ liệu cực lớn Công cụ này tìm các tài liệu dựa trên các từ khoá (keyword) và trả về một danh mục của các trang
có chứa từ khoá liên quan
Một số công cụ tìm kiếm mạnh trên thế giới hiện nay: Google.com hay Yahoo.com
2 Định nghĩa SEO
SEO là viết tắt của cụm từ Search Engine Optimization (SEO) tạm dịch là tối ưu hóa công cụ tìm kiếm SEO là một tập hợp các phương pháp nhằm nâng cao thứ hạng của một website trong các trang kết quả của các công cụ tìm kiếm Làm SEO là quá trình tối ưu hóa website, giúp website thân thiện với các công
cụ tìm kiếm để tăng lượng truy cập qua từ khóa tìm kiếm từ đó số lượng người truy cập tới một website Một website được làm SEO tốt, đồng nghĩa với việc website đó luôn xuất hiện ở thứ hạng cao khi người truy cập sử dụng công cụ tìm kiếm để tìm nội dung mà họ cần SEO cũng có thể bao gồm nhiều loại mục tiêu khác nhau khi tìm kiếm như: Tìm ảnh, tìm từ khóa, tìm theo quốc gia và một số loại SEO khác
Các công cụ tìm kiếm hiển thị một số dạng danh sách trong kết quả tìm kiếm bao gồm danh sách trả tiền, danh sách quảng cáo, dánh sách trả tiền theo click và danh sách tìm kiếm miễn phí Mục tiêu của SEO chủ yếu hướng tới việc nâng cao thứ hạng của danh sách tìm kiềm miễn phí theo một số từ khóa nhằm tăng lượng và chất của khách viếng thăm đến trang
Hiện trên mạng Internet đang có 3 công cụ tìm kiếm hữu hiệu và phổ biến nhất:
Trang 5* Google.com
* Yahoo.com
* Live.com (MSN.com)
Các công cụ tìm kiếm hiển thị một số dạng danh sách trong trang kết quả tìm kiếm bao gồm danh sách quảng cáo, danh sách trả tiền theo click và danh sách tìm kiếm miễn phí Mục tiêu của SEO chủ yếu hướng tới việc nâng cao thứ hạng của website trong danh sách tìm kiếm miễn phí theo một số từ khóa nhằm tăng lượng và chất của khách viếng thăm đến trang
3 Các thành phần của một cỗ máy tìm kiếm tự động
Những cỗ máy tìm kiếm tự động có nhiều phần tử Phần tử quan trọng nhất là spider, cũng được gọi là crawlers Spider đến thăm một trang web, đọc
nó, và sau đó đi theo sau những mối liên kết tới những trang khác bên trong website Có nghĩa là, khi có ai đó tìm kiếm đến một trang, các spiders sẽ ghi nhớ điều đó Nó sẽ quay lại trang đó và theo chu kỳ 1-2 tháng Như vậy, nếu trang web được tìm thấy càng nhiều, thì các spiders càng năng quay trở lại hơn và như thế, kết quả tìm kiếm của website cũng được cải thiện theo
Mọi thứ spider tìm thấy đi vào trong phần thứ hai của cỗ máy tìm kiếm Chỉ mục (the index) Chỉ mục, đôi khi gọi là tài liệu, là một kho lưu trữ khổng lồ chứa đựng một sự sao chép của mọi trang web mà spider tìm thấy Nếu một trang web thay đổi, thì danh sách này được cập nhật với thông tin mới
Cơ sở dữ liệu của các search engine được cập nhật hoá bởi các chương trình đặc biệt là "robot", "spider" hay "Webcrawler" Các chương trình này sẽ tự động dò tìm và phân tích từ những trang có sẵn trong cơ sở dữ liệu để kiếm ra các nối kết (links) từ các trang và trở lại bổ xung dữ liệu cho các search engine sau khi phân tích Các chương trình này cũng sẽ báo cáo về các liên kết đã bị đào thải Từ khoá mà người tìm kiếm nhập vào là để cho search engine kiếm trong bảng chỉ số của nó Kết quả đúng nhất sẽ được xếp ở thứ tự đầu tiên
Đôi khi, cần phải có thời gian để các spiders lập chỉ mục cho một trang mới hay một trang được thay đổi nội dung Như vậy, sẽ có trường hợp: Một
Trang 6trang đã được các spiders tìm đến, nhưng lại chưa được lập chỉ mục Và trong khoảng thời gian này, trang web sẽ hoàn toàn không tồn tại trên search engine
Phần mềm tìm kiếm chính là phần tử thứ ba của một cỗ máy tìm kiếm Đây là một chương trình máy tính có chức năng sàng lọc thông tin từ hàng triệu trang tương tự nhau để sắp xếp vị trí từng trang sao cho phù hợp nhất Đây chính
là nơi mà các công ty SEO khai thác để đưa một website nào đó lên vị trí cao nhất khi được tìm kiếm với một hay nhiều từ khóa chỉ định
Tất cả các cỗ máy tìm kiếm tự động có những phần cơ bản được mô tả ở trên, nhưng có những sự khác nhau trong những phần này trong việc nó được điều chỉnh tác động như thế nào Đó là lý do tại sao cùng một từ khóa, khi tìm kiếm trên những cỗ máy tìm kiếm khác nhau thường cho ra những kết quả khác nhau
Một ví dụ cụ thể: Nếu ta đánh một từ khóa, thì Google, Yahoo, MSN, AOL hay Ask đều cho ra các kết quả khác nhau, dù có nhiều website hơi giống nhau
4 Đặc điểm và phân loại search engine
4.1 Các đặc điểm
Như vậy, tuỳ theo keyword mà có thể tìm số trang liên hệ ít hay nhiều Trong nhiều trường hợp, số trang tìm ra có đến hàng triệu trang thì vấn đề đặt ra cho một search engine là làm sao xếp thứ hạng các trang để người dùng có nhiều
cơ hội tìm ra dữ liệu mình muốn nhất?
4.2 Cách thức xếp thứ hạng (ranking)
Hầu hết các search engine xếp hạng ưu tiên khi người thiết kế nghĩ rằng trang tìm thấy là phù hợp với từ khoá và các điều kiện cho thêm của người dùng máy (chẳng hạn như máy tại Pháp thì trang tiếng Pháp sẽ có ưu tiên hơn và tùy theo cách cho từ khoá đủ "hẹp" trong môi trường tìm kiếm) Mặc dù vậy, khi chưa quen người dùng sẽ "tìm" được rất nhiều liên kết không vừa ý và đôi lúc hoàn toàn vô dụng Lý do chính có thể là do người dùng đã không hiểu rõ kĩ thuật tìm kiếm của máy và ngược lại cũng có thể là do kĩ thuật hiện tại của search engine chưa đủ sức để "hiểu" người dùng muốn gì
Trang 7Đa số cách xếp thứ hạng là dựa vào "số lần xuất hiện" (còn gọi là tần suất) của từ khoá trong một trang Nghĩa là trang có xuất hiện từ khoá nhiều nhất sẽ được hiển thị trước tiên khi search engine trả lời (Lập trình search engine cho rằng tài liệu nào lặp lại nhiều lần cái từ khoá thì chắc sẽ hữu dụng nên được xếp ngay ở hàng đầu tiên của trang trả lời)
Bởi vậy nếu ta tra tìm trang Web mà lại dùng từ khoá chung chung hoặc
từ có nhiều nghĩa thì hầu như ta sẽ không tìm được những trang chứa cái mình muốn Trong trường hợp này hoặc ta phải tìm bộ từ khoá khác hơn, chi tiết hơn hoặc dùng những kĩ thuật hổ trợ từ search engine
Có một số search engine ngoài việc xác định tần xuất của từ khoá chúng còn dựa vào khả năng xuất hiện sớm của từ khoá này trong một hồ sơ như là tìm thấy trong tựa đề (title), đầu trang (header), Hoặc họ xác định sự quan trọng của trang Web bằng cách đếm số trang có liên kết từ các trang khác tới nó
Cũng vì lí do này, đa số các search engine lớn đều có thêm chức năng là
"advanced" hay "advanced search" để giúp ta tìm ra cái cần dễ hơn
4.3 Các Search Engine nên biết
www.Google.com được xem là search engine kiểu spider tốt nhất (4 lần thắng do Search Engine Watch lựa chọn) Bằng google, ta có thể dùng để tìm hình ảnh, các bàn luận đang có trên các nhóm tin tức Google cũng cung cấp chức năng kiểm lỗi chính tả, tra cứu các từ điển, tìm giá chứng khoán, bản đồ đi đường, số điện thoại…v.v
Google đầu tiên là một đề án từ Đại học Stanford của các sinh viên Larry Page và Sergey Brin lúc đó gọi là BackRub Năm 1988, tên này đổi thành Google và dự án đã được tung ra thị trường trở thành một công ty tư nhân tên Google cho đến nay
www.yahoo.com xuất hiện năm 1994 ban đầu trang này thiết kế theo phương pháp thư mục Cho đến tháng 11 năm 2002 yahoo đã thêm vào chức năng spider lấy từ Google (để tăng sức cạnh tranh) cho đến tháng 2/2004 Hiện nay yahoo đã tự có kĩ thuật tìm kiếm độc lập
Trang 8Đây là trang "số 1" cho những người thích mua sắm vì cách phân loại theo đối tượng sẽ dể cho người tiêu dùng tìm đến sản phẩm cần thiết Kĩ thuật spider của yahoo là sự kết nối kĩ thuật của Altavista, AllTheWeb, và của Inktomi (một đề án serach engine phát khởi từ UC Berkeley)
www.askjeeves.com khởi sự từ năm 1998 đến 1999 thì trở thành search engine có "ngôn ngữ tự nhiên": Cho phép ta đặt câu hỏi (dĩ nhiên tiếng Anh hoặc các thứ tiếng hỗ trợ) và trả lời tất cả những gì dường như có thể là đúng Thật ra, đằng sau bức màn "kĩ thuật cao" này là công ty đã có khoảng một trăm chuyên viên có nhiệm vụ khảo sát các ghi nhận khi tìm kiếm và từ đó tìm ra những gì dường như là những trang đúng nhất cho sự tìm kiếm đó
Ask Jeeves còn hỗ trợ thêm vào đó một chức năng gọi là "smart search" (tạm dịch dò kiếm thông minh) chức năng này cung cấp thêm một sự phân loại tối thiểu về loại đối tượng mà ta muốn tìm (hình ảnh, phim, nhạc, ) bằng cách chọn các biểu tượng và do đó cho ra kết quả chính xác hơn nhiều
Ví dụ những Search engine khác như:
• www.vivisimo.com - meta-search engine
• www.surfwax.com - meta-search engine
• www.copernic.com -meta-search engine
• www.metacrawler.com - meta-search engine
• http://lii.org/ - adcademic search database
• http://www.academicinfo.net/ - adcademic search database
• http://infomine.ucr.edu/ - adcademic search database
5 Vài đặc thù của các search engines thông dụng
Mỗi search engine có thể cung cấp thêm một số phương tiện để giảm thiểu khó khăn của của việc tìm kiếm nếu như ta đã gặp (lỡ gõ) phải từ khoá có quá nhiều trang tìm được Có nhiều trường hợp kết quả tìm được lên đến cả triệu trang!(vậy là từ khoá này quá chung chung)
Trang 9PHẦN II
Sự ảnh hưởng của SEO tới báo mạng điện tử
1 Thực trạng, tầm quan trọng và vai trò phát triển của SEO trong Báo mạng điện tử
a Thực trạng:
Hiện nay, nhận thức của người quản trị báo mạng tại Việt Nam về việc tối ưu hóa website để các máy tìm kiếm tới rất ít Người sử dụng không ý thức được tầm quan trọng của việc tối ưu hóa website, hoặc làm các phương thức để các máy tìm kiếm đến
SEO có thể coi như là một kỹ thuật, một bí quyết thực sự đối với mỗi người quản trị, xây dựng báo mạng hay đơn thuần là người làm trong lĩnh vực truyền thông
Ngày càng nhiều báo mạng được thành lập, báo mạng của ta sẽ bị lãng quên hoặc "lu mờ" trước các đối thủ của ta nếu ta không thực hiện việc quảng bá trang báo mạng trên các bộ máy tìm kiếm Trang báo mạng của ta không có hiệu quả cao khi không có thứ hạng cao trên Google, Yahoo, hay Live Search khi tìm với các từ khóa tương ứng với thông tin mà người đọc có nhu cầu muốn biết
b Tầm quan trọng SEO đối với báo mạng điện tử:
Nhờ SEO, các trang báo mạng điện tử có thể giới thiệu thông tin cung cấp cho người đọc qua các hình thức khác nhau Thậm chí, SEO có thể là một công
cụ vô cùng hữu ích giúp các trang báo mạng thực hiện những hoạt động kinh doanh Có rất nhiều trường hợp thực tế Ví dụ như một số báo mạng điện tử có tiếng tăm nhờ SEO, có thể thu hút các nhà đầu tư, tài trợ hay các doanh nghiệp
có nhu cầu đăng quảng cáo trên báo mạng
Việt Nam là môi trường có mức độ phát triển Internet tăng nhanh, nhu cầu tiếp nhận thông tin của người dùng cũng tăng theo Đây chính là lí do giải thích phần nào thực trạng có quá nhiều trang báo mạng hay cổng thông tin điện tử
Trang 10được thành lập trong thời gian gần đây Để đáp ứng được tính thời sự và cấp thiết của thông tin, có thể nói công tác SEO chính là yếu tố quan trọng giúp các trang báo mạng giành được thị phần người đọc Ngược lại, nếu công tác SEO kém, lượng người đọc tại trang báo mạng sẽ thuyên giảm, ảnh hưởng trực tiếp tới khả năng tồn tại của trang báo mạng
c Tại sao lại cần tăng thứ hạng cho báo mạng điện tử trên các máy tìm kiếm?
Cần phải đặt câu hỏi, bao nhiêu người đọc biết đến trang báo mạng của mình nếu không thực hiện tìm kiếm? Chắc chắn số lượng sẽ giảm đi đáng kể Với một người đọc, khi cần tìm tài liệu hay thông tin cụ thể, điều đầu tiên họ thực hiện sẽ là vào trang mạng cung cấp dịch vụ tìm kiếm - máy tìm kiếm Nếu
là người thường xuyên sử dụng internet, chắc chắn người dùng sẽ sử dụng những công cụ tìm kiếm lớn và thông dụng như Google hay Yahoo…v.v để tìm kiếm thông tin thay vì nhớ địa chỉ báo mạng nào đó, ngoại trừ những trang báo vốn là địa chỉ quen thuộc của người đọc
Như vậy, ta có thể thấy được nếu thông tin và dịch vụ của trang báo mạng được tìm thấy trên máy tìm kiếm thì có nhiều khả năng người đọc sẽ viếng thăm trang báo mạng của mình Chỉ sử dụng từ "khả năng" ở đây vì nếu như sản phẩm thông tin và dịch vụ của mình được tìm thấy ở các trang sau của kết quả tìm kiếm thì cơ hội được người đọc truy cập website sẽ ít hơn
Như vậy, việc tăng thứ hạng cho trang báo mạng là cần thiết, điều này làm cho trang báo mạng của ta có được vị trí tốt trong kết quả tìm kiếm
2 Lợi ích của SEO – Tối ưu hoá website
* Gia tăng tối đa lượt truy cập đến với trang báo mạng
Khi thực hiện chiến dịch SEO, trang báo mạng sẽ có thứ hạng cao và không phải mất phí khi có ai đó click vào website nên trang báo mạng của người dùng sẽ không bị hạn chế về số lượng click, do hạn chế về mặt ngân sách như khi quảng cáo Google Adwords
* Gia tăng mức độ nhận biết trang báo mạng