2.2.2.12 Tìm thông tin liên quan về 1 website 2.2.3 Một số lệnh tìm kiếm hữu ích khác 2.2.4 Hộp thoại “ Tìm kiếm nâng cao với Google” Mở đầu: Hầu như mỗi bước trong quá trình nghiên cứ
Trang 1Đề tài : Tìm hiểu và thỏa luận các kỹ năng khai thác thông tin trên Internet
A Lý thuyết về các phương pháp thu thập dữ liệu
1 Khái niệm về dữ liệu và thông tin
2 Phân loại dữ liệu theo nguồn dữ liệu
2.1 Dữ liêu thứ cấp
2.2 Dữ liệu sơ cấp
3 Các phương pháp thu thập dữ liệu
B Tìm hiểu và thảo luận các kỹ năng khai thác dữ liệu trên internet
1.Internet và tìm kiếm dữ liệu trên internet
1.1.Internet là gì?
1.2 Tìm kiếm thông tin ( dữ liệu ) trên internet
1.2.1 Thông tin trên internet
1.2.2 Các bước cơ bản tìm kiếm thông tin trên internet
1.2.2.1 Phân tích yêu cầu tìm
1.2.2.2 Diễn đạt lệnh tìm kiếm – Giới thiêu về cú pháp cảu lệnh tìm
1.2.2.3 Phân tích nhóm yêu cầu thông tin ( dữ liệu )
1.2.2.4 Chọn công cụ tìm kiếm thích hợp
1.2.2.5 Tìm lời khuyên từ một người
1.2.2.6 Nếu bước đầu chưa thành công – hãy thử lại
1.2.2.7 Đánh giá kết quả tìm
1.2.3 Chọn công cụ tìm kiếm phù hợp với yêu cầu thông tin
1.2.3.1 Máy tìm kiếm
1.2.3.2 Máy tìm kiếm liên thông
1.2.4 Giới thiệu về một số bộ máy tìm kiếm
1.2.4.1 Giới thiệu về Yahoo
1.2.4.2 Giới thiệu về Bing
1.2.4.3 Giới thiệu về Socbay
1.2.4.4 Giới thiệu về Xalo.vn
2 Kỹ năng tìm kiếm và khai thác dữ liệu trên máy tìm kiếm Google
2.1 Giới thiệu về máy tìm kiếm google
2.2 Kỹ năng tìm kiếm và khai thác dữ liệu trên google
2.2.1 Kỹ năng tìm kiếm cơ bản
2.2.1.1 Xác định từ khóa chính xác
2.2.1.2 Lời khuyên khi xác định từ khóa
2.2.1.3 Suy nghĩ đơn giản
2.2.1.4 Suy nghĩ đến các từ có khả năng xuất hiên cao
2.2.2.Kỹ năng tìm kiếm nâng cao.
2.2.2.1 Loại bỏ một từ nào đó ra khỏi kết quả tìm kiếm
2.2.2.2 Bắt buộc phải có một từ nào đó ra trong kết quả tìm kiếm
2.2.2.3 Rút gọn từ khóa cần tìm
2.2.2.4 Tìm chính xác từ khóa
2.2.2.5 Tìm từ khóa theo tiêu đề trang web
2.2.2.6 Tìm từ khóa trong một Web Site
2.2.2.7 Tìm từ khóa trong địa chỉ trang Web
2.2.2.8 Tìm File (tập tin) có cùng loại
2.2.2.9 Tìm Web Site có từ khóa liên quan với nhau
2.2.2.10 Tìm lại Web Site không còn hoạt động
2.2.2.11 Tìm giới hạn theo tên miền (domain):
Trang 22.2.2.12 Tìm thông tin liên quan về 1 website
2.2.3 Một số lệnh tìm kiếm hữu ích khác
2.2.4 Hộp thoại “ Tìm kiếm nâng cao với Google”
Mở đầu: Hầu như mỗi bước trong quá trình nghiên cứu marketing đều cần thông tin.Họ
cần có thông tin về khách hàng,về các đối thủ cạnh tranh,về những người buôn bán và
những lực lượng khác tác động trên thị trường.Hiện nay, thông tin có vị trí quan trọng hàng
đầu, nó tạo tiền đề cho sự thành công trong kinh doanh Vì vậy, tìm kiếm Internet có vai
trò rất quan trọng trong thu thập thông tin
A LÝ THUYẾT VỀ CÁC PHƯƠNG PHÁP THU THẬP DỮ LIỆU TRONG NGHIÊN CỨU MARKETING
1 Khái niệm dữ liệu và thông tin
- Thông tin (Information):
Thông tin luôn mang ý nghĩa và gồm nhiều giá trị dữ liệu, những ví dụ về dữ liệu trên có thông tin như sau:
Thủ kho Nguyễn Văn Nam xuất mặt hàng có danh mục là: 845102 vào ngày 14/10/ 02 với số lượng 18
2 Phân loại dữ liệu: Phân loại dữ liệu theo nguồn thu thập dữ liệu
Dữ liệu trong nghiên cứu marketing có thể thu thập từ nhiều nguồn khác nhau, và
sau đây là các nguồn dữ liệu chính:
Trang 3+) Các dữ liệu thứ cấp có thể giúp người quyết định đưa ra giải pháp để giải quyết vấn đề
trong những trường hợp thực hiện những nghiên cứu mà các dữ liệu thứ cấp là phù hợp mà
không cần thiết phải có các dữ liệu sơ cấp Ví dụ như các nghiên cứu thăm dò hoặc nghiên
cứu mô tả
+) Ngay cả khi dữ liệu thứ cấp không giúp ích cho việc ra quyết định thì nó vẫn rất quan
trọng với nó giúp xác định và hình thành các giả thiết về các giải pháp cho vấn đề Nó là cơ
sở để hoạch định việc thu thập các dữ liệu sơ cấp; cũng như được sử dụng để xác định tổng
thể chọn mẫu và thực hiện chọn mẫu để thu thập dữ liệu sơ cấp
cũng có thể sử dụng các phương pháp thử nghiệm để thu thập dữ liệu sơ cấp
3 Phương pháp thu thập dữ liệu
Dữ liệu có thể được thu thập bằng các phương pháp nghiên cứu khác nhau Mỗiphương pháp có những ưu điểm và hạn chế nhất định, do vậy phù hợp với những dự ánnghiên cứu nhất định Các phương pháp nghiên cứu bao gồm: Nghiên cứu định tính,quan sát, phỏng vấn và thử nghiệm Các nghiên cứu định tính bao gồm phỏng vấnnhóm, phỏng vấn chuyên sâu và kỹ thuật hiện h́nh Phương pháp quan sát có thể đượcthực hiện bằng con người hoặc thiết bị Các phương pháp phỏng vấn bao gồm phỏngvấn cá nhân trực tiếp, phỏng vấn nhóm cố định, phỏng vấn bằng điện thoại, phỏng vấnbằng thư tín Phương pháp thử nghiệm có thể được thực trong pḥng thí nghiệm hoặcthực hiện tại hiện trường Khi thực hiện các cuộc thử nghiệm chúng ta có thể phải chịusai lệch trong kết quả do các nguyên nhân: lịch sử, lỗi thời, bỏ ngang, hiệu ứng thửnghiệm, công cụ đo lường hoặc lấy mẫu Do vậy, việc tổ chức một cuộc thử nghiệmcần phải chuẩn bị tốt, lường trước những sai lầm có thể xảy ra và có hướng khắc phục
B TÌM HIỂU VÀ THẢO LUẬN CÁC KỸ NĂNG KHAI THÁC THÔNG TIN TRÊN
INTERNET
Thế giới đang thay đổi từng giờ từng giây và khoa học công nghệ ngày càng phát triển
Trong thời đại bùng nổ công nghệ thông tin, nghiên cứu marketing cũng luôn phát triển
đáp ứng sự phát triển của thời đại Internet trở thành phương tiện hữu ích phục vụ công
việc thu thập dữ liệu trong nghiên cứu marketing
I Internet và tìm kiếm trên internet
1 1 Giới thiệu Internet :
Internet – cũng được biết với tên gọi Net – là mạng máy tính lớn nhất thế giới, hoặc chính xác hơn là mạng của các mạng, tức bao gồm nhiều mạng máy tính trên thế
Trang 4giới được nối lại với nhau.
Internet bao gồm rất nhiều mạng trên thế giới kết nối với nhau và cho phép bất kỳ một máy tính nào trong mạng có thể kết nối bất kỳ máy nào khác để trao đổi thông tin với nhau Một khi đã kết nối vào Internet, máy tính của bạn sẽ là một trong số hàng chục triệu thành viên của mạng khổng lồ này
1 2 Tìm kiếm thông tin ( dữ liệu ) trên internet
Tìm kiếm dữ liệu trên Internet là một công việc hoặc hết sức dễ dàng hoặc là khó khăn
không thể tưởng tượng nổi Khi truy cập và tìm kiếm thông tin trên Internet, cần chú ý một
số đặc điểm sau đây của mạng Internet để có thể tìm kiếm hiệu quả:
Vì nội dung trên Internet luôn được cập nhật và bổ sung, không có bất kỳ một số liệu
thống kê chính xác nào về lượng thông tin có thể truy cập được trên Internet
Tài liệu trên Internet không được xử lý bằng một hệ thống hợp chuẩn nào Nếu như
danh mục tài liệu trong các thư viện được xử lý bao gồm những từ khóa chuẩn có kiểm soát thì nguồn tin trên Internet hoàn toàn không sử dụng bất cứ công cụ nào tương tự như vậy Vì vậy bạn cần phải luôn luôn phán đoán những từ ngữ, thuật ngữ khác nhau
sẽ được sử dụng trong các trang web mà bạn cần
Khi bạn tiến hành “tìm kiếm dữ liệu trên Internet”, bạn không tìm kiếm một cách trực
tiếp vì điều này là KHÔNG THỂ THỰC HIỆN ĐƯỢC Internet là tổng hợp của rất nhiều trang web được lưu trữ trên nhiều máy chủ khác nhau trên khắp thế giới Máy tính của bạn không thể tìm kiếm hoặc kết nối trực tiếp tới tất cả các máy chủ Điều bạn
có thể làm trên máy tính của mình là truy cập vào một hoặc nhiều công cụ tìm kiếm gián tiếp đang có hiện nay Các công cụ tìm kiếm sẽ cho phép bạn tìm kiếm trong cơ sở
dữ liệu của nó – và mỗi cơ sở dữ liệu của một công cụ tìm kiếm cũng chỉ là một phần nhỏ của toàn bộ mạng thông tin toàn cầu Công cụ tìm kiếm cung cấp cho bạn các đường kết nối tới các trang web Bạn nhấn chuột v ào các đường kết nối này và tải về các văn bản, hình ảnh, âm thanh, và các thông tin khác từ các máy chủ khác nhau tr ên khắp thế giới
1.2.1 Thông tin trên internet
Vậy những thông tin gì bạn có thể tìm thấy trên Internet? Không thể liệt kê tất cả các loại
nguồn tin có trên Internet, đặc biệt khi Internet thay đổi rất thường xuyên và nhanh chóng
Tuy nhiên, nhìn chung Internet hữu ích nhất khi tìm kiếm những thông tin trong các nhóm
sau đây (chú ý phần lớn những thông tin này là bằng tiếng Anh):
Các sự kiện đang diễn ra, ví dụ: tin tức ngày hôm nay, hay những xu hướng mới nhất
Thông tin kinh tế, ví dụ: thông cáo báo chí của một công ty, chỉ số chứng khoán, thông
tin về sản phẩm
Thông tin của chính phủ, ví dụ: các chính sách hiện hành, luật pháp, các cuộc thảo luận
tại quốc hội, quyết định của tòa án, thông cáo báo chí
Văn hóa đại chúng, ví dụ: phim, nhạc, truyền hình, thể thao chuyên nghiệp
Trang 51.2.2 Các bước cơ bản tìm kiếm thông tin ( dữ liệu ) trên internet
1.2.2.1 Phân tích yêu cầu tìm: Tự đặt ra câu hỏi để làm rõ yêu cầu thông tin của mình
Một số câu hỏi cần đặt ra:
Tôi muốn biết thông tin cụ thể ở nước nào, vùng nào?
Tôi cần những thông tin về các vấn đề nóng hổi hiện nay hay là thông tin mang tính lịch
sử?
1.2.2.2.Diễn đạt lệnh tìm kiếm - giới thiệu về cú pháp của lệnh tìm
Cú pháp của lệnh tìm là cách thức chúng ta sử dụng để liên kết các khái niệm một cách
phù hợp cho lệnh tìm của bạn Các máy tìm kiếm có những cách thức khác nhau trong việc
liên kết các thuật ngữ tìm.Nguyên tắc cơ bản nhất cho hầu hết các máy tìm kiếm là tương
tự như nhau, tuy nhiên có một vài điểm khác biệt nhỏ về cách diễn đạt lệnh tìm Nếu chưa
hiểu rõ, bạn nên tham khảo phần Phân nhóm yêu cầu thông tin “help” để biết thêm thông
tin
1.2.2.3.Phân nhóm yêu cầu thông tin: Loại yêu cầu tìm
Gồm các từ/cụm từ rõ ràng, dễ hiểu (gần như không thể bị hiểu nhầm sang nghĩa khác)
Gồm các từ phổ biến hoặc khái quát có thể có kết quả là quá nhiều kết quả không phù hợp
Tìm thông tin khái quát về một chủ đề
Tìm kiếm thông tin theo một chủ đề hẹp
Có thể diễn đạt bằng nhiều cách khác nhau
1.2.2.4.Chọn công cụ tìm kiếm phù hợp: Chọn công cụ tìm kiếm phù hợp với thông tin mà
mình cần tìm.Xem xét cách thức làm việc của từng công cụ tìm và diễn đạt lại lệnh tìm để
có thể khai thác tối đa các chức năng của công cụ tìm đó Cố gắng thực hiện việc tìm kiếm
Trang 6trên nhiều công cụ tìm kiếm khác nhau Xem các kết quả tìm và sử dụng các thuật ngữ
được sử dụng trong các văn bản tìm được để tìm kiếm lại
1.2.2.5.Tìm lời khuyên từ một người: Bạn có thể tìm lời khuyên từ chuyên gia để chọn
được công cụ tìm kiếm hiệu quả nhất cũng như đưa ra được yêu cầu tìm kiếm thông tin xác
thực nhất
1.2.2.6 Nếu bước đầu bạn chưa thành công - hãy thử lại: Trong một số trường hợp, có thể
bạn không may mắn Vì vậy nếu chưa tìm được thông tin bạn hãy quay lại từ bước đầu và
lần lượt thực hiện lại các bước
1.2.2.7 Đánh giá kết quả tìm kiếm: Trong quá trình tìm kiếm, đánh giá các dữ liệu thu thập
được là công việc cuối cùng của quy trình tìm kiếm dữ liệu Quá trình đánh giá là để loại
trừ ra những thông tin không có giá trị đã đượ thu thập ở những bươc trên
Trang 71.2.3 Chọn công cụ tìm kiếm phù hợp với yêu cầu thông tin
Có thể truy cập đến rất nhiều công cụ tìm kiếm trên Internet Sau đây là một vài công cụ
thông dụng nhất,tuy nhiên để hiểu sâu hơn về tính năng của từng công cụ, bản thân mỗi
người cần phải luyện tập và sử dụng nhiều
Điểm mạnh: Khi tìm kiếm một tài liệu cụ thể (tên tài liệu, tên người, tổ chức đã biết), tìm kiếm các chủ đề khó phân loại
Điểm yếu: Không cho phép có một cái nhìn tổng quát về một chủ đề cụ thể (trong
=>Google có cơ sở dữ liệu lớn nhất, tuy nhiên cần lưu ý là không có một máy tìm kiếm
nào có thể tìm được toàn bộ thông tin về một chủ đề
1.2.3.2 Máy tìm kiếm liên thông
Các máy tìm kiếm liên thông có thể cùng một lúc lướt qua một số máy tìm kiếm khác, thường tìm được khoảng 10% kết quả tìm được ở mỗi máy tìm kiếm mà chúngliên kết
Trang 8 Điểm mạnh: Thường tìm kiếm hiệu quả với nếu bạn chỉ sử dụng một từ hoặc một cụm từ.
Điểm yếu: Tuy nhiên bạn không thể sử dụng các chức năng tìm kiếm nâng cao của từng máy tìm kiếm
Bạn cũng không thể tiến hành một phép tìm toàn diện và phức tạp
Một số máy tìm kiếm liên thông tiêu biểu:
+)SurfWax http://www.surfwax.com/
+) Ixquick http://www.ixquick.com/
+) Metacrawler http://www.metacrawler.com/
1.2.4 Giới thiệu về một số bộ máy tìm kiếm
Bộ máy tìm kiếm rất đa dạng và phong phú, vấn đề là bạn phải biết cách tìm kiếm như thế nào để có được thông tin mình cần tìm Trên thế giới hiện có khoảng
- Inference Find
- Euro Seek
- Search Port
- Find What Search
- Search Engine Guide
- Ask Jeeves Search
- Virtual Library
- InfoHighway
- Copernic
Tuy nhiên, phổ biến nhất là Google, Yahoo và Bing
Ở Việt Nam, Google là công cụ tìm kiếm được sử dụng phổ biến nhất, chiếm đến90% số lượng tìm kiếm Khoảng 74% người dùng Internet ở Việt Nam truy cập hàngngày vào Google trong khi đó Yahoo chí có 14% (theo khảo sát của công tyVinaLink) Theo ComSore Inc, Google và Bing đã chiếm được những lợi thế nhấtđịnh trong quý 1 năm 2010 Tại Mỹ thì google vừa dành được thêm 0.1 phần trăm,tăng từ 65.4% lên 65.5% Trong khi đó, Bing với những thay đổi tính năng liên tụctrong thời gian gần đây, đã tạo được sự tăng trưởng khá ấn tượng là thêm được 0.2%
thị phần, tăng từ 11.3% lên 11.5%.Với Yahoo thì việc dành thêm thị phần có vẻ
Trang 9không đơn giản Sau 2 tháng đầu năm, Yahoo đã để mất 0.2% thị phần của mìnhgiảm từ 17% xuống con 16.8% Ngoài ra, hiện nay Việt Nam cũng đang phát triểnmột số máy tìm kiếm
1.2.4.1 Giới thiệu về một số máy tìm kiếm
1 Giới thiệu về máy tìm kiếm Yahoo
Yahoo! Inc là một tập đoàn đại chúng Hoa Kỳ với mục tiêu trở thành "dịch vụInternet toàn cầu hàng đầu cho người tiêu thụ và giới doanh nghiệp" Trang chínhcủa nó đặt tại http://www.yahoo.com, phiên bản tiếng Việt tại http://vn.yahoo.com,một thư mục mạng lưới và một số dịch vụ khác, trong đó có Yahoo! Mail, Yahoo!
Search và Yahoo! New Yahoo! được sáng lập bởi hai sinh viên cao học tại trườngĐại học Stanford là David Filo và Jerry Yang ( Dương Trí Viễn) vào tháng 1 năm1994và được thành lập vào ngày 2 tháng 3 năm 1995 Trụ sở công ty được đặt tạiSunnyvale, California Ban đầu, Yahoo! Search bắt đầu như là một thư mục web củacác trang web khác, tổ chức trong hệ thống phân cấp một, trái ngược với một chỉ sốtìm kiếm của các trang Vào cuối những năm 1990, Yahoo! đã phát triển thành mộtcổng thông tin chính thức với một giao diện tìm kiếm, vào năm 2007, một phiên bảngiới hạn tìm kiếm dựa trên lựa chọn ra đời
2.Giới thiệu về máy tìm kiếm Bing
Được Giám đốc Điều hành của Microsoft Steve Ballmer tiết lộ vào ngày 28 tháng 5 năm 2009 tại hội nghị All Things D tại San Diego, Bing là một sự thay thế cho Live Search; bộ máy tìm kiếm này được đưa lên trực tuyến hoàn toàn vào ngày 3 tháng 6 năm 2009 Mọi người biết nhiều đến công cụ tìm kiếm này là do nó được đặt mặc định trong trình duyệt Internet Explorer MSN Search luôn gắn liền với trình duyệt của Windows, và hệ điều hành của Microsoft luôn được xem là phổ biến nhất thế giới Vào năm 2006, MSN Search đã đổi tên thành Windows Live Search, sau đó chuyển thành Live Search vào 2007, và cuối cùng Bing vào năm 2009 MSN Search
có thể trả về kết quả của bộ máy tìm kiếm do Microsoft xây dựng, chỉ mục của nó được cập nhật hàng tuần Windows Live Search là công cụ tìm kiếm thay thế hoàn toàn MSN Search giúp người dùng có thể tìm thông tin cụ thể bằng cách dùng thẻ (tab) tìm kiếm Sau đó Microsoft đã tách Live Search ra khỏi dịch vụ Windows Live
Cuối cùng, với nỗ lực cải tiến đáng kể về các dịch vụ tìm kiếm, một lần nữa Live Search được chính thức thay thế bằng Bing
Trang 103 Giới thiệu về Socbay
Một trong số ít những trang tìm kiếm của Việt Nam xây dựng được bộ máy tìm kiếmriêng So vớiYahoo! hay Google, khả năng "hiểu" tiếng Việt của http://socbay.vn/ tỏ
ra tốt hơn nên đưa ra kết quả khá thuyết phục Với mục tiêu đề ra là phát triển cácdịch vụ tìm kiếm chuyên biệt có tính liên kết nhằm đáp ứng nhu cầu đa dạng củangười sử dụng, Sóc bay đang không ngừng cải thiện chất lượng dịch vụ của mình
Được đưa vào nghiên cứu từ năm 2002, Sóc bay là hệ thống duy nhất được pháttriển trên nền tảng công nghệ tìm kiếm của Naiscorp Trang web hiện tại đang cungcấp các dịch vụ tìm kiếm đa dạng như: Tin tức, MP3, video, rao vặt, từ điển, hìnhảnh Sự ra đời của Sóc bay là thành quả nghiên cứu lâu dài, bền bỉ của đội ngũ cácchuyên gia Việt Nam Trang web có thể đáp ứng khoảng 80 triệu lượt truy cập mỗingày, với tốc độ xử lí kết quả tìm kiếm chưa tới 1 giây
4 Giới thiệu về Xalo.vn Phát triển bởi công ty Tinh Vân, http://xalo.vn/ được phát triển theo hai hướng chủ
đạo
Thứ nhất, Xa lộ tập trung đánh vào các nhu cầu quen thuộc của người dùng như tìm web,
tin tức, blog, MP3, video, ảnh…Sau đó, công cụ tìm kiếm này có thể đem đến cho người
xem những thông tin chuyên sâu về một lĩnh vực nào đó như bất động sản, tài chính, thể
Trang 11thao, du lịch…Đây thực sự là một lợi thế của Xa Lộ khi công ty Tinh Vân đã khéo léo kế
thừa kinh nghiệm sau nhiều năm cung cấp Vinaseek (một công cụ tìm kiếm khác) trước
đây
Trang web cung cấp thông tin rất “Việt hóa” cho người dùng Bởi lẽ giống Sóc bay,
Xa lộ cũng phát triển công cụ tìm kiếm riêng của mình, ưu tiên những kết quả trả vềcủa trang web Tiếng Việt Với hơn 600.000 địa danh nổi tiếng của Việt Nam đượccung cấp thông tin đầy đủ, hơn 26.000 trò chơi mới kèm theo kho dữ liệu thông tinkhổng lồ, người dùng khó lòng có thể bỏ qua phàn nàn điều gì về công cụ này
C Kỹ năng tìm kiếm thu thập dữ liệu hiệu quả trên Google
1 Giới thiệu về Google
Các nhà sáng lập Larry Page và Sergey Brin đã đặt tên công cụ tìm kiếm mà họ tạo
ra là “Google”, cách chơi chữ của từ “googol”, thuật ngữ toán học có nghĩa là số 1 được theo sau bởi 100 số 0 Tên này phản ánh khối lượng thông tin khổng lồ hiện có
và phạm vi sứ mệnh của Google: sắp xếp thông tin của thế giới và làm cho thông tin này trở nên hữu dụng và có thể truy cập trên toàn cầu
Biểu trưng doodle đầu tiên của Google cho lễ hội Burning Man, tháng 8 năm 1998.