Vai trò của tài liệu trong QT nghiên cứu4 Kiến thức về miền nghiên cứu và chủ đề quan tâm Kiến thức về lý thuyết liên quan giúp NCS lên khung được câu hỏi và hiện tượng Kiến thức v
Trang 1TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
ĐẠI HỌC QUỐC GIA HÀ NỘI
1
Trang 2Nội dung
1 Quá trình NCKH
2 Lý thuyết hóa
3 Phương pháp nghiên cứu
4 Một số bài học trong tiến hành nghiên cứu
2
Trang 31 Quá trình NCKH
3
Trang 4Vai trò của tài liệu trong QT nghiên cứu
4
Kiến thức về miền nghiên cứu và chủ đề quan tâm
Kiến thức về lý thuyết liên quan giúp NCS lên khung được câu hỏi và hiện tượng
Kiến thức về phương pháp nghiên cứu liên quan được NCS áp dụng để phát triển kiến thức mới, xây dựng các sản phẩm sáng tạo hay tường minh các câu hỏi mới
Loài người hình thành truyền thống: Tích lũy tri thức bằng cách bổ sung công bố khoa học và kho tri thức NCS công bố bài báo, chương sách, sách
Sách và bài báo; cập nhật hơn: thông báo các hội nghị quốc tế
cung cấp cả ba loại kiến thức trên đây
Cần suốt hành trình nghiên cứu
NCS cần dành thời gian đáng kể để tìm kiếm, chọn lọc, phân tích tài liệu: Hiểu vững
thân tri thức → đóng góp vào thân tri thức
Trang 5Vai trò tài liệu
mức độ mà lý thuyết hiện thời để giải thích được về các đặc thù của hiện tượng hoặc vấn
đề, và tương ứng là chỗ mà chúng còn thiếu hụt
chiến lược và phương pháp đã được dùng trong quá khứ để nghiên cứu các hiện tượng/vấn đề (hoặc các hiện tượng hoặc các vấn đề liên quan)
các lý thuyết liên quan được dùng để lên khung cuộc khảo sát
thân tri thức hiện thời về phương pháp nghiên cứu có sẵn (như, các quy trình và hướng dẫn thực hiện một loại nghiên cứu riêng cho vấn đề cụ thể)
Trang 6Vai trò tài liệu
6
phát hiện và hiểu biết sâu một miền bài toán cụ thể
lý thuyết sẵn có và/hoặc được sử dụng để khảo sát các vấn đề/hiện tượng quan tâm
Tình trạng hiện thời của các phương pháp được làm phù hợp
và áp dụng cho nghiên cứu
Không phải mọi tài liệu /mọi phần trong tài liệu liên quan là liên quan: đọc, nghĩ về sự liên quan, giải thích về sự liên quan.
Hầu hết NCS đánh giá thấp sự liên quan của các bài báo khác:
cần theo phương châm “đọc hơi nhiều còn hơn là đọc không đủ”
Trang 7Đọc-nghĩ-giải thích
7
Những câu hỏi thu hoạch
Đóng góp cốt lõi của tài liệu cho thực tế hiện đại của lĩnh vực
nghiên cứu là gì?
Liên quan gì tới tài liệu khác và thực tế khác ?
đi theo một khía cạnh lý thuyết/phương pháp có ích để nghiên
cứu hiện tượng riêng được quan tâm ? Và tại sao nó là/không là
một trường hợp?
Ảnh hưởng ra sao đến suy nghĩ riêng của NCS tới lĩnh vực NC ?
Suy nghĩ như thế nào về tác động của bài báo tới thân tri thức
trong lĩnh vực tại thời điểm được công bố.
Trang 8 Tài liệu ngoài miền nghiên cứu
Phát hiện lý thuyết phổ biến trong các lĩnh vực nghiên cứu khác, bên cạnh miền nghiên cứu cụ thể
Thấy cách các phương pháp được áp dụng trong lĩnh vực nghiên cứu khác, đặc biệt là về các hướng dẫn và tiêu chuẩn đánh giá có sẵn
Phát triển một tiếp xúc với cách thức của các học giả khác trong lĩnh vực khác lên khung, kiểm tra, và giải vấn đề thế giới thực, theo nghĩa chung nhất
Trang 9Kinh nghiệm nhỏ
9
Hai thông tin cần thiết cơ bản nhất
Hội nghị/tạp chí hàng đầu thế giới về lĩnh vực NC
Nhà khoa học hàng đầu thế giới về lĩnh vực, về chủ đề NC riêng (chú ý các NCS)
Hội nghị thế giới về lĩnh vực chuyên sâu
Các hiệp hội nghề nghiệp
Association for Computing Machinery - ACM: http://www.acm.org/
Association for Information Systems – AIS: http://aisnet.org/
IEEE-CS: http://www.computer.org/portal/web/guest/home
và các phân hội của các hiệp hội này,
chẳng hạn KDD: http://www.sigkdd.org/index.php , hoặc Process M:
https://www.win.tue.nl/ieeetfpm/doku.php?id=shared:minutes_bpm_2015
Các bài toán được đặt ra
Các báo cáo mời
Các bài báo được giải thưởng
Ví dụ: KDD 2016 http://www.kdd.org/kdd2016/ (Xem trang sau)
Trang 10Hội nghị KDD 2016
10
Trang 11Hội nghị KDD 2016: Các ủy ban
11
Trang 12Hội nghị KDD 2016: Các ủy ban
12
Trang 13Hội nghị KDD 2016: Các ủy ban
13
Trang 14;
http://www.exp-platform.com/Documents/2015-08OnlineControlledExpe rimentsKDDKeynoteNR.pdf
Trang 15KDD 2014: Keynote Talks Oren Etzioni
15
http://www.informatik.uni-trier.de/~ley/pers/hd/e/Etzioni:Oren.html
Deep learning has catapulted to the front page of the New York Times, formed
the core of the so-called 'Google brain', and achieved impressive results in
vision, speech recognition, and elsewhere Yet researchers have offered simple conundrums that deep learning doesn't address For example, consider the
sentence: 'The large ball crashed right through the table because it was made of Styrofoam.' What was made of Styrofoam? The large ball? Or the table? The
answer is obviously 'the table', but if we change the word 'Styrofoam' to 'steel',
the answer is clearly 'the large ball' To automatically answer this type of
question, our computers require an extensive body of knowledge We believe
that text mining can provide the requisite body of knowledge My talk will
describe work at the new Allen Institute for AI towards building the
next-generation of text-mining systems.
Trang 16 Những người báo cáo mời tại các hội nghị hàng đầu
Những người hướng dẫn NCS được các giải thưởng
Lưu ý: Vào trang web của nhà khoa học hoặc các nguồn tra cứu
để loang tới những bài báo cập nhật nhất
Trang 17Kinh nghiệm nhỏ: Tra cứu tài liệu
Để tìm công bố của một tác giả trên DBLP
+ Tìm kiếm Google với câu hỏi ““tên_người"+DBLP”
+ Tìm dòng kết quả: dblp: tên_người
+ Vào trang web tương ứng
+ Có thể biết các chủ đề nghiên cứu cập nhật
Các danh mục ISI : Tạp chí SCI, SCIE (ISI) và Hội nghị
http://ip-science.thomsonreuters.com/cgi-bin/jrnlst/jlresults.cgi?PC=D
http://ip-science.thomsonreuters.com/cgi-bin/jrnlst/jlresults.cgi?PC=K
z/conf_proceedings_citation_index/
http://www.scimagojr.com/journalrank.php?
category=0&area=0&year=2013&country=&order=sjr&page=0&min=0&mi
n_type=cd&out=xls
Trang 18http://kdd.org/ : Trang web công đồng DM
Dece mber
5, 2016
Trang 19http://kdd.org/awards/sigkdd-dissertation-award
Dece mber
5, 2016
Winner: Mining Latent Entity Structures From Massive Unstructured and Interconnected Data Chi Wang (student) and Jiawei Han (advisor) at
University of Illinois at Urbana-Champaign
Runner-up: Modeling Large Social Networks in Context Qirong Ho
(student) and Eric Xing (advisor) at Carnegie Mellon University
Runner-up: Computing Distrust in Social Media Jiliang Tang (Student)
and Huan Liu (Advisor) at Arizona State University Định hướng Khóa
luận đại học K56: Thái Thị Hoài, Nguyễn Quỳnh Nga, Mai Công Đạt
Trang 20Tài liệu tham khảo
20
Vai trò của tài liệu tham khảo
Danh sách tài liệu tham khảo phản ánh tính khoa học và thời sự của báo cáo nghiên cứu (bài báo, luận án)
“Có một tập TLTK tốt là thành công gần 50%”
Phân bổ vị trí TLTK trong báo cáo
Mô tả tài liệu tham khảo
Trình bày như hướng dẫn của ấn phẩm hoặc tổ chức
Đầy đủ thông tin: (Các) Tác giả, tên tài liệu, nơi công bố (ấn phẩm, các trang), thời gian công bố
Tính dễ hiệu chỉnh: đầu tiên đánh theo tên sau đó mới theo số
DBLP là một ví dụ tốt
Một số sai sót điển hình tại Việt Nam:
“thừa kế” TLTK: lấy TLTK từ một TLTK khác
thiếu thông tin: không đầy đủ thông tin
Trình bày các thành phần trong một TLTK không đúng
sắp xếp không theo đúng thứ tự quy định (như theo tên tác giả đầu)…
Trang 21Tài liệu tham khảo
21
Chỉ dẫn TLTK
Mọi TLTK phải được chỉ dẫn (tham chiếu) trong nội dung báo cáo
Mọi chỉ dẫn đều phải có TLTK tương ứng
Chỉ dẫn tác giả:
1 tác giả A: viết tên tác giả A: “A [.]”
Hai tác giả A, B: viết “A và B [.] “ ( “A and B [.]” tiếng Anh)
Từ ba tác giả trở lên A, B, C : viết “A và cộng sự [.]” (“A et al [.]”)
Một số TLTK quan trọng, trong lần xuất hiện đầu tiên nên có chỉ dẫn năm, chẳng hạn, như “A và B, 2014 [10]”
Trang 22Câu hỏi nghiên cứu
22
Dành riêng để đáp ứng hai thách thức
Phương pháp và lý thuyết: Khảo sát một cách hệ thống các tài liệu hiện có
Phát triển câu hỏi nghiên cứu và kế hoạch nghiên cứu
Có tính cấu trúc cao
Tập các sách, bài báo liên quan, và các lớp tốt điển hình, hội thảo, và bài giảng (tutorial) Nhấn mạnh luận án TS liên quan
Tính cấu trúc tốt cho phép NCS nắm vững các phương pháp và lý thuyết liên quan
Thường là một chương của luận án: literature review
Làm ít hơn: Không chấp nhận Thuyết bất khả tri miền ứng dụng (domain-agnostic) cho phép nghiên cứu có tính độc lập miền
Nền tảng tạo năng lực phương pháp NC tốt
Trang 23Một số vấn đề đặt câu hỏi nghiên cứu
23
"Phát biểu thang máy"
Không thể diễn đạt câu hỏi NC nếu không có độc thoại 5 phút “người nghe đã rời khỏi thang máy”
Lý do: không hoàn toàn hiểu câu hỏi hoặc không thể nói rõ đúng cách
Câu hỏi NC tốt chỉ khi là câu hỏi ngắn
Đủ phân biệt với các hiện tượng, vấn đề liên quan khác
“Cái gì vậy"
Câu hỏi nghiên cứu không quan trọng cho bất cứ ai: thờ ơ!
Thu hút: cần được hưởng lợi thực tế từ câu hỏi nghiên cứu
Vấn đề “cái gì vậy” xảy ra khi NCS khó khăn trong động lực và biện minh câu hỏi nghiên cứu
“Giải quyết thế giới"
Câu hỏi thực sự quan trọng song không thể giải được do tài nguyên (chỉ một mình NCS) và/hoặc thời gian (2-3 năm).
Không tìm được giải pháp với tài nguyên và thời gian cho phép
Trang 24Một số vấn đề đặt câu hỏi nghiên cứu
24
“Không giải được"
Câu hỏi không thể trả lời được đúng nghĩa
Ví dụ: Nghiên cứu theo chiều dọc: phải trải qua nhiều năm
“Nhiều"
Đưa quá nhiều câu hỏi: câu hỏi quá hẹp/quá không thích hợp/quá lớn
Nên 01/02 câu hỏi
Một số ví dụ (Danh sách đen)
cho giám đốc điều hành cấp cao bán lẻ”.
Trang 25Một số hướng dẫn tìm câu hỏi NC tốt
25
Gợi ý
một tuyên bố quan trọng xác định hiện tượng được nghiên cứu
(các) câu hỏi nghiên cứu cung cấp khung tiêu chuẩn mà toàn bộ nghiên cứu Tiến sỹ xoay
quanh và tiến hóa nó (chúng)/
các câu hỏi nghiên cứu cung cấp khung gới hạn toàn bộ điều tra của NCS và trình diễn nó
trong luận án
Một số câu hỏi hướng dẫn
Hãy cho biết các câu hỏi nghiên cứu của lĩnh vực đó là gì ?
Hãy cho biết thân tri thức của lĩnh vực đó là gì ?
Những câu hỏi nghiên cứu quan trọng được thiết lập trong lĩnh vực là gì ?
Những vùng nào cần được tiếp tục khảo sát ?
Nghiên cứu NCS có lấp được một lỗ trống quan trọng? Nó dẫn đến một hiểu biết nhiều
hơn?
Trang 26Một số hướng dẫn tìm câu hỏi NC tốt
26
Một số câu hỏi hướng dẫn (tiếp)
Các nghiên cứu đã được tiến hành trong vùng chủ đề nhiều ra sao?
Chỉ dẫn từ tác giả kinh điển: “Trong lời tựa Kỷ yếu Hội nghị khoa học thế giới về Tập thô
và Các mô hình hệ thống thông minh mới nổi năm 2007 (The International Conference on Rough Sets and Emerging Intelligent Systems Paradigms: RSEISP 2007) tưởng nhớ GS Zdzislaw Pawlak, Marzena Kryszkiewicz và cộng sự [10] cho biết có hơn 4000 ấn phẩm khoa học về tập thô đã được công bố tới thời điểm đó.”
Chỉ dẫn từ thống kê mà điển hình từ Google Scholar: “Theo thống kê của Google Scholar
(truy nhập tháng 5/2012), trong giai đoạn 2008-nay, khoảng 970 bài báo có chứa cụm từ
“type-2 fuzzy set” và 44 bài báo chứa cụm từ “Hedge algebra” đã được (trong tổng số toàn bộ 1610/89 bài báo chứa cụm từ “type-2 fuzzy set”/“Hedge algebra”)”
Nghiên cứu đề xuất đã được thực hiện trước đây ? Liệu có còn chỗ cho sự cải tiến?
Nghiên cứu nhiều song vẫn thời sự: xu hướng số lượng theo năm
Chỗ cho cải tiến: lấy từ ý kiến các nhà khoa học uy tín
Trang 27Một số hướng dẫn tìm câu hỏi NC tốt
27
Một số câu hỏi hướng dẫn (tiếp)
Có phù hợp thời gian hay không khi câu hỏi được trả lời?
Nó là một chủ đề bền vững và quan trọng hay
nó hiện là chủ đề nóng nhưng là mốt nhất thời nên có nguy cơ trở nên lỗi thời? (phản
chứng)
Ai sẽ quan tâm đến việc có được một câu trả lời cho câu hỏi?
Tác động tiềm năng của nghiên cứu được đề xuất là gì?
Lợi ích của việc trả lời câu hỏi nghiên cứu là gì?
Nó sẽ trợ giúp ai, và nó sẽ giúp họ như thế nào?
Nghiên cứu đề xuất có một tác động đáng kể đối với lĩnh vực này hay không?
Ba thành phần chính khi phát triển câu hỏi NC
Động lực, Đặc tả phát biểu câu hỏi, Biện luận tường minh
Trang 28Ba thành phần Phát triển câu hỏi NC
Một hiện tượng quan trọng cụ thể được cộng đồng nghiên cứu quan tâm
Động lực không nhất thiết rộng mà cần đề cập 3 khía cạnh trên
Ví dụ về dãy các trao đổi
Các tổ chức đầu tư vào CNTT mới, hy vọng thu được ích lợi từ các đầu tư này Miền
bài toán: Đầu tư vào CNTT, được hưởng lợi từ CNTT Quan trọng: lượng tiền
Lợi ích như thế không có được nếu nhân viên không dùng CNTT Hiện tượng đặc biệt:
Nhân viên không dùng CNTT
Dẫn tới câu hỏi nghiên cứu Tại sao nhân viên tử chối dùng CNTT? →Bài báo
“Identifying and Testing the Inhibitors of Technology Usage Intentions”
Trang 29Ba thành phần Phát triển câu hỏi NC
29
Đặc tả phát biểu bài toán (Specification of Problem Statement)
Khi có động lực thích hợp ⇒xác định chính xác câu hỏi NC
Loại câu hỏi NC
Câu hỏi “ai”, “cái gì”, “ở đâu”: hướng tới các mục tiêu tìm kiếm và khám phá các chủ đề vẫn còn ít tri thức
Câu hỏi “làm thế nào”, “vì sao”: câu hỏi giải thích, tìm kiếm câu trả lời về cơ chế nhân-quả tới công việc liên quan một hiện tượng cụ thể
Phát triển câu hỏi NC như một phát biểu bài toán là một trong các bước quan trọng nhất NCS TS ⇒ cần kiên nhẫn và linh hoạt
Dành thời gian hiệu chỉnh câu hỏi NC theo sự phát triển tri thức và kinh nghiệm
Không cứng nhắc: mềm dẻo khi thực tiễn khác biệt so với ban đầu
Câu hỏi NC: cần có tín hiệu về cách thức trả lời
Câu hỏi NC nên theo hướng phân cấp: quản lý được với nghiên cứu và điều tra
Trang 30Ba thành phần Phát triển câu hỏi NC
Nên tiếp cận từ trên xuống: thu hẹp dần để vẫn giữ được
độ quan trọng của các vấn đề nghiên cứu
Trang 31Đánh giá câu hỏi NC
31
Khả thi : Sẵn có về
đầy đủ các chủ thể nghiên cứu,
chuyên môn kỹ thuật,
thời gian và tiền bạc, và phạm vi quản lý được
Thú vị để khảo sát : Tự tin về việc duy trì sự quan tâm tới chủ đề
và duy trì động lực trong nhiều năm,
Mới : Câu trả lời sẽ bác bỏ các phát hiện đã có hoặc đưa ra phát hiện mới
Đạo đức : Theo đuổi và trả lời câu hỏi không vi phạm nguyên lý đạo đức, không tạo các nguy cơ mất an toàn
Xác đáng : Câu hỏi và câu trả lời (trong tương lai) là rất quan trọng: thông báo tri thức khoa học, thực hành công nghiệp, hướng NC
Trang 32Các khái niệm bản chất trong NC HTTT
Trang 33 là biểu diễn trí tuệ được phát triển, thường dựa trên kinh nghiệm
Là cơ chế ngôn ngữ mô tả thuộc tính/đặc trưng chung được gán tới sự vật/hiện tượng
Phân loại
hiện tượng thực: chó - dog, mây - clounds, cơn đau – pain v.v.
hiện tượng ẩn được thỏa thuận: tin cậy - truth, vẻ đẹp - beauty, thành kiến-prejudice, tính hữu dụng - usefulness, giá trị - value, v.v.
Liên kết
Liên kết bằng mệnh đề “propositions”: mối quan hệ phỏng đoán hoặc gợi ý
Ví dụ “Giáo dục làm tăng thu nhập?” Hai KN “ Giáo dục”, “thu nhập”…
Trang 34Mệnh đề ví dụ
34
Giáo dục, thu nhập hai khái niệm
“Mệnh đề” như là “giả thuyết khái niệm” (conceptual hypothesis)
Hai khái niệm “giáo dục”, “thu nhập” trừu tượng có quá nhiều nghĩa
Cần đưa về “giả thuyết vận hành được” (operational hypothesis)
Giáo dục ~ "trình độ học vấn cao" (highested degree earned)
Thu nhập ~ "mức lương hàng năm" (yearly salary)
Đo lường được thông qua “cấu trúc” (construct),
Cấu trúc đơn giản, cấu trúc phức tạp