1. Trang chủ
  2. » Giáo án - Bài giảng

Bài Giảng Nghiên Cứu Khoa Học Bậc Nghiên Cứu Sinh Tiến Sỹ Hệ Thống Thông Tin

47 448 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 47
Dung lượng 3,19 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Vai trò của tài liệu trong QT nghiên cứu4  Kiến thức về miền nghiên cứu và chủ đề quan tâm  Kiến thức về lý thuyết liên quan giúp NCS lên khung được câu hỏi và hiện tượng  Kiến thức v

Trang 1

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

ĐẠI HỌC QUỐC GIA HÀ NỘI

1

Trang 2

Nội dung

1 Quá trình NCKH

2 Lý thuyết hóa

3 Phương pháp nghiên cứu

4 Một số bài học trong tiến hành nghiên cứu

2

Trang 3

1 Quá trình NCKH

3

Trang 4

Vai trò của tài liệu trong QT nghiên cứu

4

 Kiến thức về miền nghiên cứu và chủ đề quan tâm

 Kiến thức về lý thuyết liên quan giúp NCS lên khung được câu hỏi và hiện tượng

 Kiến thức về phương pháp nghiên cứu liên quan được NCS áp dụng để phát triển kiến thức mới, xây dựng các sản phẩm sáng tạo hay tường minh các câu hỏi mới

 Loài người hình thành truyền thống: Tích lũy tri thức bằng cách bổ sung công bố khoa học và kho tri thức NCS công bố bài báo, chương sách, sách

 Sách và bài báo; cập nhật hơn: thông báo các hội nghị quốc tế

 cung cấp cả ba loại kiến thức trên đây

 Cần suốt hành trình nghiên cứu

 NCS cần dành thời gian đáng kể để tìm kiếm, chọn lọc, phân tích tài liệu: Hiểu vững

thân tri thức → đóng góp vào thân tri thức

Trang 5

Vai trò tài liệu

 mức độ mà lý thuyết hiện thời để giải thích được về các đặc thù của hiện tượng hoặc vấn

đề, và tương ứng là chỗ mà chúng còn thiếu hụt

 chiến lược và phương pháp đã được dùng trong quá khứ để nghiên cứu các hiện tượng/vấn đề (hoặc các hiện tượng hoặc các vấn đề liên quan)

 các lý thuyết liên quan được dùng để lên khung cuộc khảo sát

 thân tri thức hiện thời về phương pháp nghiên cứu có sẵn (như, các quy trình và hướng dẫn thực hiện một loại nghiên cứu riêng cho vấn đề cụ thể)

Trang 6

Vai trò tài liệu

6

 phát hiện và hiểu biết sâu một miền bài toán cụ thể

lý thuyết sẵn có và/hoặc được sử dụng để khảo sát các vấn đề/hiện tượng quan tâm

 Tình trạng hiện thời của các phương pháp được làm phù hợp

và áp dụng cho nghiên cứu

 Không phải mọi tài liệu /mọi phần trong tài liệu liên quan là liên quan: đọc, nghĩ về sự liên quan, giải thích về sự liên quan.

 Hầu hết NCS đánh giá thấp sự liên quan của các bài báo khác:

cần theo phương châm “đọc hơi nhiều còn hơn là đọc không đủ”

Trang 7

Đọc-nghĩ-giải thích

7

 Những câu hỏi thu hoạch

 Đóng góp cốt lõi của tài liệu cho thực tế hiện đại của lĩnh vực

nghiên cứu là gì?

 Liên quan gì tới tài liệu khác và thực tế khác ?

 đi theo một khía cạnh lý thuyết/phương pháp có ích để nghiên

cứu hiện tượng riêng được quan tâm ? Và tại sao nó là/không là

một trường hợp?

 Ảnh hưởng ra sao đến suy nghĩ riêng của NCS tới lĩnh vực NC ?

 Suy nghĩ như thế nào về tác động của bài báo tới thân tri thức

trong lĩnh vực tại thời điểm được công bố.

Trang 8

 Tài liệu ngoài miền nghiên cứu

 Phát hiện lý thuyết phổ biến trong các lĩnh vực nghiên cứu khác, bên cạnh miền nghiên cứu cụ thể

 Thấy cách các phương pháp được áp dụng trong lĩnh vực nghiên cứu khác, đặc biệt là về các hướng dẫn và tiêu chuẩn đánh giá có sẵn

 Phát triển một tiếp xúc với cách thức của các học giả khác trong lĩnh vực khác lên khung, kiểm tra, và giải vấn đề thế giới thực, theo nghĩa chung nhất

Trang 9

Kinh nghiệm nhỏ

9

 Hai thông tin cần thiết cơ bản nhất

 Hội nghị/tạp chí hàng đầu thế giới về lĩnh vực NC

 Nhà khoa học hàng đầu thế giới về lĩnh vực, về chủ đề NC riêng (chú ý các NCS)

 Hội nghị thế giới về lĩnh vực chuyên sâu

 Các hiệp hội nghề nghiệp

Association for Computing Machinery - ACM: http://www.acm.org/

Association for Information Systems – AIS: http://aisnet.org/

IEEE-CS: http://www.computer.org/portal/web/guest/home

và các phân hội của các hiệp hội này,

chẳng hạn KDD: http://www.sigkdd.org/index.php , hoặc Process M:

https://www.win.tue.nl/ieeetfpm/doku.php?id=shared:minutes_bpm_2015

 Các bài toán được đặt ra

 Các báo cáo mời

 Các bài báo được giải thưởng

 Ví dụ: KDD 2016 http://www.kdd.org/kdd2016/ (Xem trang sau)

Trang 10

Hội nghị KDD 2016

10

Trang 11

Hội nghị KDD 2016: Các ủy ban

11

Trang 12

Hội nghị KDD 2016: Các ủy ban

12

Trang 13

Hội nghị KDD 2016: Các ủy ban

13

Trang 14

;

http://www.exp-platform.com/Documents/2015-08OnlineControlledExpe rimentsKDDKeynoteNR.pdf

Trang 15

KDD 2014: Keynote Talks Oren Etzioni

15

http://www.informatik.uni-trier.de/~ley/pers/hd/e/Etzioni:Oren.html

Deep learning has catapulted to the front page of the New York Times, formed

the core of the so-called 'Google brain', and achieved impressive results in

vision, speech recognition, and elsewhere Yet researchers have offered simple conundrums that deep learning doesn't address For example, consider the

sentence: 'The large ball crashed right through the table because it was made of Styrofoam.' What was made of Styrofoam? The large ball? Or the table? The

answer is obviously 'the table', but if we change the word 'Styrofoam' to 'steel',

the answer is clearly 'the large ball' To automatically answer this type of

question, our computers require an extensive body of knowledge We believe

that text mining can provide the requisite body of knowledge My talk will

describe work at the new Allen Institute for AI towards building the

next-generation of text-mining systems.

Trang 16

 Những người báo cáo mời tại các hội nghị hàng đầu

 Những người hướng dẫn NCS được các giải thưởng

Lưu ý: Vào trang web của nhà khoa học hoặc các nguồn tra cứu

để loang tới những bài báo cập nhật nhất

Trang 17

Kinh nghiệm nhỏ: Tra cứu tài liệu

 Để tìm công bố của một tác giả trên DBLP

+ Tìm kiếm Google với câu hỏi ““tên_người"+DBLP”

+ Tìm dòng kết quả: dblp: tên_người

+ Vào trang web tương ứng

+ Có thể biết các chủ đề nghiên cứu cập nhật

 Các danh mục ISI : Tạp chí SCI, SCIE (ISI) và Hội nghị

 http://ip-science.thomsonreuters.com/cgi-bin/jrnlst/jlresults.cgi?PC=D

 http://ip-science.thomsonreuters.com/cgi-bin/jrnlst/jlresults.cgi?PC=K

 z/conf_proceedings_citation_index/

 http://www.scimagojr.com/journalrank.php?

category=0&area=0&year=2013&country=&order=sjr&page=0&min=0&mi

n_type=cd&out=xls

Trang 18

http://kdd.org/ : Trang web công đồng DM

Dece mber

5, 2016

Trang 19

http://kdd.org/awards/sigkdd-dissertation-award

Dece mber

5, 2016

Winner: Mining Latent Entity Structures From Massive Unstructured and Interconnected Data Chi Wang (student) and Jiawei Han (advisor) at

University of Illinois at Urbana-Champaign

Runner-up: Modeling Large Social Networks in Context Qirong Ho

(student) and Eric Xing (advisor) at Carnegie Mellon University

Runner-up: Computing Distrust in Social Media Jiliang Tang (Student)

and Huan Liu (Advisor) at Arizona State University Định hướng Khóa

luận đại học K56: Thái Thị Hoài, Nguyễn Quỳnh Nga, Mai Công Đạt

Trang 20

Tài liệu tham khảo

20

 Vai trò của tài liệu tham khảo

 Danh sách tài liệu tham khảo phản ánh tính khoa học và thời sự của báo cáo nghiên cứu (bài báo, luận án)

 “Có một tập TLTK tốt là thành công gần 50%”

 Phân bổ vị trí TLTK trong báo cáo

 Mô tả tài liệu tham khảo

 Trình bày như hướng dẫn của ấn phẩm hoặc tổ chức

 Đầy đủ thông tin: (Các) Tác giả, tên tài liệu, nơi công bố (ấn phẩm, các trang), thời gian công bố

 Tính dễ hiệu chỉnh: đầu tiên đánh theo tên sau đó mới theo số

DBLP là một ví dụ tốt

 Một số sai sót điển hình tại Việt Nam:

 “thừa kế” TLTK: lấy TLTK từ một TLTK khác

 thiếu thông tin: không đầy đủ thông tin

 Trình bày các thành phần trong một TLTK không đúng

 sắp xếp không theo đúng thứ tự quy định (như theo tên tác giả đầu)…

Trang 21

Tài liệu tham khảo

21

 Chỉ dẫn TLTK

 Mọi TLTK phải được chỉ dẫn (tham chiếu) trong nội dung báo cáo

 Mọi chỉ dẫn đều phải có TLTK tương ứng

 Chỉ dẫn tác giả:

1 tác giả A: viết tên tác giả A: “A [.]”

Hai tác giả A, B: viết “A và B [.] “ ( “A and B [.]” tiếng Anh)

Từ ba tác giả trở lên A, B, C : viết “A và cộng sự [.]” (“A et al [.]”)

 Một số TLTK quan trọng, trong lần xuất hiện đầu tiên nên có chỉ dẫn năm, chẳng hạn, như “A và B, 2014 [10]”

Trang 22

Câu hỏi nghiên cứu

22

 Dành riêng để đáp ứng hai thách thức

 Phương pháp và lý thuyết: Khảo sát một cách hệ thống các tài liệu hiện có

 Phát triển câu hỏi nghiên cứu và kế hoạch nghiên cứu

 Có tính cấu trúc cao

 Tập các sách, bài báo liên quan, và các lớp tốt điển hình, hội thảo, và bài giảng (tutorial) Nhấn mạnh luận án TS liên quan

 Tính cấu trúc tốt cho phép NCS nắm vững các phương pháp và lý thuyết liên quan

 Thường là một chương của luận án: literature review

 Làm ít hơn: Không chấp nhận Thuyết bất khả tri miền ứng dụng (domain-agnostic) cho phép nghiên cứu có tính độc lập miền

 Nền tảng tạo năng lực phương pháp NC tốt

Trang 23

Một số vấn đề đặt câu hỏi nghiên cứu

23

 "Phát biểu thang máy"

 Không thể diễn đạt câu hỏi NC nếu không có độc thoại 5 phút “người nghe đã rời khỏi thang máy”

 Lý do: không hoàn toàn hiểu câu hỏi hoặc không thể nói rõ đúng cách

 Câu hỏi NC tốt chỉ khi là câu hỏi ngắn

 Đủ phân biệt với các hiện tượng, vấn đề liên quan khác

 “Cái gì vậy"

 Câu hỏi nghiên cứu không quan trọng cho bất cứ ai: thờ ơ!

 Thu hút: cần được hưởng lợi thực tế từ câu hỏi nghiên cứu

 Vấn đề “cái gì vậy” xảy ra khi NCS khó khăn trong động lực và biện minh câu hỏi nghiên cứu

 “Giải quyết thế giới"

 Câu hỏi thực sự quan trọng song không thể giải được do tài nguyên (chỉ một mình NCS) và/hoặc thời gian (2-3 năm).

 Không tìm được giải pháp với tài nguyên và thời gian cho phép

Trang 24

Một số vấn đề đặt câu hỏi nghiên cứu

24

 “Không giải được"

 Câu hỏi không thể trả lời được đúng nghĩa

 Ví dụ: Nghiên cứu theo chiều dọc: phải trải qua nhiều năm

 “Nhiều"

 Đưa quá nhiều câu hỏi: câu hỏi quá hẹp/quá không thích hợp/quá lớn

 Nên 01/02 câu hỏi

 Một số ví dụ (Danh sách đen)

cho giám đốc điều hành cấp cao bán lẻ”.

Trang 25

Một số hướng dẫn tìm câu hỏi NC tốt

25

 Gợi ý

 một tuyên bố quan trọng xác định hiện tượng được nghiên cứu

 (các) câu hỏi nghiên cứu cung cấp khung tiêu chuẩn mà toàn bộ nghiên cứu Tiến sỹ xoay

quanh và tiến hóa nó (chúng)/

 các câu hỏi nghiên cứu cung cấp khung gới hạn toàn bộ điều tra của NCS và trình diễn nó

trong luận án

 Một số câu hỏi hướng dẫn

 Hãy cho biết các câu hỏi nghiên cứu của lĩnh vực đó là gì ?

 Hãy cho biết thân tri thức của lĩnh vực đó là gì ?

 Những câu hỏi nghiên cứu quan trọng được thiết lập trong lĩnh vực là gì ?

 Những vùng nào cần được tiếp tục khảo sát ?

 Nghiên cứu NCS có lấp được một lỗ trống quan trọng? Nó dẫn đến một hiểu biết nhiều

hơn?

Trang 26

Một số hướng dẫn tìm câu hỏi NC tốt

26

 Một số câu hỏi hướng dẫn (tiếp)

Các nghiên cứu đã được tiến hành trong vùng chủ đề nhiều ra sao?

 Chỉ dẫn từ tác giả kinh điển: “Trong lời tựa Kỷ yếu Hội nghị khoa học thế giới về Tập thô

và Các mô hình hệ thống thông minh mới nổi năm 2007 (The International Conference on Rough Sets and Emerging Intelligent Systems Paradigms: RSEISP 2007) tưởng nhớ GS Zdzislaw Pawlak, Marzena Kryszkiewicz và cộng sự [10] cho biết có hơn 4000 ấn phẩm khoa học về tập thô đã được công bố tới thời điểm đó.”

 Chỉ dẫn từ thống kê mà điển hình từ Google Scholar: “Theo thống kê của Google Scholar

(truy nhập tháng 5/2012), trong giai đoạn 2008-nay, khoảng 970 bài báo có chứa cụm từ

“type-2 fuzzy set” và 44 bài báo chứa cụm từ “Hedge algebra” đã được (trong tổng số toàn bộ 1610/89 bài báo chứa cụm từ “type-2 fuzzy set”/“Hedge algebra”)”

 Nghiên cứu đề xuất đã được thực hiện trước đây ? Liệu có còn chỗ cho sự cải tiến?

 Nghiên cứu nhiều song vẫn thời sự: xu hướng số lượng theo năm

 Chỗ cho cải tiến: lấy từ ý kiến các nhà khoa học uy tín

Trang 27

Một số hướng dẫn tìm câu hỏi NC tốt

27

 Một số câu hỏi hướng dẫn (tiếp)

 Có phù hợp thời gian hay không khi câu hỏi được trả lời?

 Nó là một chủ đề bền vững và quan trọng hay

 nó hiện là chủ đề nóng nhưng là mốt nhất thời nên có nguy cơ trở nên lỗi thời? (phản

chứng)

 Ai sẽ quan tâm đến việc có được một câu trả lời cho câu hỏi?

 Tác động tiềm năng của nghiên cứu được đề xuất là gì?

 Lợi ích của việc trả lời câu hỏi nghiên cứu là gì?

 Nó sẽ trợ giúp ai, và nó sẽ giúp họ như thế nào?

 Nghiên cứu đề xuất có một tác động đáng kể đối với lĩnh vực này hay không?

 Ba thành phần chính khi phát triển câu hỏi NC

 Động lực, Đặc tả phát biểu câu hỏi, Biện luận tường minh

Trang 28

Ba thành phần Phát triển câu hỏi NC

 Một hiện tượng quan trọng cụ thể được cộng đồng nghiên cứu quan tâm

 Động lực không nhất thiết rộng mà cần đề cập 3 khía cạnh trên

 Ví dụ về dãy các trao đổi

Các tổ chức đầu tư vào CNTT mới, hy vọng thu được ích lợi từ các đầu tư này Miền

bài toán: Đầu tư vào CNTT, được hưởng lợi từ CNTT Quan trọng: lượng tiền

Lợi ích như thế không có được nếu nhân viên không dùng CNTT Hiện tượng đặc biệt:

Nhân viên không dùng CNTT

Dẫn tới câu hỏi nghiên cứu Tại sao nhân viên tử chối dùng CNTT? →Bài báo

“Identifying and Testing the Inhibitors of Technology Usage Intentions”

Trang 29

Ba thành phần Phát triển câu hỏi NC

29

 Đặc tả phát biểu bài toán (Specification of Problem Statement)

 Khi có động lực thích hợp ⇒xác định chính xác câu hỏi NC

 Loại câu hỏi NC

 Câu hỏi “ai”, “cái gì”, “ở đâu”: hướng tới các mục tiêu tìm kiếm và khám phá các chủ đề vẫn còn ít tri thức

 Câu hỏi “làm thế nào”, “vì sao”: câu hỏi giải thích, tìm kiếm câu trả lời về cơ chế nhân-quả tới công việc liên quan một hiện tượng cụ thể

 Phát triển câu hỏi NC như một phát biểu bài toán là một trong các bước quan trọng nhất NCS TS ⇒ cần kiên nhẫn và linh hoạt

 Dành thời gian hiệu chỉnh câu hỏi NC theo sự phát triển tri thức và kinh nghiệm

 Không cứng nhắc: mềm dẻo khi thực tiễn khác biệt so với ban đầu

 Câu hỏi NC: cần có tín hiệu về cách thức trả lời

 Câu hỏi NC nên theo hướng phân cấp: quản lý được với nghiên cứu và điều tra

Trang 30

Ba thành phần Phát triển câu hỏi NC

 Nên tiếp cận từ trên xuống: thu hẹp dần để vẫn giữ được

độ quan trọng của các vấn đề nghiên cứu

Trang 31

Đánh giá câu hỏi NC

31

Khả thi : Sẵn có về

 đầy đủ các chủ thể nghiên cứu,

 chuyên môn kỹ thuật,

 thời gian và tiền bạc, và phạm vi quản lý được

Thú vị để khảo sát : Tự tin về việc duy trì sự quan tâm tới chủ đề

và duy trì động lực trong nhiều năm,

Mới : Câu trả lời sẽ bác bỏ các phát hiện đã có hoặc đưa ra phát hiện mới

Đạo đức : Theo đuổi và trả lời câu hỏi không vi phạm nguyên lý đạo đức, không tạo các nguy cơ mất an toàn

Xác đáng : Câu hỏi và câu trả lời (trong tương lai) là rất quan trọng: thông báo tri thức khoa học, thực hành công nghiệp, hướng NC

Trang 32

Các khái niệm bản chất trong NC HTTT

Trang 33

 là biểu diễn trí tuệ được phát triển, thường dựa trên kinh nghiệm

 Là cơ chế ngôn ngữ mô tả thuộc tính/đặc trưng chung được gán tới sự vật/hiện tượng

 Phân loại

hiện tượng thực: chó - dog, mây - clounds, cơn đau – pain v.v.

hiện tượng ẩn được thỏa thuận: tin cậy - truth, vẻ đẹp - beauty, thành kiến-prejudice, tính hữu dụng - usefulness, giá trị - value, v.v.

 Liên kết

Liên kết bằng mệnh đề “propositions”: mối quan hệ phỏng đoán hoặc gợi ý

Ví dụ “Giáo dục làm tăng thu nhập?” Hai KN “ Giáo dục”, “thu nhập”…

Trang 34

Mệnh đề ví dụ

34

 Giáo dục, thu nhập hai khái niệm

“Mệnh đề” như là “giả thuyết khái niệm” (conceptual hypothesis)

 Hai khái niệm “giáo dục”, “thu nhập” trừu tượng có quá nhiều nghĩa

Cần đưa về “giả thuyết vận hành được” (operational hypothesis)

Giáo dục ~ "trình độ học vấn cao" (highested degree earned)

Thu nhập ~ "mức lương hàng năm" (yearly salary)

Đo lường được thông qua “cấu trúc” (construct),

 Cấu trúc đơn giản, cấu trúc phức tạp

Ngày đăng: 05/12/2016, 11:58

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w