1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Bài Giảng Nghiên Cứu Khoa Học Bậc Nghiên Cứu Sinh Tiến Sỹ Hệ Thống Thông Tin

47 540 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 47
Dung lượng 3,19 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Vai trò của tài liệu trong QT nghiên cứu4  Kiến thức về miền nghiên cứu và chủ đề quan tâm  Kiến thức về lý thuyết liên quan giúp NCS lên khung được câu hỏi và hiện tượng  Kiến thức v

Trang 1

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

ĐẠI HỌC QUỐC GIA HÀ NỘI

1

Trang 2

Nội dung

4. Một số bài học trong tiến hành nghiên cứu

2

Trang 3

1 Quá trình NCKH

3

Trang 4

Vai trò của tài liệu trong QT nghiên cứu

4

 Kiến thức về miền nghiên cứu và chủ đề quan tâm

 Kiến thức về lý thuyết liên quan giúp NCS lên khung được câu hỏi và hiện tượng

 Kiến thức về phương pháp nghiên cứu liên quan được NCS áp dụng để phát triển kiến thức mới, xây dựng các sản phẩm sáng tạo hay tường minh các câu hỏi mới ​​

 Loài người hình thành truyền thống: Tích lũy tri thức bằng cách bổ sung công bố khoa học và kho tri thức NCS công bố bài báo, chương sách, sách

 Sách và bài báo; cập nhật hơn: thông báo các hội nghị quốc tế

 cung cấp cả ba loại kiến thức trên đây

 Cần suốt hành trình nghiên cứu

 NCS cần dành thời gian đáng kể để tìm kiếm, chọn lọc, phân tích tài liệu: Hiểu vững

thân tri thức → đóng góp vào thân tri thức

Trang 5

Vai trò tài liệu

 mức độ mà lý thuyết hiện thời để giải thích được về các đặc thù của hiện tượng hoặc vấn đề, và tương ứng là chỗ mà chúng còn thiếu hụt

 chiến lược và phương pháp đã được dùng trong quá khứ để nghiên cứu các hiện tượng/vấn đề (hoặc các hiện tượng hoặc các vấn đề liên quan)

 các lý thuyết liên quan được dùng để lên khung cuộc khảo sát

 thân tri thức hiện thời về phương pháp nghiên cứu có sẵn (như, các quy trình và hướng dẫn thực hiện một loại nghiên cứu riêng cho vấn đề cụ thể)

• Hệ thống tài liệu: tri thức nền tảng quan trọng

Trang 6

Vai trò tài liệu

6

 Hệ thống tài liệu cung cấp

 phát hiện và hiểu biết sâu một miền bài toán cụ thể

lý thuyết sẵn có và/hoặc được sử dụng để khảo sát các vấn đề/hiện tượng quan tâm

và áp dụng cho nghiên cứu

 Quá trình đọc-nghĩ-giải thích

 Không phải mọi tài liệu /mọi phần trong tài liệu liên quan là liên quan: đọc, nghĩ về sự liên quan, giải thích về sự liên quan

cần theo phương châm “đọc hơi nhiều còn hơn là đọc không đủ”

Trang 7

Đọc-nghĩ-giải thích

7

 Những câu hỏi thu hoạch

 Đóng góp cốt lõi của tài liệu cho thực tế hiện đại của lĩnh vực

nghiên cứu là gì?

 Liên quan gì tới tài liệu khác và thực tế khác ?

 đi theo một khía cạnh lý thuyết/phương pháp có ích để nghiên

cứu hiện tượng riêng được quan tâm ? Và tại sao nó là/không là

một trường hợp?

 Ảnh hưởng ra sao đến suy nghĩ riêng của NCS tới lĩnh vực NC ?

 Suy nghĩ như thế nào về tác động của bài báo tới thân tri thức

trong lĩnh vực tại thời điểm được công bố.

Trang 8

 Tài liệu ngoài miền nghiên cứu

 Phát hiện lý thuyết phổ biến trong các lĩnh vực nghiên cứu khác, bên cạnh miền nghiên cứu cụ thể

 Thấy cách các phương pháp được áp dụng trong lĩnh vực nghiên cứu khác, đặc biệt là về các hướng dẫn và tiêu chuẩn đánh giá có sẵn

 Phát triển một tiếp xúc với cách thức của các học giả khác trong lĩnh vực khác lên khung, kiểm tra, và giải vấn đề thế giới thực, theo nghĩa chung nhất

Trang 9

Kinh nghiệm nhỏ

9

 Hai thông tin cần thiết cơ bản nhất

 Hội nghị/tạp chí hàng đầu thế giới về lĩnh vực NC

 Nhà khoa học hàng đầu thế giới về lĩnh vực, về chủ đề NC riêng (chú ý các NCS)

 Hội nghị thế giới về lĩnh vực chuyên sâu

 Các hiệp hội nghề nghiệp

Association for Computing Machinery - ACM: http://www.acm.org/

Association for Information Systems – AIS: http://aisnet.org/

IEEE-CS: http://www.computer.org/portal/web/guest/home

và các phân hội của các hiệp hội này,

chẳng hạn KDD: http://www.sigkdd.org/index.php, hoặc Process M:

https://www.win.tue.nl/ieeetfpm/doku.php?id=shared:minutes_bpm_2015

 Các bài toán được đặt ra

 Các báo cáo mời

 Các bài báo được giải thưởng

 Ví dụ: KDD 2016 http://www.kdd.org/kdd2016/ (Xem trang sau)

Trang 10

Hội nghị KDD 2016

10

Trang 11

Hội nghị KDD 2016: Các ủy ban

11

Trang 12

Hội nghị KDD 2016: Các ủy ban

12

Trang 13

Hội nghị KDD 2016: Các ủy ban

13

Trang 14

; http://www.exp-platform.com/Documents/2015-08OnlineControlledExpe rimentsKDDKeynoteNR.pdf

Trang 15

KDD 2014: Keynote Talks Oren Etzioni

15

http://www.informatik.uni-trier.de/~ley/pers/hd/e/Etzioni:Oren.html

Deep learning has catapulted to the front page of the New York Times, formed

the core of the so-called 'Google brain', and achieved impressive results in

vision, speech recognition, and elsewhere Yet researchers have offered simple conundrums that deep learning doesn't address For example, consider the

sentence: 'The large ball crashed right through the table because it was made of Styrofoam.' What was made of Styrofoam? The large ball? Or the table? The

answer is obviously 'the table', but if we change the word 'Styrofoam' to 'steel',

the answer is clearly 'the large ball' To automatically answer this type of

question, our computers require an extensive body of knowledge We believe

that text mining can provide the requisite body of knowledge My talk will

describe work at the new Allen Institute for AI towards building the

next-generation of text-mining systems.

Trang 16

ACM: http://awards.acm.org/doctoral_dissertation/year.cfm

KDD: http://www.sigkdd.org/2014-doctoral-dissertation-award

cứu được công bố tại các ấn phẩm có uy tín

 Trang web http://www.cs.ucla.edu/~palsberg/h-number.html : một danh sách các nhà khoa học có chỉ số h-index cao (Google Scholar); Không chỉ ra chủ đề nghiên cứu

Lưu ý: Vào trang web của nhà khoa học hoặc các nguồn tra cứu

để loang tới những bài báo cập nhật nhất

Trang 17

Kinh nghiệm nhỏ: Tra cứu tài liệu

 Để tìm công bố của một tác giả trên DBLP

+ Tìm kiếm Google với câu hỏi ““tên_người"+DBLP”

+ Tìm dòng kết quả: dblp: tên_người

+ Vào trang web tương ứng

+ Có thể biết các chủ đề nghiên cứu cập nhật

 Các danh mục ISI : Tạp chí SCI, SCIE (ISI) và Hội nghị

Trang 18

http://kdd.org/ : Trang web công đồng DM

May

11, 2017

Trang 19

http://kdd.org/awards/sigkdd-dissertation-award

May

11, 2017

Winner: Mining Latent Entity Structures From Massive Unstructured and Interconnected Data Chi Wang (student) and Jiawei Han (advisor) at

University of Illinois at Urbana-Champaign

Runner-up: Modeling Large Social Networks in Context Qirong Ho

(student) and Eric Xing (advisor) at Carnegie Mellon University

Runner-up: Computing Distrust in Social Media Jiliang Tang (Student)

and Huan Liu (Advisor) at Arizona State University Định hướng Khóa

luận đại học K56: Thái Thị Hoài, Nguyễn Quỳnh Nga, Mai Công Đạt

Trang 20

Tài liệu tham khảo

20

 Vai trò của tài liệu tham khảo

 Danh sách tài liệu tham khảo phản ánh tính khoa học và thời sự của báo cáo nghiên cứu (bài báo, luận án)

 “Có một tập TLTK tốt là thành công gần 50%”

 Phân bổ vị trí TLTK trong báo cáo

 Mô tả tài liệu tham khảo

 Trình bày như hướng dẫn của ấn phẩm hoặc tổ chức

 Đầy đủ thông tin: (Các) Tác giả, tên tài liệu, nơi công bố (ấn phẩm, các trang), thời gian công bố

 Tính dễ hiệu chỉnh: đầu tiên đánh theo tên sau đó mới theo số

DBLP là một ví dụ tốt

 Một số sai sót điển hình tại Việt Nam:

 “thừa kế” TLTK: lấy TLTK từ một TLTK khác

 thiếu thông tin: không đầy đủ thông tin

 Trình bày các thành phần trong một TLTK không đúng

 sắp xếp không theo đúng thứ tự quy định (như theo tên tác giả đầu)…

Trang 21

Tài liệu tham khảo

21

 Mọi TLTK phải được chỉ dẫn (tham chiếu) trong nội dung báo cáo

 Mọi chỉ dẫn đều phải có TLTK tương ứng

 Chỉ dẫn tác giả:

1 tác giả A: viết tên tác giả A: “A [.]”

Hai tác giả A, B: viết “A và B [.] “ ( “A and B [.]” tiếng Anh)

Từ ba tác giả trở lên A, B, C : viết “A và cộng sự [.]” (“A et al [.]”)

 Một số TLTK quan trọng, trong lần xuất hiện đầu tiên nên có chỉ dẫn năm, chẳng hạn, như “A và B, 2014 [10]”

 Một số sai sót:

 TLTK không được chỉ dẫn: TLTK “vô ích”: một trong những lý do là

“thừa kế” từ TLTK khác.

 chỉ dẫn TLTK không có trong danh sách: lấy một đoạn viết ở một TLTK,

 Chỉ dẫn các tác giả: không theo quy ước trên: từ 2 tác giả trở lên lại chỉ viết tên tác giả đầu tiên

Trang 22

Câu hỏi nghiên cứu

22

 Năm đầu tiên của hành trình NCS

 Dành riêng để đáp ứng hai thách thức

 Phương pháp và lý thuyết: Khảo sát một cách hệ thống các tài liệu hiện có

 Phát triển câu hỏi nghiên cứu và kế hoạch nghiên cứu

 Khảo sát một cách hệ thống các tài liệu

 Có tính cấu trúc cao

 Tập các sách, bài báo liên quan, và các lớp tốt điển hình, hội thảo, và bài giảng (tutorial) Nhấn mạnh luận án TS liên quan

 Tính cấu trúc tốt cho phép NCS nắm vững các phương pháp và lý thuyết liên quan

 Thường là một chương của luận án: literature review.

 Làm ít hơn: Không chấp nhận Thuyết bất khả tri miền ứng dụng (domain-agnostic) cho phép nghiên cứu có tính độc lập miền

 Nền tảng tạo năng lực phương pháp NC tốt.

Trang 23

Một số vấn đề đặt câu hỏi nghiên cứu

23

 "Phát biểu thang máy"

 Không thể diễn đạt câu hỏi NC nếu không có độc thoại 5 phút “người nghe đã rời khỏi thang máy”

 Lý do: không hoàn toàn hiểu câu hỏi hoặc không thể nói rõ đúng cách

 Câu hỏi NC tốt chỉ khi là câu hỏi ngắn

 Đủ phân biệt với các hiện tượng, vấn đề liên quan khác

 “Cái gì vậy"

 Câu hỏi nghiên cứu không quan trọng cho bất cứ ai: thờ ơ!

 Thu hút: cần được hưởng lợi thực tế từ câu hỏi nghiên cứu

 Vấn đề “cái gì vậy” xảy ra khi NCS khó khăn trong động lực và biện minh câu hỏi nghiên cứu

 “Giải quyết thế giới"

 Câu hỏi thực sự quan trọng song không thể giải được do tài nguyên (chỉ một mình NCS) và/hoặc thời gian (2-3 năm).

 Không tìm được giải pháp với tài nguyên và thời gian cho phép

Trang 24

Một số vấn đề đặt câu hỏi nghiên cứu

24

 “Không giải được"

 Lý do logic: Thông tin cần cho giải đáp không thể nhận được một cách logic hoặc hợp lệ

 Lý do khả thi: Tính khả thi với các ràng buộc tài nguyên

 “Nhiều"

 Câu hỏi quá rõ ràng: “Có thách thức khi dùng CNTT ?”

 Câu hỏi không liên quan: “tác động thời tiết tới mức lương của chuyên viên HTTT ?“ Chẳng hề liên quan !

 Câu hỏi vô lý: “Trái đất phẳng?” Mọi người đều phản đối !

 Câu hỏi định nghĩa: “xung đột công nghệ đặc trưng bởi sự bất đồng?”

 Câu hỏi khẳng định: “một công cụ hỗ trợ quyết định có thể được phát triển để tạo điều kiện ra quyết định

cho giám đốc điều hành cấp cao bán lẻ”.

Trang 25

Một số hướng dẫn tìm câu hỏi NC tốt

25

 Gợi ý

 một tuyên bố quan trọng xác định hiện tượng được nghiên cứu

 (các) câu hỏi nghiên cứu cung cấp khung tiêu chuẩn mà toàn bộ nghiên cứu Tiến sỹ xoay

quanh và tiến hóa nó (chúng)/

 các câu hỏi nghiên cứu cung cấp khung gới hạn toàn bộ điều tra của NCS và trình diễn nó

trong luận án

 Một số câu hỏi hướng dẫn

 Hãy cho biết các câu hỏi nghiên cứu của lĩnh vực đó là gì ?

 Hãy cho biết thân tri thức của lĩnh vực đó là gì ?

 Những câu hỏi nghiên cứu quan trọng được thiết lập trong lĩnh vực là gì ?

 Những vùng nào cần được tiếp tục khảo sát ?

 Nghiên cứu NCS có lấp được một lỗ trống quan trọng? Nó dẫn đến một hiểu biết nhiều

hơn?

Trang 26

Một số hướng dẫn tìm câu hỏi NC tốt

26

Các nghiên cứu đã được tiến hành trong vùng chủ đề nhiều ra sao?

 Chỉ dẫn từ tác giả kinh điển: “Trong lời tựa Kỷ yếu Hội nghị khoa học thế giới về Tập thô và Các

mô hình hệ thống thông minh mới nổi năm 2007 (The International Conference on Rough Sets and Emerging Intelligent Systems Paradigms: RSEISP 2007) tưởng nhớ GS Zdzislaw Pawlak, Marzena Kryszkiewicz và cộng sự [10] cho biết có hơn 4000 ấn phẩm khoa học về tập thô đã được công bố tới thời điểm đó.”

 Chỉ dẫn từ thống kê mà điển hình từ Google Scholar: “Theo thống kê của Google Scholar (truy

nhập tháng 5/2012), trong giai đoạn 2008-nay, khoảng 970 bài báo có chứa cụm từ “type-2 fuzzy set” và 44 bài báo chứa cụm từ “Hedge algebra” đã được (trong tổng số toàn bộ 1610/89 bài báo chứa cụm từ “type-2 fuzzy set”/“Hedge algebra”)”

 Nghiên cứu đề xuất đã được thực hiện trước đây ? Liệu có còn chỗ cho sự cải tiến?

 Nghiên cứu nhiều song vẫn thời sự: xu hướng số lượng theo năm

 Chỗ cho cải tiến: lấy từ ý kiến các nhà khoa học uy tín

Trang 27

Một số hướng dẫn tìm câu hỏi NC tốt

27

 Một số câu hỏi hướng dẫn (tiếp)

 Có phù hợp thời gian hay không khi câu hỏi được trả lời?

 Nó là một chủ đề bền vững và quan trọng hay

 nó hiện là chủ đề nóng nhưng là mốt nhất thời nên có nguy cơ trở nên lỗi thời? (phản

chứng)

 Ai sẽ quan tâm đến việc có được một câu trả lời cho câu hỏi?

 Tác động tiềm năng của nghiên cứu được đề xuất là gì?

 Lợi ích của việc trả lời câu hỏi nghiên cứu là gì?

 Nó sẽ trợ giúp ai, và nó sẽ giúp họ như thế nào?

 Nghiên cứu đề xuất có một tác động đáng kể đối với lĩnh vực này hay không?

 Ba thành phần chính khi phát triển câu hỏi NC

 Động lực, Đặc tả phát biểu câu hỏi, Biện luận tường minh

Trang 28

Ba thành phần Phát triển câu hỏi NC

 Một hiện tượng quan trọng cụ thể được cộng đồng nghiên cứu quan tâm

 Động lực không nhất thiết rộng mà cần đề cập 3 khía cạnh trên

 Ví dụ về dãy các trao đổi

Các tổ chức đầu tư vào CNTT mới, hy vọng thu được ích lợi từ các đầu tư này Miền

bài toán: Đầu tư vào CNTT, được hưởng lợi từ CNTT Quan trọng: lượng tiền

Lợi ích như thế không có được nếu nhân viên không dùng CNTT Hiện tượng đặc

biệt: Nhân viên không dùng CNTT.

Dẫn tới câu hỏi nghiên cứu Tại sao nhân viên tử chối dùng CNTT? → Bài báo

“Identifying and Testing the Inhibitors of Technology Usage Intentions”

Trang 29

Ba thành phần Phát triển câu hỏi NC

29

 Đặc tả phát biểu bài toán (Specification of Problem Statement)

còn ít tri thức

công việc liên quan một hiện tượng cụ thể

Trang 30

Ba thành phần Phát triển câu hỏi NC

độ quan trọng của các vấn đề nghiên cứu

Trang 31

Đánh giá câu hỏi NC

31

 Tiêu chí đánh giá câu hỏi NC tốt

Khả thi: Sẵn có về

 thời gian và tiền bạc, và phạm vi quản lý được

Thú vị để khảo sát: Tự tin về việc duy trì sự quan tâm tới chủ đề

và duy trì động lực trong nhiều năm,

Mới: Câu trả lời sẽ bác bỏ các phát hiện đã có hoặc đưa ra phát hiện mới

Đạo đức: Theo đuổi và trả lời câu hỏi không vi phạm nguyên lý đạo đức, không tạo các nguy cơ mất an toàn

Xác đáng: Câu hỏi và câu trả lời (trong tương lai) là rất quan trọng: thông báo tri thức khoa học, thực hành công nghiệp, hướng NC

Trang 32

Các khái niệm bản chất trong NC HTTT

Trang 33

 là biểu diễn trí tuệ được phát triển, thường dựa trên kinh nghiệm

 Là cơ chế ngôn ngữ mô tả thuộc tính/đặc trưng chung được gán tới sự vật/hiện tượng

hiện tượng thực: chó - dog, mây - clounds, cơn đau – pain v.v.

hiện tượng ẩn được thỏa thuận: tin cậy - truth, vẻ đẹp - beauty, thành kiến-prejudice, tính hữu dụng - usefulness, giá trị - value, v.v.

Liên kết bằng mệnh đề “propositions”: mối quan hệ phỏng đoán hoặc gợi ý

Ví dụ “Giáo dục làm tăng thu nhập?” Hai KN “ Giáo dục”, “thu nhập”…

Trang 34

Mệnh đề ví dụ

34

 Giáo dục, thu nhập hai khái niệm

“Mệnh đề” như là “giả thuyết khái niệm” (conceptual hypothesis)

 Hai khái niệm “giáo dục”, “thu nhập” trừu tượng có quá nhiều nghĩa

Cần đưa về “giả thuyết vận hành được” (operational hypothesis)

Giáo dục ~ "trình độ học vấn cao" (highested degree earned)

Thu nhập ~ "mức lương hàng năm" (yearly salary)

Đo lường được thông qua “cấu trúc” (construct),

 Cấu trúc đơn giản, cấu trúc phức tạp

Trang 35

Thiết kế nghiên cứu

35

 TKNC: “đưa ra một kế hoạch hành động để trả lời các câu hỏi”

 Câu hỏi “tốt“: có gợi ý về các khóa học thích hợp nhất để nghiên cứu

 Ba kiểu thiết kê NC: Thăm dò, quy nạp, và suy diễn

 Observation

 Thăm dò những điều gặp phải theo kinh nghiệm chung

 Hiểu điều thăm dò được bằng “phát hiện thứ tự nào đó một cách hệ thống trong chúng”

 nghiên cứu khảo sát hoặc NC mô tả

 Chính xác, đáng tin cậy và độc lập,

 Đạt hiểu biết ban đầu của một hiện tượng trong bối cảnh của nó

 Tạo các ý tưởng về hiện tượng hay các mối quan hệ với các hiện tượng khác, do đó dẫn đến

việc xây dựng các mệnh đề.

Ngày đăng: 11/05/2017, 14:25

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w