TRẦN NGỌC PHÚC PHÂN TÍCH CHỈ SỐ TÀI CHÍNH ĐỂ PHÁT HIỆN GIAN LẬN, SAI SÓT TRONG BÁO CÁO TÀI CHÍNH CỦA CÁC DOANH NGHIỆP NIÊM YẾT TRÊN LUẬN VĂN THẠC SĨ KINH TẾ TP.HCM NĂM 2013... Người v
Trang 1TRẦN NGỌC PHÚC
PHÂN TÍCH CHỈ SỐ TÀI CHÍNH
ĐỂ PHÁT HIỆN GIAN LẬN, SAI SÓT TRONG BÁO CÁO TÀI CHÍNH CỦA CÁC DOANH NGHIỆP NIÊM YẾT TRÊN
LUẬN VĂN THẠC SĨ KINH TẾ
TP.HCM NĂM 2013
Trang 2TRẦN NGỌC PHÚC
PHÂN TÍCH CHỈ SỐ TÀI CHÍNH
ÐỂ PHÁT HIỆN GIAN LẬN, SAI SÓT TRONG BÁO CÁO TÀI CHÍNH CỦA CÁC DOANH NGHIỆP NIÊM YẾT TRÊN THỊ TRUỜNG CHỨNG KHOÁN VIỆT NAM
Chuyên ngành: Kế toán
Mã số: 62.34.30.01
LUẬN VĂN THẠC SĨ KINH TẾ
NGUỜI HUỚNG DẪN KHOA HỌC: PGS.TS NGUYỄN VIỆT
TP.HCM NĂM 2013
Trang 3LỜI CAM ĐOAN
DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT
DANH MỤC CÁC BẢNG BIỂU
MỤC LỤC
PHẦN MỞ ĐẦU 1
1 Tính cấp thiết của đề tài: 1
2 Mục tiêu nghiên cứu: 3
3 Đối tượng và phạm vi nghiên cứu: 4
4 Phương pháp nghiên cứu: 4
5 Khả năng ứng dụng (tính thực tế) của đề tài: 5
6 Kết cấu đề tài: 5
CHƯƠNG I: GIAN LẬN BÁO CÁO TÀI CHÍNH VÀ KHAI PHÁ DỮ LIỆU TRÊN TỶ SỐ TÀI CHÍNH 6
1.1 Gian lận và tỷ số tài chính: 6
1.1.1 Các phương pháp gian lận phổ biến: 6
1.1.2 Tỷ số tài chính và ý nghĩa: 12
1.1.3 Công cụ mới nhằm hoàn thiện quy trình kiểm toán đối với gian lận, sai sót: 15 1.1.4 Xác định tỷ số tài chính phát hiện gian lận sai sót trong BCTC: 16
1.2 Phân loại lĩnh vực doanh nghiệp niêm yết: 19
1.3 Các công trình nghiên cứu về sử dụng tỷ số tài chính để phát hiện gian lận sai sót trong BCTC: 22
1.4 Kỹ thuật khai phá dữ liệu: 26
1.4.1 Khai phá dữ liệu (Data mining) là gì? 26
1.4.2 Quá trình khai phá dữ liệu: 27
1.4.3 Công cụ khai phá dữ liệu: 29
1.4.4 Phương pháp khai phá dữ liệu: 29
1.4.5 Tóm tắt về khai phá dữ liệu - vai trò và ý nghĩa: 34
Kết luận chương 1: 36
Trang 4CHÍNH CỦA CÁC DOANH NGHIỆP NIÊM YẾT TẠI VIỆT NAM : 37
2.1 Thực trạng gian lận và sai sót trên BCTC tại các công ty niêm yết: 37
2.1.1 Các phương pháp gian lận trên BCTC tại các công ty niêm yết ở Việt Nam thường gặp: 37
2.1.2 Thực trạng sử dụng chỉ số tài chính/thực hiện thủ tục phân tích trong các công ty kiểm toán: 42
2.2 Sử dụng kỹ thuật khai phá dữ liệu để phát hiện gian lận trong trình bày báo cáo tài chính: 43
2.2.1 Môi trường thực nghiệm: 43
2.2.1.1 Lựa chọn công cụ hỗ trợ cho khai phá dữ liệu: 44
2.2.1.2 Tiền xử lý dữ liệu: 45
2.2.1.3 Mô hình hóa công việc: 48
2.2.2 Tính hữu ích khi sử dụng tỷ số tài chính phân tích BCTC gian lận: 49
2.2.2.1 Sử dụng mô hình Bayesian Network: 49
2.2.2.2 Sử dụng mô hình cây quyết định 51
2.2.2.3 Sử dụng mô hình Multilayer Perceptron 60
2.2.3 Áp dụng các luật phân lớp tìm được để phân lớp báo cáo tài chính mới: 64
Kết luận chương 2: 67
CHƯƠNG III: GIẢI PHÁP NÂNG CAO TÍNH HỮU ÍCH KHI VẬN DỤNG TỶ SỐ TÀI CHÍNH ĐỂ PHÁT HIỆN GIAN LẬN, SAI SÓT TRONG BCTC 69
3.1 Giải pháp nâng cao tính hữu ích khi vận dụng tỷ số tài chính để phát hiện gian lận, sai sót trong BCTC:: 69
3.1.1 Tăng cường, bổ sung công cụ cho các thủ tục kiểm toán tiêu chuẩn truyền thống: 69
3.1.2 Sử dụng hiệu quả nguồn cơ sở dữ liệu ngày càng nhiều để cạnh tranh: 70
3.1.3 Ứng dụng khoa học công nghệ, nâng cao trình độ kiểm toán viên: 72
3.1.4 Khai phá dữ liệu hỗ trợ thêm cho dịch vụ, ngành nghề mới: 74
3.1.5 Nghiên cứu về khả năng dự báo gian lận: 76
Trang 53.2 Hiệu đính, bổ sung và hướng dẫn chi tiết các chuẩn mực kiểm toán: 79
3.2.1 Nâng cao trách nhiệm của kiểm toán viên: 79
3.2.2 Ban hành hướng dẫn chi tiết về thủ tục phân tích: 81
3.2.3 Khai thác dữ liệu – sự cần thiết một khung pháp lý: 84
3.3 Hạn chế và đề xuất nghiên cứu sâu hơn: 85
3.3.1 Hoàn thiện mẫu dữ liệu: 85
3.3.2 Phân tích các biến số (tỷ số tài chính và phi tài chính): 87
3.3.3 Sự “vận dụng ngược”: 89
3.3.4 Nâng cao kiến thức phần mềm và lý thuyết về kiểm toán gian lận: 91
KẾT LUẬN 94
TÀI LIỆU THAM KHẢO Tài liệu tiếng Việt Tài liệu tiếng Anh Phụ lục Bảng P.1dữ liệu sử dụng mô hình khai phá dữ liệu với Weka trong đề tài .i
Bảng P.2 Kết quả của mô hình học máy cây quyết định J4.8 ngành công nghiệp ii
Bảng P.3: Kết quả của mô hình học máy cây quyết định J4.8 ngành CNTT iiv
Bảng P.4: Kết quả của mô hình học máy cây quyết định J4.8 ngành DVTD iv
Bảng P.5: Kết quả của mô hình học máy cây quyết định J4.8 ngành HTD v
Bảng P.6: Kết quả của mô hình học máy cây quyết định J4.8 ngành năng lượng vii
Bảng P.7: Kết quả của mô hình học máy cây quyết định J4.8 ngành NVL viii
Bảng P.8: Kết quả của mô hình học máy cây quyết định J4.8 ngành Y tế ix
Kết quả của luật kết hợp xi
Bảng câu hỏi khảo sát xviii
Bảng tổng hợp kết quả khảo sát xxii
Trang 6PHẦN MỞ ĐẦU
1 Tính cấp thiết của đề tài:
Báo cáo tài chính (BCTC) là một công cụ nhằm duy trì tính minh bạch trong các hoạt động kinh doanh, là một bộ phận bắt buộc phải công khai đối với công ty niêm yết và công ty đại chúng
Tầm quan trọng của báo cáo tài chính đối với người quản lý, nhà đầu tư, nhà cung cấp, ngân hàng hay bất kỳ bên tham gia thị trường vốn nào là quá rõ Tuy nhiên, một vấn đề tồn tại từ lâu trên thế giới cũng như Việt Nam, đó là các Báo cáo tài chính công bố có những gian lận, sai sót, đây là một vấn đề nghiêm trọng của xã hội và ảnh hưởng lớn tới nền kinh tế Nhiều trường hợp gian lận báo cáo tài chính đã làm suy yếu niềm tin vào các thị trường vốn của Việt Nam cũng như thế giới Đặc biệt là hàng loạt các công ty hàng đầu trên thế giới bị phá sản hoặc bị đẩy đến bờ vực phá sản do các bê bối kế toán, gian lận trong công bố thông tin trên Báo cáo tài chính trong thời gian gần đây như: AIG, BusinessWeek, Lucent, Xerox, Rite Aid, Waste Management, Micro Strategy, Raytheon, Sunbeam, Enron, Worldcom, Global Crossing, Adelphia, Qwest, Satyam (Ấn Độ)
Gian lận luôn là một nguy cơ lớn đối với các doanh nghiệp trên toàn thế giới Không có cách nào để dự đoán những người sẽ gian lận Hơn nữa, vì gian lận là hành vi cố ý che dấu bởi các thủ thuật thông minh và tinh vi nên nó thường rất khó phát hiện trong một thời gian Gian lận làm tiêu tốn rất nhiều chi phí của xã hội Theo thống kê của Hiệp hội kiểm tra chứng nhận gian lận (ACFE) trong năm 2009-
2010, các tổ chức mất trung bình 5% doanh thu vì gian lận Và trong đó gian lận báo cáo tài chính là loại gian lận chiếm chi phí cao nhất (86,3% trên tổng chi phí của gian lận trong năm 2010 theo ACFE) Cuộc khảo sát gian lận toàn cầu lần thứ 11 của Ernst&Young tiến hành cũng trong thời gian này đã phát hiện rằng, về tổng thể, các gian lận trọng yếu trong 2 năm đã tăng lên 3% (16% trả lời có gian lận năm 2009, số liệu này của năm 2008 là 13%)
Trang 7Tại Việt Nam, Công ty Bông Bạch Tuyết (BBT), Công ty Cổ phần Dược Viễn Đông (DVD) có thể không phải là những trường hợp duy nhất thiếu minh bạch dẫn đến thiệt hại cho nhà đầu tư
Trong mùa công bố BCTC năm 2011, tính đến đầu tháng 04/2012 thì đã có đến khoản 8% doanh nghiệp niêm yết trên Sở giao dịch chứng khoán TP.HCM có sai lệch với báo cáo kiểm toán Cùng với tình hình kinh tế khó khăn, khủng hoảng, tình trạng sai lệch này diễn ra ngày càng đáng quan ngại Việc phát sinh gian lận trên Báo cáo tài chính ở những công ty có tầm vóc lớn đã làm phát sinh sự quan tâm ngày càng nhiều về tính trung thực, hợp lý của Báo cáo tài chính, thậm chí gây nghi ngờ về chất lượng báo cáo kiểm toán Nó cũng là thách thức lớn đối với người quản
lý công ty cũng như đối với kiểm toán viên Do đó, gian lận luôn là chủ đề được nhiều nhà nghiên cứu và nhiều nghề nghiệp khác nhau quan tâm
Tính trung thực trong báo cáo tài chính có ý nghĩa đặc biệt quan trọng nên các nước trên thế giới đều có những động thái tích cực như là ban hành các đạo luật nhằm thắt chặt công việc của kiểm toán, các luật bảo vệ nhà đầu tư để ngăn chặn
gian lận và sai sót trên báo cáo tài chính (Đạo luật Sarbanes-Oxley)
Kiểm toán được đòi hỏi yêu cầu và nhiệm vụ cao hơn khi mà càng ngày càng có nhiều bằng chứng cho thấy sổ sách kế toán bị “xào nấu” được áp dụng rộng rãi
Từ lâu đã có nhiều nghiên cứu trên thế giới về việc sử dụng chỉ số tài chính để phát hiện gian lận trên báo cáo tài chính Thực sự việc này có hữu ích hay không khi
áp dụng vào Việt Nam? Gần đây các nghiên cứu tập trung vào việc kiểm tra sự hữu dụng của việc thống kê và các thuật toán khác nhau trên máy tính, ví dụ như thống
kê hồi quy và mạng nơ-ron chống giả mạo (artificial neural networks) để tăng cường phát hiện gian lận BCTC Các phương pháp này dựa trên nền tảng là chỉ số tài chính Chỉ số tài chính vốn dĩ được sử dụng để phân tích vào nhiều khía cạnh khác nhau,
và khá quan trọng (chiếm 33% trong tổng tính điểm xếp hạng tín nhiệm) khi thực hiện xếp hạng tín dụng doanh nghiệp của Ngân hàng nhà nước, ảnh hưởng rất lớn tới chất lượng tín dụng của hệ thống ngân hàng, quyết định đầu tư của các nhà đầu tư và
Trang 8nhà phân tích chứng khoán, quyết định của doanh nghiệp có nên phá sản sớm để không gây tác động tiêu cực đến nền kinh tế - đặc biệt là trong điều kiện nền kinh tế bất ổn (lạm phát và chi phí vay) như hiện nay
Báo cáo tài chính gian lận có thể khó để phát hiện nhưng không phải là không thể,
vì vậy việc hoàn thiện các tiêu chuẩn để phát hiện gian lận, sai sót trong báo cáo tài chính là một yêu cầu cấp thiết, đặc biệt là ở các doanh nghiệp niêm yết Các công ty kiểm toán của Việt Nam đa phần là các công ty nhỏ, năng lực nhân sự và việc sử dụng phần mềm có hạn chế Các nghiên cứu này nếu hữu hiệu để áp dụng trong thị trường niêm yết ở Việt Nam sẽ giúp ích rất nhiều cho kiểm toán
Tuy nhiên bản thân người viết nhận thấy việc phân tích trên có nên phụ thuộc quá nhiều vào các chỉ số này và có còn chính xác không khi mà thời gian gần đây, gian lận trong báo cáo tài chính ngày càng bị phát hiện nhiều; và ảnh hưởng như thế nào nếu sử dụng chính những chỉ số này để phát hiện gian lận, sai sót trong các báo cáo tài chính
Người viết mong muốn áp dụng các phương pháp đã được thực nghiệm trong các nghiên cứu trên thế giới vào thị trường Việt Nam – mà tập trung vào các doanh nghiệp niêm yết – để xem tính hữu ích khi áp dụng, từ đó phát hiện những kinh nghiệm và bài học cho việc phân tích chỉ số tài chính để phát hiện gian lận, sai sót trong BCTC nhằm nâng cao hiệu quả của chất lượng Báo cáo kiểm toán
2 Mục tiêu nghiên cứu:
Trên phương diện nghiên cứu, khai phá dữ liệu và ứng dụng của nó vào lĩnh vực kinh tế và kiểm toán vẫn còn là một nội dung chưa được quan tâm nhiều Trong nghiên cứu này, tác giả tập trung nghiên cứu đánh giá việc ứng dụng khai phá dữ liệu sử dụng chỉ số tài chính để phát hiện gian lận trong Báo cáo tài chính Cụ thể hơn, luận văn sẽ giải quyết các mục tiêu nghiên cứu sau:
cáo tài chính
Trang 92 Lựa chọn mô hình, phương pháp khai phá dữ liệu phù hợp trong phát hiện gian lận Báo cáo tài chính
phát hiện gian lận sai sót trong báo cáo tài chính trên thị trường chứng khoán ở Việt Nam
Giới thiệu, áp dụng và đánh giá việc sử dụng các phương pháp khai thác dữ liệu, mục đích là từ đó sẽ đóng góp cho các nghiên cứu liên quan đến việc phát hiện quản
dữ liệu báo cáo tài chính công bố công khai
3 Đối tượng và phạm vi nghiên cứu:
Đối tượng nghiên cứu: Các chỉ số tài chính được kiểm toán viên và các nhà nghiên cứu sử dụng để phát hiện gian lận trong BCTC và các phương pháp khai thác
dữ liệu (Data Mining)
Phạm vi nghiên cứu: mẫu bao gồm các chỉ số tài chính thu được từ 202 BCTC (nghĩa là Bảng cân đối và báo cáo kết quả hoạt động kinh doanh) của các công ty niêm yết trên thị trường Việt Nam từ năm 2009 đến năm 2011 Các công ty này được phân thành 8 lĩnh vực công nghiệp chủ yếu trong nền kinh tế
4 Phương pháp nghiên cứu:
+ Câu hỏi nghiên cứu:
Quan điểm và bằng chứng thực nghiệm trong việc ứng dụng khai phá dữ liệu trong phát hiện gian lận trong Báo cáo tài chính?
Khả năng ứng dụng khai phá dữ liệu trong phát hiện gian lận, sai sót trong BCTC trneen thị trường chứng khoán Việt Nam?
Tỷ số tài chính nào hữu ích khi dùng để phát hiện gian lận trong BCTC trên thị trường chứng khoán Việt Nam?
Phân tích, khai phá dữ liệu như thế nào thì hữu hiệu nhất để phát hiện BCTC có gian lận?
+ Các phương pháp thực hiện:
Trang 10Để giải quyết các nội dung nghiên cứu nêu trên, tác giả đã sử dụng phương pháp định tính như khảo sát thực tiễn và phỏng vấn trực tiếp các kiểm toán viên hành nghề, kế toán nhằm đánh giá thực trạng và thu thập thông tin phục vụ nghiên cứu Đồng thời tác giả sử dụng phương pháp định lượng dựa trên sử dụng Data mining với các kỹ thuật khai thác dữ liệu được thử nghiệm ứng dụng để phát hiện gian lận quản lý: cây quyết định, Neural Networks và Bayesian Belief Networks để có được những kết quả tài chính các mô hình Việc triển khai quá trình ứng dụng Data mining trong phát hiện gian lận trong BCTC trên thị trường chứng khoán Việt Nam được dựa trên quy trình đề xuất 6 bước của nhà nghiên cứu R Gupta Ngoài ra quá trình thử nghiệm Data mining được thực hiện dựa trên phần mềm hỗ trợ xử lý dữ liệu Weka 3.7
5 Khả năng ứng dụng (tính thực tế) của đề tài:
Có thể ứng dụng hướng đến việc áp dụng Data mining trong kiểm toán: quá trình
mô hình hóa dữ liệu để phát hiện gian lận trong báo cáo tài chính bằng thống kê (statistical), máy học (machine learning), mạng nơ ron (neural network) để suy diễn
về các độ tương quan khi có gian lận trong báo cáo tài chính xảy ra
Kết quả này là nền tảng để giúp phát triển các công cụ để giúp việc kiểm toán hiệu quả hơn Ngoài ra, kết luận của luận văn cũng giúp các nhà nghiên cứu, chính phủ xây dựng chuẩn mực kiểm toán phù hợp
6 Kết cấu đề tài:
Chương 1: Gian lận Báo cáo tài chính và khai phá dữ liệu trên tỷ số tài chính:
dữ liệu để phát hiện gian lận trên các báo cáo tài chính của các doanh nghiệp niêm yết tại Việt Nam:
Chương 3: Giải pháp nâng cao tính hữu ích khi vận dụng chỉ số tài chính để phát hiện gian lận, sai sót trong BCTC
Ngoài ra luận văn còn đính kèm thêm một số phụ lục
Trang 11CHƯƠNG I: GIAN LẬN BÁO CÁO TÀI CHÍNH VÀ KHAI PHÁ DỮ LIỆU TRÊN TỶ SỐ TÀI CHÍNH
1.1 Gian lận và tỷ số tài chính:
Việc yêu cầu tính toán tỷ số tài chính là bắt buộc khi lập Báo cáo tài chính ở Việt Nam Một vài nghiên cứu trước đây nói rằng tỷ số này là “vô dụng” trong việc xác định gian lận báo cáo tài chính [Kathleen et al (2004)], trong khi một số người thì nói ngược lại [Spathis (2002), Persons (1995)] Những xung đột trong nghiên cứu này cho thấy cuộc tranh luận vẫn còn Bài viết này nhằm xem xét liệu các tỷ lệ tài chính hiện nay có thể phát hiện gian lận khi áp dụng vào Việt Nam Nếu nghiên cứu xác nhận điều này đúng thì việc sử dụng các tỷ số khuyến cáo trong nghiên cứu này
sẽ có ích cho Kiểm toán viên, Chính phủ và các bên quan tâm khác
1.1.1 Các phương pháp gian lận phổ biến:
SAS 99 phân loại các sai sót liên quan đến gian lận thành hai loại: một là các gian lận liên quan đến báo cáo tài chính, hai là các gian lận liên quan đến việc biển thủ tài sản
Trong chuẩn mực kiểm toán VN số 240 “ Gian lận và sai sót”, gian lận và sai sót được định nghĩa trong đoạn 4 như sau : Gian lận là những hành vi cố ý làm sai lệch thông tin kinh tế, tài chính do một hay nhiều người trong Hội đồng quản trị, BGĐ, các nhân viên hoặc bên thứ ba thực hiện làm ảnh hưởng đến BCTC Gian lận có thể được biểu hiện dưới các hình thức tổng quát sau :
- Xuyên tạc, làm giả chứng từ, tài liệu liên quan đến BCTC
- Sửa đổi chứng từ, tài liệu kế toán làm sai lệch BCTC
- Biển thủ tài sản
- Che dấu hoặc cố ý bỏ sót các thông tin, tài liệu hoặc nghiệp vụ kinh tế làm sai lệch BCTC
- Ghi chép các nghiệp vụ kinh tế không đúng sự thật
- Cố ý áp dụng sai các chuẩn mực, nguyên tắc, phương pháp và chế độ kế toán, chính sách tài chính
- Cố ý tính toán sai về số học
Trang 12Sai sót là những lỗi không cố ý làm ảnh hưởng đến BCTC như:
- Lỗi về tính toán số học hoặc ghi chép sai
- Bỏ sót hoặc hiểu sai, ghi chép sai các khoản mục, các nghiệp vụ kinh tế
- Áp dụng sai các chuẩn mực, nguyên tắc, phương pháp và chế độ kế toán, chính sách tài chính nhưng không cố ý
Trong chuẩn mực kế toán VN số 29 về “Thay đổi các chính sách kế toán, ước tính kế toán và các sai sót”, khái niệm về sai sót được trình bày trong đoạn 22 của chuẩn mực “sai sót có thể phát sinh từ việc ghi nhận, xác định giá trị, trình bày và thuyết minh các khoản mục trên BCTC BCTC được coi là không phù hợp với chuẩn mực kế toán và chế độ kế toán nếu có các sai sót trọng yếu hoặc các sai sót không trọng yếu nhưng cố ý trình bày tình hình tài chính, kết quả hoạt động kinh doanh hay các luồng tiền theo một hướng khác” Như vậy, sai sót là hành vi vi phạm không phải do cố ý nhưng có thể gây thiệt hại cho người sử dụng BCTC nếu
đó là sai sót trọng yếu
Theo chuẩn mực kiểm toán Việt Nam mới (được áp dụng từ ngày 01/01/2013), việc xem xét rủi ro gian lận trước hết thuộc về trách nhiệm của ban quản trị và ban giám đốc đơn vị được kiểm toán Đối với trách nhiệm của kiểm toán viên, kiểm toán viên phải đạt được sự đảm bảo hợp lý về việc có những sai sót trọng yếu do gian lận hoặc nhầm lẫn hay không, xét trên phương diện tổng thể
Với những mục đích khác nhau, không ít các công ty dùng các thủ thuật gian lận trên báo cáo tài chính Ví dụ như là để phát hành thêm cổ phiếu mới, để đủ điều kiện niêm yết cổ phiếu tại Sở Giao dịch/ Trung tâm giao dịch, để thu hút các nhà đầu tư, để làm cho giá cổ phiếu tăng, nhiều công ty đã “che dấu” những thua lỗ trong kinh doanh Để trốn thuế và các khoản phải nộp cho Ngân sách Nhà nước, một số công ty đã che giấu lợi nhuận
Vào năm 1996, ACFE đã tiến hành môt cuộc khảo sát trên phạm vi toàn Hoa Kỳ với mục đích tìm ra nguyên nhân, ảnh hưởng, cách thức thực hiện gian lận Tổ chức này đã khảo sát trên 10.000 trường hợp các doanh nghiệp cho là có gian lận Mặc dù cuộc khảo sát chưa được hoàn chỉnh nhưng đây là cuộc khảo sát có quy mô lớn nhất
Trang 13từ trước đến nay trong lĩnh vực về gian lận Căn cứ vào kết quả phân tích, năm 1996
ACFE đã cho ra đời Báo cáo về gian lận và sự lạm dụng trên toàn quốc - “Report to
Nation on Occupational Fraud and Abuse” Đến cuối năm 2001 đầu năm 2002,
ACFE tiếp tục triển khai một cuộc khảo sát mới với quy mô nhỏ hơn, chỉ tiến hành
trên 663 trường hợp nhưng lại tập trung nghiên cứu các vấn đề như gian lận được
thực hiện như thế nào, và các phương pháp ngăn ngừa gian lận Sau đó cứ mỗi hai
năm, ACFE tiếp tục khảo sát nghiên cứu và thống kê Từ báo cáo của ACFE cho
thấy có 3 loại hành vi gian lận là gian lận BCTC (khoảng 10% trở xuống), tham ô
(khoảng 30%) và biển thủ tài sản (xấp xỉ 90%), và mặc dù luôn chiếm tỷ lệ thấp qua
các năm nhưng tổn thất của loại gian lận BCTC gây ra lại lớn nhất Năm 2010, quy
mô khảo sát của ACFE được mở rộng ra các quốc gia trên toàn thế giới Thật thú vị,
ở Hoa Kỳ, thiệt hại trung bình cho tất cả ba loại gian lận đáng chú ý đều nhỏ hơn
trong năm 2010 so với năm 2008
Bảng1.1: Tổng hợp kết quả cuộc nghiên cứu của ACFE từ 2004-2012:
% gian lận
Thiệt hại (USD)
% gian lận
Thiệt hại (USD)
% gian lận
Thiệt hại (USD)
% gian lận
Thiệt hại (USD)
Thiệt hại (18 tỷ USD) Biển
thủ 92.7% 93.000 91,5% 150.000 88,7% 150.000 86,3% 135.000 86% 120.000 20,7% Tham ô 30,1% 250.000 30,8% 538.000 26,9% 375.000 32,8% 250.000 33,4% 250.000 11,3% Gian
lận trên
BCTC
7,9% 1.000.000 10,6% 2.000.000 10,3% 2.000.000 4,8% 4.100.000 7,6% 1.000.000 68%
(Tổng tỷ lệ phần trăm trong bảng xếp hạng này vượt quá 100% vì một số trường
hợp có liên quan đến nhiều hơn một loại gian lận)
Kết quả nghiên cứu về gian lận theo công trình nghiên cứu của ACFE
Có ba loại gian lận như sau:
- Biển thủ tài sản: Xảy ra khi nhân viên biển thủ tài sản của tổ chức (ví dụ điển
hình là biển thủ tiền, đánh cắp hàng tồn kho, gian lận về tiền lương)
Trang 14- Tham ô: Xảy ra khi người quản lý lợi dụng trách nhiệm và quyền hạn của họ tham ô tài sản của công ty hay hành động trái ngược với các nghĩa vụ họ đã cam kết với tổ chức để làm lợi cho bản thân hay một bên thứ ba
- Gian lận trên Báo cáo tài chính: Là trường hợp các thông tin trên Báo cáo tài chính bị bóp méo, phản ảnh không trung thực tình hình tài chính một cách cố ý nhằm lừa gạt người sử dụng thông tin
Kết quả nghiên cứu của ACFE cho thấy, trong các trường hợp khảo sát, gian lận liên quan đến tài sản tuy chiếm khoảng 90% trường hợp nhưng mức thiệt hại cho nền kinh tế là thấp nhất Trong khi đó, các gian lận trên Báo cáo tài chính, tuy chiếm tỷ lệ thấp nhất nhưng hậu quả gây ra cho nền kinh tế là lớn nhất
Biểu đồ 1.1: Tổn thất do các gian lận gây ra
Ước tính của 1.843 chuyên gia chống gian lận rằng trung bình mỗi tổ chức mất 5% doanh thu của nó vào gian lận Tuy nhiên con số này chỉ là ước tính mà không dựa trên bất kỳ dữ liệu cụ thể hoặc quan sát thực tế, do không có cách nào để tính toán chính xác thiệt hại của gian lận trên toàn cầu, tuy nhiên ước tính của các chuyên gia chống gian lận được xem là tốt nhất và tiên phong mà chúng ta có thể tin cậy
Trang 15Tổ chức phi lợi
nhuận
2008 2010
Biểu đồ 1.2: Tổn thất do gian lận gây ra phân theo khu vực doanh nghiệp
(Nguồn: ACFE (2010) Report to the Nation on occupational Fraud & abuse)
Dù công trình nghiên cứu về gian lận của ACFE đã đưa ra những số liệu thống kê
về những thiệt hại của việc gian lận trên Báo cáo tài chính bị phát hiện, tuy nhiên,
họ vẫn cho rằng khó mà xác định được thiệt hại thực sự bởi lẽ không phải tất cả những gian lận đều bị phát hiện và không phải tất cả các gian lận được phát hiện đều được báo cáo và không phải tất cả gian lận đã báo cáo đều bị khởi tố theo đúng pháp luật Bên cạnh đó, những công trình nghiên cứu trên chỉ thống kê thiệt hại về kinh tế trực tiếp do gian lận trên Báo cáo tài chính, trong khi còn rất nhiều thiệt hại
vô hình không thể biểu hiện bằng con số cụ thể ví dụ như chi phí kiện tụng, phí bảo hiểm, sự sụt giảm niềm tin và tác động xấu đến thị trường chứng khoán
Điều đó càng cho thấy mục tiêu phải phát hiện được gian lận trên báo cáo tài chính nhanh chóng, đáng tin cậy và với chi phí thấp là rất quan trọng
Một trong những đóng góp rất lớn của ACFE là việc thống kê các phương pháp thực hiện gian lận phổ biến trên Báo cáo tài chính Dưới đây là thống kê các loại gian lận phổ biến trên BCTC
Trang 16Biểu đồ 1.3: Các cách thức gian lận trên BCTC theo ACFE:
Từ góc độ kế toán, doanh thu, lợi nhuận, hoặc các tài sản thường phóng đại, trong khi tổn thất, chi phí, hoặc nợ phải trả thường bị bớt đi Phóng đại doanh thu, lợi nhuận, hoặc các tài sản nhằm mô tả tài chính công ty mạnh hơn Giảm bớt tổn thất, chi phí, và trách nhiệm pháp lý để mô tả sự gia tăng giá trị tài sản và vốn chủ
sở hữu Giảm bớt doanh thu hoặc phóng đại chi phí chỉ khi các công ty, những người quản lý muốn giảm nghĩa vụ thuế của họ Và từ các trường hợp gian lận được biết thì doanh thu không được công nhận, bao gồm cả doanh thu hư cấu và sự khác biệt thời gian, chiếm khoảng một nửa trong số tất cả các gian lận báo cáo tài chính Mặc dù không có trường hợp gian lận nào là hoàn toàn giống như nhau, nhưng tựu chung lại sẽ có các loại gian lận nêu trên, từ đó có thể xác định được một phần các tỷ số tài chính nào cần quan tâm khi phân tích
Tài liệu ngoài
Tham ô Biển thủ tài sản Gian lận trên BCTC
Đánh giá sai tài sản
Doanh thu không có thật
Che giấu chi phí, công nợ
Công bố không đầy đủ
Khai khống
doanh thu, tài sản
Sai thời khóa
Khai thiếu
doanh thu, tài sản
Tài liệu nội bộ
Phân công phân nhiệm
Gian lận
Trang 17ty cho một năm tài chính sẽ có ý nghĩa khi được so sánh với (1) chỉ số năm trước để kiểm tra xu hướng, (2) với tiêu chuẩn ngành, và (3) là với các công ty cạnh tranh
Đó là một công cụ cho phép các chủ ngân hàng hoặc người cho vay xem xét các yếu tố sau của người đi vay (doanh nghiệp) trước khi cho vay nhằm đảm bảo an toàn và an ninh cho các khoản vay của họ1:
Chúng là công cụ quan trọng để phân tích tài chính nhằm thẩm định giá trị thực
sự của doanh nghiệp, hiệu quả hoạt động của doanh nghiệp đó trong một khoảng thời gian và khả năng mà nó phá sản, giải thích của báo cáo tài chính dựa vào mối liên hệ liên giữa các tỷ số tài chính khác nhau Đặc biệt trong cơ chế thị trường hiện nay, PTTC phát triển nhanh chóng do nhiều nguyên nhân: nhu cầu quản lý doanh nghiệp và tập đoàn tăng lên, sự phát triển của tập đoàn tài chính, các hoạt động về tái cơ cấu vốn, sự thành lập các tập đoàn quốc gia và đa quốc gia…
Trong các kỹ thuật phân tích tài chính ở Việt Nam hiện nay, kỹ thuật phân tích tỉ
số tài chính được sử dụng nhiều nhất Tuy không là nguồn thông tin mang tính quyết định, nhưng vẫn là kỹ thuật phân tích căn bản và quan trọng nhất, kỹ thuật
1
RK Mohanty-Ratio analysic
Trang 18này dựa vào các tỷ số tài chính để đo lường, đánh giá tình hình và hoạt động tài chính của công ty Có 2 cách phân loại tỉ số tài chính:
Dựa vào cách thức sử dụng số liệu:
- Tỷ số tài chính xác định từ bảng cân đối kế toán: Tỷ suất đầu tư tổng quát,
Tỷ suất tự tài trợ, Hệ số hao mòn, Hệ số cơ cấu nợ, Tốc độ tăng trưởng vốn, Tỷ
lệ nợ, Tỷ lệ vốn chủ sở hữu, Tỷ suất nguồn vốn thường xuyên, Tỷ lệ thanh toán
nợ ngắn hạn
- Tỷ số tài chính xác định từ báo cáo kết quả hoạt động kinh doanh: Tỷ số chi trả cổ tức
- Tỷ số tài chính xác định từ cả hai báo cáo vừa nêu
- Tỷ số tài chính xác định từ báo cáo lưu chuyển tiền tệ: Tỷ số hoạt động , Tỷ
số đầu tư, Tỷ trọng lưu chuyển tiền từ hoạt động kinh doanh chính
Dựa vào mục tiêu phân tích: khả năng thanh khoản, cơ cấu tài chính (quản lý nợ),
tỉ số hoạt động (quản lý tài sản), hiệu quả sinh lời, Tỷ số tăng trưởng, tỉ số giá thị trường, Mô hình Dupoint và hệ số rủi ro Z’score
Từ 1988, Viện kế toán công chứng công Hoa Kỳ (AICPA) đã ban hành Chuẩn mực kiểm toán SAS số 56 quy định về sử dụng thủ tục phân tích dữ liệu trong quy trình kiểm toán để phát hiện ra các mối quan hệ bất thường, ví dụ, các giao dịch bất thường cụ thể hoặc sự kiện, thay đổi kế toán, kinh doanh thay đổi, biến động ngẫu nhiên, hoặc sai sót trọng yếu [Đoạn 2]
Năm 2009, Chuẩn mực kiểm toán quốc tế IAS 520 “Thủ tục phân tích” (vừa được chỉnh sửa) đưa ra hướng dẫn cụ thể sử dụng thủ tục phân tích trong cả ba giai đoạn của cuộc kiểm toán: lập kế hoạch, kiểm tra, đánh giá tổng thể AICPA cũng đã cung cấp ấn phẩm hướng dẫn thực tế và các ví dụ minh họa cho việc áp dụng các thủ tục phân tích
Chuẩn mực kiểm toán Việt Nam ban hành dựa theo hệ thống chuẩn mực quốc tế, cũng đã ban hành chuẩn mực VAS số 520 (ban hành ngày 29/12/2000 dựa theo IAS
520 cũ), trình bày rõ “quy trình phân tích trong kiểm toán BCTC là việc phân tích các số liệu, thông tin, các tỷ suất quan trọng, qua đó tìm ra những xu hướng, biến
Trang 19động và tìm ra những mối quan hệ có mâu thuẫn với các thông tin khác hoặc có sự chênh lệch lớn so với giá trị đã dự kiến” Trình tự phân tích của KTV trong giai đoạn làm quen với hoạt động của doanh nghiệp thường bao gồm các động tác sau:
- So sánh số liệu hiện hành với số liệu của kỳ trước;
- So sánh số liệu thực hiện với số liệu kế hoạch hoặc dự đoán;
- So sánh số liệu thực hiện với số định mức (hoặc tiêu chuẩn tối ưu);
- So sánh số liệu thực tế với số bình quân chung hoặc bình quân của ngành Như vậy, thủ tục phân tích chỉ sử dụng để đánh giá sự hợp lý chứ không sử dụng
để đánh giá sự chính xác của các chỉ tiêu Mục đích của việc áp dụng trình tự phân tích như trên là xác định những hiện tượng bất thường trong hoạt động và trong báo cáo của doanh nghiệp Như vậy, nếu như việc xem xét đánh giá tổng quát trước tình hình tài chính của doanh nghiệp được tổ chức đúng đắn thì sẽ làm giảm độ sai sót của KTV trong quá trình kiểm toán
Thủ tục phân tích không những không dừng lại ở việc giúp kiểm toán viên tìm hiểu tình hình của khách hàng mà còn dùng để phát hiện ra những số liệu có khả năng bị sai lệch Thủ tục này giúp tìm kiếm và phát hiện các gian lận sai sót trọng yếu trong BCTC thông qua việc phân tích các thông tin tài chính và thông tin phi tài chính
Ngoài ra, phân tích tài chính cũng đã trở thành một trong các dịch vụ chủ yếu của KTV và các công ty kiểm toán, dịch vụ này chiếm tỷ trọng ngày càng tăng trong tổng doanh thu của các công ty kiểm toán và PTTC chính là một trong các công cụ
hỗ trợ đắc lực nhất cho lĩnh vực kiểm toán
Năm nay (2012), từ kết quả của dự án Clarity, phiên bản hướng dẫn của AICPA đầy đủ hơn, có kết hợp các chuẩn mực kiểm toán quốc tế mới vào tất cả các nội dung hướng dẫn, do đó, kiểm toán viên cần phải hiểu rõ về các chuẩn mực kiểm toán Nghiên cứu trường hợp minh họa việc sử dụng các thủ tục phân tích trong việc lập kế hoạch và kiểm tra nội dung, sử dụng phân tích xu hướng, phân tích tỷ lệ, kiểm tra tính hợp lý, và phân tích hồi quy Các phụ lục bao gồm một loạt các ví dụ
Trang 20về các tỷ số tài chính và so sánh các chìa khóa quan trọng của các tiêu chuẩn đánh giá rủi ro Tuy nhiên phải sau 15/12/2012 thì chuẩn mực mới này mới có hiệu lực
1.1.3 Công cụ mới để phát hiện gian lận nhằm hoàn thiện quy trình kiểm toán BCTC:
Khả năng của kiểm toán viên trong việc phát hiện một gian lận phụ thuộc vào các yếu tố như sự khéo léo của thủ phạm, tần số và mức độ của các thao tác, mức độ thông đồng, số lượng cá nhân và thâm niên tham gia trong việc gian lận
Nhân tố chính để phân biệt giữa gian lận và sai sót là sự cố tình hay vô ý Vì vậy khả năng xét đoán là yếu tố then chốt trong việc phát hiện các gian lận tiềm ẩn và các Chuẩn Mực Kiểm toán chung được thừa nhận GAAS (Generally Accepted Auditing Standards) đưa ra những hướng dẫn cụ thể trong việc phát hiện gian lận Trong những năm gần đây, khối lượng và sự phức tạp của các giao dịch kế toán trong các tổ chức lớn đã tăng lên đáng kể Để kiểm toán các tổ chức như vậy, kiểm toán viên phải thường xuyên đối phó với các dữ liệu đồ sộ với cấu trúc dữ liệu khá phức tạp Do đó, kiểm toán viên không thể chỉ dựa vào báo cáo hoặc các công cụ truyền thống trong quá trình kiểm toán Thay vào đó, các công cụ bổ sung, chẳng hạn như kỹ thuật khai thác dữ liệu có thể tự động lấy thông tin từ một số lượng lớn các dữ liệu để phân tích lại được chứng minh là rất hữu ích trên các nghiên cứu trên thế giới về khả năng phát hiện gian lận hay ít nhất là phát hiện các sai sót trọng yếu – là một minh chứng hỗ trợ cho khả năng xét đoán của kiểm toán viên
Thống kê và phương pháp khai thác dữ liệu đã được áp dụng thành công để phát hiện những hoạt động như rửa tiền, thương mại điện tử, thẻ tín dụng lừa đảo, gian lận viễn thông, gian lận bảo hiểm, và xâm nhập máy tính, v.v… Các thuật toán khai thác dữ liệu cũng đã được nghiên cứu phát triển cho phép để trích xuất những kiến thức có liên quan từ một số lượng lớn các dữ liệu như báo cáo gian lận tài chính để phát hiện gian lận báo cáo tài chính (K Fanning and K.Cogger, 1998)
Mặc dù áp dụng các kỹ thuật khai thác dữ liệu trong quá trình kiểm toán là một lĩnh vực tương đối mới, khai thác dữ liệu đã được chứng minh là hiệu quả về chi phí trong các ứng dụng liên quan đến kiểm toán như phát hiện gian lận, kế toán điều tra
Trang 211.1.4 Những tỷ số tài chính được sử dụng để xác định phát hiện gian lận sai sót trong BCTC:
Việc chuẩn bị một cơ sở dữ liệu để thực hiện khai phá đóng một vai trò tiên phong quan trọng Tuy nhiên vấn đề then chốt là phải xác định được các trường phân tích – chính là các chỉ số tài chính, nhằm đưa ra kết luận cụ thể và hiệu quả nhất, làm sáng tỏ khả năng ứng dụng thực tế to lớn đồng thời với những thách thức đối với kỹ thuật phát hiện tri thức và khai phá dữ liệu trong bài toán phát hiện gian lận trên BCTC
Hội đồng liên hiệp tín dụng Thế Giới (WOCCU) cuối những năm 1980 dựa trên kinh nghiệm tăng cường và hiện đại hóa lĩnh vực tín dụng đã đề ra PEARLS PEARLS là một tập hợp các chỉ tiêu tài chính thường được sử dụng trong phân tích hoặc các chỉ số tiêu chuẩn hóa thuật ngữ giữa các tổ chức Tổng cộng, có 44 chỉ tiêu định lượng tài chính tạo điều kiện thuận lợi cho một phân tích toàn thể các điều kiện tài chính của bất kỳ tổ chức tài chính nào Mỗi chỉ số có một tiêu chuẩn bảo đảm an toàn hoặc mục tiêu liên quan Ngoại trừ một số chỉ số sử dụng chuyên biệt cho các
tổ chức tài chính, tác giả đã sử dụng một số chỉ số để phân tích
Theo các nghiên cứu trước đây cho thấy một số tài khoản trên báo cáo tài chính
có nhiều khả năng là đối tượng bị thao túng bởi người quản lý Những tài khoản này bao gồm doanh thu, tài khoản phải thu, các tài khoản dự phòng và hàng tồn kho (Schilit 1993; Green 1991; Loebbecke et al 1989; Wright and Ashton 1989; Hylas and Ashton 1982) Bản chất chủ quan của sự đánh giá liên quan đến các tài khoản này làm khó khăn hơn trong việc kiểm toán
Các gian lận của hoạt động ghi chép doanh số bán hàng trước khi nó được thu được có thể hiển thị như là một tài khoản phải thu bổ sung (Green 1991; Daroca and Holder 1985) đã thử nghiệm bằng cách so sánh tài khoản và tỷ lệ các khoản phải thu với doanh thu và (Stice 1991) so sánh các khoản phải thu với tổng tài sản
Họ thấy có một mối tương quan tự nhiên giữa các khoản phải thu chiếm tỷ lệ cao tổng tài sản và các khoản phải thu trên doanh thu bán hàng
Trang 22Persons (1995), Spellmire et al (1993), Schilit (1993), Crain (1992), Stice (1991), và Simunic (1980) cũng cho rằng người quản lý có thể thao tác trên hàng tồn kho Công ty có thể có sự không phù hợp trong phân bổ giữa chi phí tương ứng với doanh thu hàng bán (COGS) Điều này làm tăng tổng lợi nhuận, thu nhập ròng
và củng cố bảng cân đối kế toán Một loại thao túng khác liên quan đến quá trình báo cáo hàng tồn kho là ghi hàng tồn kho thấp hơn chi phí hoặc giá cả thị trường Công ty có thể chọn không ghi số tiền đúng của hàng tồn kho lỗi thời Vì vậy, các nhà nghiên cứu này đã kiểm tra liệu các công ty với Báo cáo tài chính có gian lận có nhiều khả năng để cho tỷ lệ hàng tồn kho trên tổng tài sản cao lên, ảnh hưởng đến giá vốn và lợi nhuận Họ cũng điều tra liệu các công ty phát hành FFS có thể có tỷ lệ lợi nhuận cao hơn tổng tỷ lệ phần trăm so với nhóm có kiểm soát Một khoản mục nữa là cơ cấu nợ cao cũng có thể làm tăng khả năng của FFS, nhất là kể
từ khi thay đổi người quản lý các khoản nợ Người quản lý có thể thao tác các báo cáo tài chính theo nhu cầu của họ để đáp ứng giao ước nợ Điều này cho thấy rằng mức độ nợ cao có thể làm tăng xác suất của FFS
Phân tích xu hướng đã thành công trong việc tìm kiếm các bất thường vật chất và các lỗi (Blocker 1993; Green 1991; McKee 1989; Knechel 1986; Blocher and Willingham 1985) Kiểm toán viên và các nhà phân tích thường sử dụng một ngưỡng là một sự thay đổi 10% cho một sự thay đổi vật chất trong tài khoản hoặc tỷ
lệ (Green 1991; Loebbecke and Steinbart 1987; Kinney 1987) K Fanning and K.Cogger (1998) ghi nhận biến có khả năng bất thường nếu các tài khoản phải thu hoặc tổng lợi nhuận của công ty có tỷ lệ phần trăm chênh lệch vượt quá 110% của giá trị năm trước Những kết quả này củng cố tầm quan trọng của việc sử dụng tỷ lệ
và phân tích xu hướng như các thủ tục phân tích
Từ các khoản mục trên có thể thấy các tỷ lệ tài khoản phải thu / doanh thu, tài khoản phải thu / tổng tài sản, hàng tồn kho / doanh số bán hàng, hàng tồn kho / tổng tài sản, tài sản ròng nhà máy và thiết bị / tổng tài sản, nợ / vốn chủ sở hữu, nợ phải thu/ nợ phải trả, doanh thu / tổng tài sản, lợi nhuận/ tổng tài sản có thể là các tỷ lệ thống kê có ý nghĩa đáng kể Ngoài ra còn các tỷ số tiềm năng để phát hiện các báo
Trang 23cáo tài chính gian lận như: Tỷ số Dòng tiền từ hoạt động / Tổng nợ, Tỷ số Dòng
Từ các công trình nghiên cứu trên đây, tác giả sử dụng các tài liệu tham khảo này
để làm cơ sở cho nghiên cứu và phân tích về các phương pháp phát hiện gian lận trên báo cáo tài chính hay về mối quan hệ của quản trị, kiểm toán viên và gian lận dựa vào hệ thống tỷ số bao gồm các nhóm tỷ số sau:
KHẢ NĂNG THANH KHOẢN
hạn)
QACL
2
Michael J Cerullo and M Virginia Cerullo -2006-Using Neural Network Software as a Forensic Accounting Tool- Information Systems Control Journal, www.isaca.org
Trang 24Nhóm tỷ số: Viết tắt:
22 Tỷ số sinh lời trên vốn dài hạn (=Tổng EBIT/ Tổng tài sản – Tổng Nợ
ngắn hạn)
ROCE
24 Tỷ số tăng trưởng bền vững (=Lợi nhuận giữ lại (lợi nhuận sau thuế -
cổ tức + LNCPP đầu kỳ)/ Vốn chủ sở hữu)
REINV
25 Tỷ số tăng trưởng khoản phải thu (=Khoản phải thu/ Khoản phải thu 2
năm liên tiếp)
RETREND
26 Tỷ số Tăng trưởng doanh thu (=Doanh thu trung bình kỳ này - Doanh
thu trung bình kỳ trước đã điều chỉnh/ Doanh thu trung bình kỳ trước
đã điều chỉnh)
B3
27 Tỷ số tăng trưởng lợi nhuận (=LNST trung bình kỳ này - LNST trung
bình kỳ trước đã điều chỉnh/ LNST trung bình kỳ trước đã điều chỉnh)
GMTREND
(Bảng 1.2: Tỷ số tài chính sử dụng để khai phá dữ liệu dùng phần mềm Weka)
Một số tỷ số tài chính trên được chỉ ra là hữu ích khi dùng để phát hiện gian lận trên BCTC ở các thị trường đã có nghiên cứu Trong nghiên cứu này, tác giả sẽ sử dụng lại toàn bộ các tỷ số tài chính trên để xét tính hữu ích trên thị trường niêm yết tại Việt Nam
1.2 Phân loại lĩnh vực doanh nghiệp niêm yết:
Theo các nghiên cứu từ thực tiễn trước đây, các ảnh hưởng của nền kinh tế đến mỗi ngành nghề, lĩnh vực gây những tác động khác nhau Mỗi lĩnh vực ngành nghề khác nhau cũng có những đặc điểm riêng, dẫn đến gian lận xảy ra ở mỗi lĩnh vực ngành nghề cũng khác nhau
ACFE đánh giá rủi ro và xác định khả năng gian lận xảy ra dựa trên văn hóa doanh nghiệp và đặc điểm ngành công nghiệp, hai điều này ảnh hưởng đáng kể đến
Trang 25khả năng gian lận xảy ra Các phương pháp đề xuất không thể đảm bảo phát hiện tất
cả 100% gian lận Tuy nhiên, nó cung cấp một lợi thế hơn các mô hình nguy cơ truyền thống vì nó tập trung vào những nguyên nhân cơ bản cho gian lận, nên hỗ trợ kiểm toán viên trong cả phòng ngừa và phát hiện gian lận bằng cách xác định các dấu hiệu cảnh báo sớm
Đối với các ngành nghề khác nhau, các hình thức gian lận báo cáo tài chính thường gặp cũng khác nhau Ví dụ như trong ngành ngân hàng thủ thuật hay được
sử dụng là phân loại sai các khoản vay theo mức độ rủi ro nhằm giảm chi phí dự phòng và tăng thu nhập từ tiền lãi Thủ thuật thứ hai là không lập hoặc lập dự phòng không đủ cho các khoản đầu tư chứng khoán, đặc biệt là chứng khoán trên thị trường tự do và những khoản đầu tư dài hạn vào các công ty Một thủ thuật nữa là bán những khoản đầu tư cho các bên liên quan với giá cao hơn giá thị trường nhằm đạt chỉ tiêu lợi nhuận
Đối với các công ty sản xuất, gian lận báo cáo tài chính phổ biến là đẩy chi phí sản xuất vào sản phẩm dở dang nhằm tăng giá trị hàng tồn kho, giảm giá vốn hàng bán và tăng lợi nhuận; lập dự phòng không đầy đủ đối với hàng hỏng và hàng chậm luân chuyển; kéo dài thời gian khấu hao của tài sản cố định Chia tách công ty để tăng giá trị tài sản thông qua việc đánh giá lại tài sản theo giá trị thị trường cũng là một cách gian lận
Đối với doanh nghiệp bán lẻ, hình thức gian lận thường gặp là không lập đủ dự phòng cho hàng chậm luân chuyển và lỗi thời; không ghi nhận các khoản chiết khấu
Hệ thống ngành kinh tế của Việt Nam (Ban hành kèm theo Quyết định số 10/2007/QĐ-TTg ngày 23 tháng 01 năm 2007 của Thủ tướng Chính phủ) phân loại thành 21 ngành nghề (bao gồm tất cả các ngành kinh tế, hành chính, hoạt động Đảng, trợ giúp xã hội,…) Theo Hệ thống ngành này: các doanh nghiệp đang niêm yết trên sàn xếp vào 47 mã ngành cấp 2 và 69 mã ngành cấp 3 Hệ thống mã ngành cấp 1 cũng dựa trên tiêu chuẩn ngành toàn cầu Và nhằm mục đích đơn giản, tác giả
3
Lê Minh Thủy - Công ty Tư vấn Tài chính Capstone - Nỗi niềm mùa báo cáo tài chính – nhipcaudautu.com
Trang 26sử dụng cách phân loại của Industry Classification Benchmark – Tiêu chuẩn phân
loại ngành toàn cầu (ICB) được phát triển bởi Dow Jones và FTSE Nó được sử
dụng để phân loại thị trường vào các lĩnh vực trong kinh tế vĩ mô ICB sử dụng một
hệ thống 10 ngành công nghiệp (industry), phân chia thành 20 chuyên ngành, được
chia thành 41 lĩnh vực, sau đó chứa 114 tiểu ngành Hệ thống này tương tự như
Global Industry Classification Standard (GICS) được phát triển bởi Morgan Stanley
Capital International (MSCI) và Standard & Poor's vào năm 1999
Bảng 1.3: 10 nhóm ngành theo phân loại của hai tổ chức trên bao gồm:
Tiểu ngành
Dầu & Gas –
Oil & Gas
Năng lượng - Energy
bao gồm các công ty thăm dò, khai thác hoặc dịch vụ chế biến, vận tải các sản phẩm dầu khí, than đá, nhiên liệu chất đốt
Vật liệu cơ bản -
Basic Materials
Nguyên vật liệu – Meterials
đây là một nhóm ngành rộng bao gồm các công
ty hoá chất, vật liệu xây dựng, kính, giấy, lâm sản; các công ty khai mỏ và luyện kim; các cty sản xuất các sản phẩm bao bì đóng gói (gồm cả bao bì giấy, kim loại, thuỷ tinh)
Công nghiệp -
Industrials
Công nghiệp – Industrials
gồm các cty chế tạo các loại máy móc, công cụ
cơ khí, thiết bị điện, nhà thầu xây dựng và các dịch vụ giao thông vận tải, thương mại và dịch
vụ công nghiệp, giao thông vận tải
Dịch vụ tiêu dùng -
Consumer Services
Tiêu dùng cao cấp
- Consumer Discretionary
bao gồm các công ty mà sản phẩm và dịch vụ không phải là nhu cầu thiết yếu: xe ô tô, quần áo cao cấp, nhà hàng, khách sạn, và các mặt hàng
xa xỉ, dịch vụ tiêu dùng, phương tiện truyền thông, bán lẻ
Hàng tiêu dùng -
Consumer Goods
Hàng tiêu dùng - Consumer Staples
bao gồm các công ty sản xuất và phân phối lương thực, thực phẩm, nước giải khát và bánh kẹo, thuốc lá và đồ uống có cồn, đồ gỗ và các sản phẩm gia dụng, hệ thống bán lẻ
Y tế - Dược –
Health Care
Y tế - Dược – Health Care
bao gồm các cty cung cấp các dịch vụ, thiết bị chăm sóc sức khoẻ và các công ty nghiên cứu, phát triển sản xuất dược phẩm và các sản phẩm công nghệ sinh học
Công nghệ -
Technology
Công nghệ thông tin - Information
bao gồm các công ty nghiên cứu và sản xuất phần mềm cùng các dịch vụ liên quan: dịch vụ
Trang 27(ICB) (GICS)
Tiểu ngành
văn phòng, thiết bị viễn thông và các công ty sản xuất các thiết bị công nghệ phần cứng, chất bán dẫn và thiết bị bán dẫn
Tài chính - BĐS
Financials
Tài chính - BĐS – Financials
gồm các ngân hàng thương mại, cty bảo hiểm, công ty đầu tư tài chính, bất động sản, công ty chứng khoán và chứng chỉ quỹ
Viễn thông -
Telecommunicatio
ns
Viễn thông - Telecommunicatio
ns Services
gồm các công ty cung cấp các dịch vụ viễn thông như: dịch vụ viễn thông cố định, không dây, băng thông rộng
Điện nước –
Utilities
Điện nước – Utilities
gồm các công ty sản xuất và phân phối điện năng, các cty quản lý hệ thống nước, gas sinh hoạt
Tùy vào môi trường kinh tế trong năm mà mỗi ngành sẽ có mối đe dọa về gian lận khác nhau Theo khảo sát của Deloitte, khảo sát 2100 chuyên gia, 56%số người được hỏi cho rằng báo cáo tài chính năm 2010 và năm 2011 sẽ có gian lận nhiều hơn ba năm trước cộng lại vì suy thoái kinh tế Và 50% chuyên gia được hỏi cho rằng ngành tài chính sẽ có sự gia tăng và có gian lận nhiều nhất, tiếp theo đó là công nghệ, viễn thông (14%), hàng tiêu dùng (12%), y dược (10%) và công nghiệp (6%) – mặc dù trước đây ngành công nghiệp sản xuất luôn bị xem là ngành xảy ra nhiều gian lận nhất
1.3 Các công trình nghiên cứu về sử dụng tỷ số tài chính để phát hiện gian lận sai sót trong BCTC:
Nghiên cứu về sử dụng tỷ số tài chính phát hiện gian lận sai sót đã được làm từ lâu trên thế giới Từ những năm 1980, Kinney (1979), Coglitore et al.(1988) đã triển khai trên các tình huống thực tế thực hiện thủ tục phân tích (analytical procedures) đơn giản, định lượng bao gồm cả phân tích tỷ lệ để đánh giá biến động báo cáo tài chính thường được tìm thấy là do nguyên nhân nào
Trong một nghiên cứu về giấy tờ làm việc của KTV do R.E.Hylas và R.H.Ashton trong cuốn “Audit Detection of Finacial Statement Errors” thực hiện vào năm 1982
Trang 28đã chỉ ra bằng 281 sai phạm được yêu cầu điều chỉnh trong BCTC của 152 công ty thì có tới 27.1% sai sót được phát hiện khi sử dụng thủ tục phân tích
Mô hình để phát hiện gian lận quản lý lần đầu tiên được trình bày trong Loebbecke và Willingham (1988) và tiếp tục phát triển trong Loebbecke et al (1989), mô hình này cố gắng để cung cấp một quy trình phân tích để phát hiện các nguy cơ gian lận quản lý Loebbecke et al.(1987) lại mô phỏng dữ liệu khi tác giả cấy sai lệch vào báo cáo tài chính của các doanh nghiệp thực tế rồi áp dụng lại quy trình phân tích để đánh giá khả năng phát hiện sai lệch của quy trình phân tích
Có một vài nghiên cứu chuyên về phát hiện gian lận (Blocher, 1992; Caderon and Green, 1994; Persons, 1995; Beneish, 1999; Kaminski et al., 2004) Các tác giả dùng phương pháp đối chiếu giữa báo cáo tài chính có sai lệch với các báo cáo tài chính không có sai lệch Trong phương pháp này, tác giả dùng các mô hình để xác định sai lệch dựa trên đối chiếu báo cáo tài chính có sai lệch đã được phát hiện trong thực tế với các báo cáo tài chính không có sai lệch của các doanh nghiệp cùng ngành nghề và quy mô Từ đó, xác định các tỷ số có thể sử dụng để nhận dạng sai
hợp với một mẫu công ty không có gian lận trên cùng ngành và khoảng thời gian Tổng cộng có mười biến, trong đó có tám tỷ lệ tài chính được kiểm tra và sử dụng
để phát triển hai mô hình logictis tiên đoán: mô hình cho năm có gian lận và cho năm trước - một mô hình tám biến để phát hiện gian lận một cách hiệu quả với độ tin cậy cao
phát hiện gian lận: phân tích xu hướng, phân tích tỷ số, … Các mô hình logictis từng bước chỉ ra rằng đòn bẩy tài chính, doanh thu, vốn, tài sản và quy mô doanh nghiệp là những yếu tố quan trọng ảnh hưởng đến khả năng của báo cáo tài chính
Trang 29Busta và Randy (1998), sử dụng quy luật Benford và mạng nơron như là một thủ tục phân tích để đo độ lệch của tập hợp dữ liệu Độ lệch này cho thấy giả mạo tiềm năng và có thể được sử dụng để cảnh báo thử nghiệm kiểm toán thêm Kết quả cho thấy rằng nếu dữ liệu tài chính đã được làm sai lệch 10%, quy luật Benford phân tích đánh giá sẽ phát hiện giả mạo 68% lần Nếu dữ liệu không được làm sai lệch,
và không phải là dữ liệu thực tế
Hoban, James P (1993) sau khi xem xét nghiên cứu liên quan đến các chỉ số tài chính, nghiên cứu này có xem xét ý kiến của các ngân hàng về tầm quan trọng của
43 chỉ tiêu tài chính Ông đã xác định được 19 tỷ lệ được coi là quan trọng trong việc phân tích các công ty bán lẻ và 14 tỷ lệ cho là quan trọng trong việc phân tích các công ty sản xuất Nghiên cứu thống kê đã tìm thấy việc phân loại ngành công nghiệp rất quan trọng trong phân tích tỷ lệ tài chính Nghiên cứu này cho thấy các ngân hàng sử dụng một bộ các tỷ lệ khác nhau khi thẩm định các công ty bán lẻ khác với khi thẩm định các công ty sản xuất Đặc biệt, tỷ lệ thanh khoản và các nhóm hoạt động có ý nghĩa quan trọng đối với các nhà bán lẻ hơn cho các nhà sản xuất Trong khi, nhóm tỷ lệ lợi nhuận và tỷ lệ đòn bẩy thì quan trọng ở cả hai nhóm Kurt Fanning and K.Cogger (1998) sử dụng các mạng thần kinh nhân tạo kết hợp với thống kê để phát triển một mô hình để phát hiện gian lận quản lý dựa trên bảng câu hỏi của KPMG Peat Marwick để khảo sát Kết quả của họ cũng phân loại được báo cáo tài chính có gian lận quản lý và không có gian lận quản lý với tỷ lệ rất cao Khá nhiều chuyên gia đã dành các nỗ lực nghiên cứu FFS từ một danh mục đầu
tư của các thuật toán khai thác dữ liệu đã được áp dụng cho FFD Ví dụ, bằng cách
sử dụng một phân tích hồi quy logit, Beasley7 phát hiện doanh nghiệp không có gian lận thì có các thành viên bên ngoài chiếm tỷ lệ phần trăm cổ phần cao hơn đáng kể trong hội đồng quản trị so với các doanh nghiệp có gian lận Cindy
6
Busta, B and Weinberg, R (1998) Using Benford’s law and neural networks as a review produce
Managerial Auditing Journal, 13 June
7
M S Beasley, "An empirical analysis of the relation between the board of director composition and financial statement fraud," The Accounting Review, Vol 71, No 4 pp 443-465, 1996
Trang 30Durtschi (2004) khẳng định công cụ phân tích kỹ thuật số theo quy luật của Benford8 khi được sử dụng một cách chính xác sẽ là một công cụ hữu ích để xác định các nghi ngờ tài khoản gian lận để phân tích thêm, hiện tại được đưa vào gói phần mềm phổ biến CareWare 2002 để xác định các lỗi có thể, gian lận tiềm năng hay các bất thường khác
Thomas E McKee (2007) nghiên cứu mô hình dự báo gian lận báo cáo tài chính với 91 BCTC công ty kết quả của 3 mô hình như sau: mô hình Agglomerative sẽ xác nhận chéo chính xác 61% dữ liệu, dự báo chính xác 79% trên toàn bộ mẫu với 9 qui tắc và 15 biến; mô hình cây quyết định sẽ xác nhận chéo chính xác 61% dữ liệu,
dự báo chính xác 81% trên toàn bộ mẫu với 3 qui tắc và 4 biến; mô hình hồi quy Logistic sẽ xác nhận chéo chính xác 64,5% dữ liệu, dự báo chính xác 68,1% trên toàn bộ mẫu với 4 biến Có thể thấy mô hình cây quyết định dự báo chính xác hơn
cả
Efstathios Kirkos (2005) sử dụng dữ liệu BCTC từ 76 công ty sản xuất ở Hy Lạp
đã được kiểm toán phân loại ra làm 2: 38 công ty có có dấu hiệu gian lận được xuất hiện với 38 công ty không có dấu hiệu gian lận BCTC trong việc ban hành Tác giả biên soạn 27 tỷ số tài chính, mà sử dụng từ các tỷ số tài chính được đề xuất dùng để phân tích dựa trên các nghiên cứu có liên quan trước đây về chủ đề của FFS, được thực hiện bởi Spathis (2002); Spathis et al (2002), Fanning và Cogger (1998), Person (1995) Tác giả chạy ANOVA để lọc sự khác biệt giữa hai biến Sau đó khai phá dữ liệu với các mô hình khai phá dữ liệu (data mining model) cụ thể Tác giả dùng 3 phương pháp cây quyết định, mạng thần kinh, mạng Bayesian để xây dựng 3
mô hình Tuy nhiên, hiệu suất của ba mô hình là khác nhau đáng kể Mô hình mạng Bayesian đạt được hiệu suất tốt nhất để quản lý phân loại một cách chính xác 90,3% mẫu xác nhận trong một thủ tục xác nhận qua 10 lần Mức độ chính xác của mô hình mạng thần kinh và mô hình cây quyết định tương ứng là 80% và 73,6%
Johan Perols (2011) nghiên cứu đánh giá việc thực hiện các thuật toán phân loại khác nhau trong việc phát hiện gian lận Các thuật toán phân loại được lấy từ Weka,
8
Luật Benford- Làm thế nào phát hiện số liệu giả tạo?, http://www.statistics.vn
Trang 31một mã nguồn mở công cụ khai thác dữ liệu Sử dụng một công cụ mã nguồn mở tạo điều kiện cho việc nhân rộng và mở rộng của nghiên cứu này Weka thực hiện một tập hợp tương đối đầy đủ các thuật toán phân loại, trong đó có nhiều trong những phổ biến nhất Ông đã lựa chọn 6 thuật toán từ Weka: (1) J48, (2) SMO, (3) MultilayerPerceptron (4) Logistics, (5) stacking, và (6) bagging Tuy nhiên khác với các nhà nghiên cứu trước, ông nhận thấy hồi quy logistic thì tốt hơn mạng thần kinh nhân tạo (ANN) Tuy nhiên nó không mâu thuẫn với các kết quả nghiên cứu trước,
do việc chọn lựa chọn mẫu và các yếu tố khảo sát Kết quả phụ thuộc vào lựa chọn các thuộc tính đặc biệt đã đưa ra ý nghĩa của nghiên cứu này là khi các nhà nghiên cứu phát triển các yếu tố dự báo gian lận mới cần phải kiểm tra các tiện ích của những dự đoán gian lận bằng cách sử dụng nhiều hơn một thuật toán phân loại Với vai trò và ý nghĩa như vậy, thủ tục phân tích các số liệu, thông tin, các tỷ số quan trọng và việc ứng dụng các công nghệ thông tin mới cần được coi trọng và thực hiện đầy đủ hơn nữa Nhưng thực tế áp dụng thủ tục phân tích ở các công ty kiểm toán ở Việt Nam lại chưa quan tâm đúng mức và chưa thực sự phát huy hết được tác dụng của thủ tục này trong một cuộc kiểm toán BCTC
1.4 Kỹ thuật khai phá dữ liệu:
1.4.1 Khai phá dữ liệu (Data mining) là gì?
Kỹ thuật phân tích chỉ số tài chính để phát hiện gian lận được trình bày ở phần trên đây trong các công trình nghiên cứu gần đây sử dụng thuật khai phá dữ liệu Khai phá dữ liệu là một thuật ngữ tương đối mới, nó ra đời vào khoảng những năm cuối của của thập kỷ 1980 Các nhà thống kê xem "khai phá dữ liệu như là một quá trình phân tích được thiết kế thăm dò một lượng dữ liệu cực lớn nhằm phát hiện
ra các mẫu thích hợp và/hoặc các mối quan hệ mang tính hệ thống giữa các biến và sau đó sẽ hợp thức hoá các kết quả tìm được bằng cách áp dụng các mẫu đã phát hiện được cho tập con mới của dữ liệu"
Nói ngắn gọn: “Khai phá dữ liệu là một quá trình trích xuất tri thức từ một chuỗi lặp (iterative) và tương tác (interactive) với lượng lớn dữ liệu thô - một quá trình
Trang 32không dễ dàng - để trích xuất thông tin ẩn, hữu ích, chưa được biết trước, đáp ứng được sự quan tâm của người sử dụng”
Kỹ thuật khám phá tri thức và khai phá dữ liệu đã và đang được nghiên cứu, ứng dụng trong nhiều lĩnh vực khác nhau ở các nước trên thế giới, tại Việt Nam kỹ thuật này còn tương đối mới tuy nhiên cũng đang được nghiên cứu và dần đưa vào ứng dụng
1.4.2 Quá trình khai phá dữ liệu:
Kỹ thuật KPDL chỉ là một bước thiết yếu trong quá trình Khám phá tri thức trong CSDL và quá trình này bao gồm các bước sau:
Lựa chọn đặc điểm (Data selection): dữ liệu không liên quan được phân tích để quyết định giữ lại hay loại bỏ khỏi tập dữ liệu Giai đoạn này thực hiện việc lựa chọn các trường của mỗi mẫu dữ liệu để thực hiện khai phá tri thức thu được kết quả cao Tất cả các chỉ tiêu tài chính của Bảng 1.2 phải được thu thập từ công bố báo cáo tài chính cụ thể là bảng cân đối kế toán, báo cáo kết quả kinh doanh và báo cáo lưu chuyển tiền tệ
• Thu thập dữ liệu (Data collection) và Làm sạch dữ liệu (Data cleaning): giai đoạn này là tạo ra nguồn dữ liệu, loại bỏ nhiễu hoặc các dữ liệu không thích hợp
Dữ liệu được làm sạch từ các nguồn khác và và tích hợp với nhau Dữ liệu trong nghiên cứu với mục tiêu phòng ngừa và phát hiện các hành vi gian lận báo cáo tài chính, có thể bao gồm chỉ số tài chính liên quan đến lợi nhuận, tính thanh khoản, an toàn và hiệu quả cùng với hành vi đặc điểm như tuổi tác của công ty, kích thước của công ty trên cơ sở doanh thu và tài sản
• Tiền xử lý dữ liệu: Là việc phân tích, chuyển đổi các biến đầu vào, đầu ra để tối thiểu hóa nhiễu, nhấn mạnh đến các quan hệ nổi bật, phát hiện xu hướng Các dữ liệu thô dần được chuẩn hóa thành các giá trị có giới hạn trên và giới hạn dưới của hàm chuyển đổi được xác định Dữ liệu được lựa chọn được biến đổi vào các mẫu thích hợp cho quá trình khai phá (luật kết hợp)
• Khai phá dữ liệu (Data mining): giai đoạn quyết định của quá trình khai phá tri thức từ dữ liệu Các kỹ thuật được sử dụng trong giai đoạn này nhằm lấy ra các
Trang 33mẫu hữu ích tiềm ẩn Quan trọng ở giai đoạn này là lựa chọn kỹ thuật khai thác dữ liệu thích hợp
Hình 1.1: Khuôn khổ phát hiện và phòng chống gian lận Báo cáo tài chính 9
• Hiệu suất đánh giá (Performance Evaluation): các mẫu biểu diễn tri thức hấp dẫn được nhận biết dựa trên các độ đo được đưa ra Bước này là vô cùng quan trọng
để lựa chọn tốt nhất kỹ thuật phù hợp từ một tập hợp các phương pháp khai thác dữ liệu và tinh chỉnh các yếu tố của tham số đầu vào trong quá trình lặp đi lặp lại của
Báo cáo gian lận
Mô tả khai phá dữ liệu (Kết hợp các quy tắc)
Quy tắc động cơ Quy tắc giám sát Chống gian lận
Trang 34học máy Do đó, kết quả của bước này sẽ làm việc như là một thông tin phản hồi cho các khuôn khổ hoàn chỉnh
• Biểu diễn tri thức (Knowledge representation): là giai đoạn cuối của quá trình khai phá tri thức từ dữ liệu, nhằm biểu diễn trực quan tri thức cho người dùng Bước quan trọng này sử dụng các kỹ thuật trực quan để giúp người sử dụng hiểu và biểu diễn các kết quả khai phá dữ liệu
Năm thành tố cơ bản để đặc tả một tác vụ khai phá dữ liệu:
o Dữ liệu cụ thể sẽ được khai phá (task-relevant data)
o Tri thức nền (background knowledge
o Các độ đo (interestingness measures
knowledge presentation
Một giải thuật khai phá dữ liệu bao gồm bốn thành phần cơ bản: cấu trúc mẫu hay mô hình, hàm tỉ số, phương pháp tìm kiếm và tối ưu hóa, chiến lược quản lý dữ liệu
1.4.3 Công cụ khai phá dữ liệu:
Một số hệ thống khai phá dữ liệu:
- Intelligent Miner (IBM)
- Microsoft data mining tools (Microsoft SQL Server 2000/2005/2008)
- Oracle Data Mining (Oracle 9i/10g/11g)
- Enterprise Miner (SAS Institute)
- Weka (the University of Waikato, New Zealand,
www.cs.waikato.ac.nz/ml/weka)
1.4.4 Phương pháp khai phá dữ liệu:
Mặc dù ngày nay gói phần mềm khai phá dữ liệu được yêu cầu tự động hóa nhiều hơn, nhưng nó vẫn yêu cầu một số hướng dẫn từ người sử dụng Vì vậy, trong việc sử dụng các công cụ khai thác dữ liệu, người dùng cần phải có một kiến thức
cơ bản của các phương pháp này Các loại phương pháp khai phá dữ liệu có thể
Trang 35được phân loại khác nhau Tuy nhiên, nói chung, nó được chia thành hai nhóm chính:
- Kỹ thuật khai phá dữ liệu mô tả: có nhiệm vụ mô tả về các tính chất hoặc các đặc tính chung của tập dữ liệu lớn một cách tổng kết và súc tích Các kỹ thuật này bao gồm: Phân cụm (Clustering), tóm tắt (Summerization), trực quan hóa (Visualization), phân tích sự phát triển và độ lệch (Evolution and Deviation analyst), phân tích luật kết hợp (Association rules), … Khai thác dữ liệu mô tả là rất
dễ dàng để áp dụng trên dữ liệu không được giám sát Tính chất này được đề nghị
sử dụng cho công tác phòng chống các hành vi gian lận báo cáo tài chính vì các phương pháp không được giám sát phát hiện lỗi / sai lầm, thay đổi trong hành vi và giá trị thay vì phân loại các tổ chức là gian lận hoặc không gian lận
- Kỹ thuật khai phá dữ liệu dự đoán: Có nhiệm vụ đưa ra các dự đoán dựa vào các suy diễn trên dữ liệu hiện thời Các kỹ thuật này gồm có: Phân lớp (Classifacation), hồi quy (regession), … Mục tiêu của khai thác dữ liệu dự đoán là
để dự đoán giá trị của một thuộc tính trên cơ sở giá trị của các thuộc tính khác Khả năng khai thác dữ liệu tiên đoán này sẽ được sử dụng để phát hiện các hành vi gian lận báo cáo tài chính Một trong những phương pháp quan trọng của khai thác dữ liệu dự đoán là phân loại Phân loại là một quá trình hai bước Trong bước đầu tiên, mỗi tổ chức trong mẫu đào tạo được dán nhãn là gian lận, gian lận không trên cơ sở của một thuộc tính nhãn lớp Bước này có kết quả học có giám sát trong một mô hình mà sau bước thứ hai của phân loại, trong đó đã học được cố gắng mô hình để phân loại các tổ chức từ mẫu xác nhận là gian lận hay không gian lận Do đó, phát hiện và xác định các hành vi gian lận báo cáo tài chính có thể được coi như là một vấn đề cổ điển phân loại
Để xác định các thuật toán chính được sử dụng cho phát hiện gian lận trong kế toán tài chính, tác giả trình bày về các kỹ thuật dữ liệu khai thác được xác định trong các tài liệu áp dụng cho nghiên cứu để phát hiện các hành vi gian lận tài chính Kỹ thuật được sử dụng thường xuyên nhất này là các mô hình cây quyết định (decision trees), mạng thần kinh nhân tạo (Artificial Neural Network- ANN), mạng
Trang 36Belief Bayesian (the Bayesian belief network), tất cả đều rơi vào kỹ thuật dự đoán
và thuật toán luật kết hợp Apriori thuộc vào kỹ thuật mô tả Bốn kỹ thuật này sẽ được thảo luận chi tiết hơn trong phần dưới đây
+ Cây Quyết định (Decision Trees) là công cụ hỗ trợ quyết định mang cấu trúc hình cây, nơi mà mỗi lá đại diện cho một thử nghiệm trên một thuộc tính và từng nhánh đại diện cho hậu quả có thể Những cây này có thể được trồng thông qua dựa trên thuật toán học máy như CART và ID3, C4.5, J48
Một cấu trúc cây được tạo ra trong đó mỗi nút của cây quy định cụ thể thử nghiệm của một thuộc tính, từng ngành tương ứng đến một kết quả thử nghiệm, và mỗi lá tạo thành một dự đoán phân loại Mục đích chính của cây quyết định là dùng
để dự đoán lớp (xác định lớp) của các đối tượng chưa biết (unseen data), phân chia dựa trên các thuộc tính tốt nhất để tách các mẫu Mẫu tiếp được chia thành các tập con, cho đến khi không có thêm hoặc chia tách có thể tạo ra sự khác biệt có ý nghĩa thống kê hoặc các phân nhóm là quá nhỏ để trải qua tương tự có ý nghĩa phân chia Thông tin cao nhất là gần nhất với gốc cây
(Nguồn: http://vi.wikipedia.org/wiki/ Cây_quyết_định )
Các điểm mạnh của phương pháp cây quyết định là: cây quyết định có thể tạo ra các quy tắc dễ hiểu, thực hiện phân loại mà không cần tính toán nhiều, có thể xử lý
Trang 37biến liên tục và phân loại, và cây quyết định cũng cung cấp một dấu hiệu rõ ràng để
dự đoán và phân loại
+ Mạng Neuron – mạng thần kinh nhân tạo là mô hình xử lý thông tin được mô phỏng dựa trên hoạt động của hệ thống thần kinh của sinh vật, bao gồm số lượng lớn các Neuron được gắn kết để xử lý thông tin ANN giống như bộ não con người, được học bởi kinh nghiệm (thông qua huấn luyện), có khả năng lưu giữ những kinh nghiệm hiểu biết (tri thức) và sử dụng những tri thức đó trong việc dự đoán các dữ liệu chưa biết (unseen data) Mạng lưới thần kinh hiện đại là các công cụ mô hình thống kê dữ liệu phi tuyến tính Chúng thường được sử dụng để mô hình hóa các mối quan hệ phức tạp giữa các yếu tố đầu vào và đầu ra hoặc tìm kiếm mẫu trong
dữ liệu
Một mạng truyền thẳng đa tầng (Multilayer Perceptron) là một loại trong các lớp phổ biến và quan trọng nhất trong các ứng dụng của mạng thần kinh, mạng lan truyền tiến được huấn luyện theo kiểu học có giám sát, thiết lập các dữ liệu đầu vào vào một tập hợp các đầu ra thích hợp
(Nguồn: http://bis.net.vn)
Trang 38Mạng lưới thần kinh được áp dụng rộng rãi trong phân loại và phân nhóm, và lợi thế của nó như sau: Đầu tiên, là nó thích nghi, thứ hai, nó có thể tạo ra các mô hình mạnh mẽ, và thứ ba, quá trình phân loại có thể được sửa đổi nếu trọng số huấn luyện (training weights) mới được thiết lập Mạng lưới thần kinh được áp dụng chủ yếu trong lĩnh vực thẻ tín dụng, bảo hiểm ô tô và phát hiện gian lận của công ty
Về cơ bản, mạng lưới thần kinh là một mô hình toán học từ một cơ sở dữ liệu lịch
sử của các ví dụ về các giá trị đầu vào và đầu ra Sau khi biết mối quan hệ giữa các biến số, mạng lưới đã được đào tạo và mô hình toán học được xây dựng trong dữ liệu mẫu, dựa vào mối tương quan giữa các dữ liệu Mô hình kết quả, khi được sử dụng với các dữ liệu đầu vào mới, sẽ cung cấp dự đoán các kết quả đầu ra trong tương lai Ví dụ, bằng cách thu thập dữ liệu lịch sử của các khoản vay thương mại được thực hiện cho các tổ chức, ngân hàng có thể xác định những tổ chức không có khả năng hoàn trả các khoản vay Một mô hình có thể được xây dựng dựa trên các mối quan hệ, giữa các chỉ tiêu tài chính và kết quả của khoản vay của một công ty được lựa chọn Sau khi mô hình được tổng hợp, nó có thể được sử dụng để dự đoán nếu người nộp đơn vay thương mại mới có thể để mặc định trả nợ Mạng lưới thần kinh là công cụ phân tích dữ liệu lớn có thể được sử dụng hiệu quả để dự đoán sự xuất hiện của báo cáo tài chính gian lận nhưng thường bị bỏ qua bởi các kiểm toán viên nội bộ và bên ngoài
Các nhà nghiên cứu đã khám phá hiệu quả của mạng thần kinh nhân tạo, cây quyết định và mạng niềm tin Bayesian trong phát hiện gian lận báo cáo tài chính (FFS) và để xác định các yếu tố liên quan đến FFS (K Fanning and K.Cogger, 1998) và (Kirkos, 2005)
+ Bayesian Belief Network - Mạng niềm tin Bayesian - là một mô hình đồ họa
mã hóa các mối quan hệ xác suất giữa các biến quan tâm Khi được sử dụng kết hợp với các kỹ thuật thống kê, mô hình đồ họa có nhiều thuận lợi cho phân tích dữ liệu Một, bởi vì mô hình mã hóa phụ thuộc trong số tất cả các biến, nó dễ dàng xử lý các tình huống mà một số mục dữ liệu bị thiếu Hai, một mạng Bayesian có thể được sử dụng để tìm hiểu các mối quan hệ nhân quả, và do đó có thể được sử dụng để đạt
Trang 39được sự hiểu biết về một vấn đề tên miền và để dự đoán những hậu quả của sự can thiệp Ba, bởi vì mô hình này có một ngữ nghĩa nguyên nhân và xác suất, nó là đại diện cho việc kết hợp kiến thức (mà thường đi kèm theo hình thức quan hệ nhân quả) và dữ liệu Bốn, phương pháp thống kê Bayes kết hợp với mạng Bayes cung cấp một cách tiếp cận hiệu quả và nguyên tắc để tránh lắp dữ liệu Các nghiên cứu
mô tả mô hình mạng niềm tin Bayesian phân loại chính xác 90,3% của mẫu xác nhận để phát hiện gian lận Mạng niềm tin Bayesian tốt hơn mạng thần kinh và phương pháp cây quyết định và đạt được độ chính xác phân loại xuất sắc
Tóm lại, dù nhiều kỹ thuật phân lớp được đề xuất (phân lớp cây quyết định, phân lớp Baysian, mạng noron, phân tích thống kê,…), trong các kỹ thuật đó, cây quyết định được coi là công cụ mạnh, phổ biến và đặc biệt thích hợp cho data mining (Ho Tu Bao: Chapter 3: Data mining with Decision Tree – www.akademik.del.ac.id/ebooks)
1.4.5 Tóm tắt về khai phá dữ liệu - vai trò và ý nghĩa:
Khai phá dữ liệu là áp dụng công nghệ hiện đại trong lĩnh vực quản lý thông tin,
nó hiện diện khắp nơi (ubiquitous) và có tính ẩn (invisible) trong nhiều khía cạnh của đời sống hằng ngày
(Hình 1.2: Khung khái niệm để phân loại các ứng dụng khai thác dữ liệu để phát hiện BCTC gian lận)
Trang 40Khai phá dữ liệu có ý nghĩa trong làm việc, mua sắm, tìm kiếm thông tin, nghỉ ngơi, … Được áp dụng trong nhiều ứng dụng thuộc nhiều lĩnh vực khác nhau Các
lĩnh vực hiện tại có ứng dụng Khai thác dữ liệu bao gồm: Thiên văn học, công nghệ
sinh học, Bào chế thuốc, Thương mại điện tử, Phát hiện gian lận, Quảng cáo, Marketing, Quản lý quan hệ khách hàng (CMR), Chăm sóc sức khỏe, Viễn thông, Thể thao, giải trí, Đầu tư, Máy tìm kiếm (web),… Hỗ trợ các nhà khoa học, giáo dục học, kinh tế học, doanh nghiệp, khách hàng, …
Nghiên cứu về khả năng áp dụng các kỹ thuật khai thác dữ liệu để phát hiện các hành vi gian lận kế toán tài chính là một lĩnh vực đầy hứa hẹn Phương pháp thống
kê phát hiện các loại hành vi gian lận khác nhau như thẻ tín dụng gian lận, rửa tiền gian lận, gian lận viễn thông, vv, được xem xét trong (Bolton, R J., & Hand, D.J., 2002) Ứng dụng khai thác dữ liệu trong thị trường chứng khoán, dự báo phá sản và phát hiện gian lận liên quan đã được điều tra trong (Zhang, D., & Zhou, L., 2004) Một cuộc khảo sát khai thác dữ liệu dựa trên nghiên cứu phát hiện gian lận được trình bày trong PHUA (2004), bao gồm cả tín dụng giao dịch gian lận, lừa đảo thuê bao viễn thông, gian lận bảo hiểm ô tô, phát hiện khủng bố, phát hiện tội phạm tài chính, xâm nhập và phát hiện thư rác Những người khác nghiên cứu đã xem xét gian lận bảo hiểm (Derrig, 2002) và báo cáo tài chính gian lận (Leonard Rang’ala Lari, 2009)
Điểm pha trộn giữa khai thác dữ liệu và phát hiện gian lận kế toán là khai thác dữ liệu như là một công cụ phân tích tiên tiến có thể giúp kiểm toán viên trong việc đưa
ra quyết định và phát hiện gian lận Các kỹ thuật khai thác dữ liệu có khả năng giải quyết được mâu thuẫn giữa tính hiệu lực và hiệu quả phát hiện gian lận10
Tuy nhiên để thực hiện khai phá dữ liệu để phát hiện tri thức sẽ gặp các thách thức như là cần các cơ sở dữ liệu lớn, số chiều lớn, dữ liệu có thể bị thiếu hoặc nhiễu làm ảnh hưởng đến kết quả phân tích, quan hệ giữa các trường phân tích quá phức tạp, việc thay đổi dữ liệu và tri thức có thể làm cho các mẫu đã phát hiện
10
Wang, S (2010) A Comprehensive Survey of Data Mining-Based Accounting-Fraud Detection Research International Conference on Intelligent Computation Technology and Automation, vol 1, pp.50-