Do vậy, nhằm 1 xác định mức độ chênh lệch tiền lương tại Việt Nam, 2 xác định các yếu tố thực sự tác động đến tiền lương và 3 phân rã khoảng chênh lệch tiền lương để làm rõ phần chênh lệ
Trang 1Như vậy, sự tồn tại của chênh lệch tiền lương là tất yếu Tuy nhiên, các nhà kinh
tế học như Becker (1971), Cain (1986) phân biệt hai cách giải thích cho vấn đề chênh lệch tiền lương: đó là chênh lệch tiền lương do phân biệt đối xử và chênh lệch tiền lương do chênh lệch về vốn con người và/hoặc năng suất lao động Sự chênh lệch tiền lương do chênh lệch về vốn con người và/hoặc do chênh lệch về năng suất lao động có thể xem là những chênh lệch “tích cực” tạo ra động lực để phát triển Sự chênh lệch tiền lương do trình độ học vấn sẽ khiến người ta cố gắng học hỏi để đạt trình độ cao Hay sự chênh lệch về tiền công do chênh lệch về năng suất lao động, về hiệu quả công việc, về khả năng ngoại ngữ, về việc tích luỹ kinh nghiệm, về khả năng sáng tạo v.v sẽ tạo ra động lực để người lao động phấn đấu hoàn thiện chính mình, từ đó kích thích sự phát triển chung của xã hội Những chênh lệch tiền lương
“tiêu cực” thể hiện ở các bất bình đẳng nảy sinh trong xã hội mà chúng ta cần phải điều chỉnh Ví dụ như sự chênh lệch tiền lương do kỳ thị lao động nữ giới, ưu ái lao động nam giới, chênh lệch tiền lương dẫn đến chênh lệch giàu nghèo, chênh lệch mức sống giữa thành thị - nông thôn, v.v Do vậy, có thể phân chia các nguyên
Trang 2do sự thay đổi của thị trường lao động, sự khác nhau hoặc sự thay đổi của môi trường lao động tại nơi làm việc, do sự khác nhau về tính chất của công việc hoặc do
sự khác nhau về đặc điểm của bản thân người lao động Nhóm thứ hai là do sự kỳ thị
hoặc là do sự phân biệt đối xử trong xã hội và/hoặc của người sử dụng lao động đối với người lao động Nhóm nguyên nhân này dẫn đến sự bất bình đẳng trong xã hội
Do vậy, nhằm (1) xác định mức độ chênh lệch tiền lương tại Việt Nam, (2) xác định các yếu tố thực sự tác động đến tiền lương và (3) phân rã khoảng chênh
lệch tiền lương để làm rõ phần chênh lệch giải thích theo nhóm nguyên nhân thứ nhất và phần thể hiện bất bình đẳng theo nhóm nguyên nhân thứ hai nói trên, đề tài
“Ứng dụng phương pháp hồi quy phân vị phân tích chênh lệch tiền lương ở Việt Nam” được chọn làm đề tài cho luận án tiến sĩ của tác giả tại trường Đại học Kinh tế
TPHCM
2 Mục tiêu nghiên cứu
Để thực hiện các mục đích trên, đề tài hướng đến việc hoàn thành các mục tiêu sau đây:
1) Giới thiệu một cách có hệ thống về cơ sở lý thuyết và khả năng ứng dụng phương pháp hồi quy phân vị, cũng như phương pháp phân rã chênh lệch tiền lương dựa trên hồi quy phân vị
2) Thực hiện hồi quy phân vị hàm tiền lương thực tế ở Việt Nam với biến phụ thuộc là logarit tiền lương thực tế theo giờ của người lao động Hệ số của hàm tiền lương thực tế này được ước lượng bằng phương pháp hồi quy phân vị có hiệu chỉnh tính chệch do chọn mẫu và khắc phục nội sinh
3) Xác định khoảng chênh lệch tiền lương theo giới tính (nam – nữ, nam - nữ ở thành thị, nam – nữ ở nông thôn) và phân rã các khoảng chênh lệch tiền lương này để làm rõ phần chênh lệch được giải thích bởi các biến độc lập và phần chênh lệch chưa được giải thích gây ra bởi chênh lệch về hệ số hồi quy Đồng thời so sánh kết quả phân tích chênh lệch tiền lương theo giới tính năm 2002
và 2012 để làm rõ sự thay đổi theo thời gian
Trang 34) Xác định khoảng chênh lệch tiền lương theo khu vực (thành thị - nông thôn, thành thị - nông thôn ở nam giới, thành thị - nông thôn ở nữ giới) Phân rã các khoảng chênh lệch tiền lương này để làm rõ phần chênh lệch được giải thích bởi các biến độc lập và phần chênh lệch chưa được giải thích gây ra bởi chênh lệch về hệ số hồi quy Đồng thời so sánh kết quả phân tích chênh lệch tiền lương theo khu vực năm 2002 và 2012 để làm rõ sự thay đổi theo thời gian 5) Xác định mức tăng lương theo thời gian từ năm 2002 đến năm 2012 Phân rã
sự tăng lương này thành hai phần: phần tăng lương là do thay đổi về đặc điểm lao động và phần tăng lương là do thay đổi hệ số hồi quy
3 Đối tượng – phạm vi nghiên cứu
Đề tài này được thực hiện đựa trên bộ số liệu khảo sát mức sống hộ gia đình (VHLSS) năm 2002 và 2012 do Tổng cục Thống kê công bố Đối tượng nghiên cứu của đề tài cũng chính là đối tượng được khảo sát về tiền lương và các yếu tố có liên quan trong các cuộc khảo sát này Phạm vi nghiên cứu của đề tài là nghiên cứu tiền lương thực tế theo giờ của các đối tượng trong độ tuổi trên lãnh thổ Việt Nam
4 Ý nghĩa khoa học và ý nghĩa thực tiễn
Với mục tiêu nghiên cứu và phương pháp nghiên cứu được lựa chọn, đề tài của luận án mang lại các ý nghĩa khoa học và thực tiễn sau đây:
(a) Đề tài áp dụng phương pháp hồi quy phân vị, một kỹ thuật hồi quy được giới thiệu bởi Koenker & Bassett (1978) và đã được dùng rất rộng rãi trên thế giới nhưng chưa phổ biến ở Việt Nam Rất ít các đề tài nghiên cứu ở Việt Nam áp dụng kỹ thuật hồi quy phân vị, đặc biệt là áp dụng trong nghiên cứu hàm tiền lương và phân rã chênh lệch tiền lương
(b) Đề tài trình bày một cách ngắn gọn, đầy đủ và có hệ thống về lý thuyết của phương pháp hồi quy phân vị Đây là điều mà cho đến nay chưa có tác giả
ở Việt Nam nào thực hiện
(c) Hàm tiền lương của các nhóm lao động được ước lượng bằng phương
Trang 4hiện tượng nội sinh trong mô hình, đem lại ước lượng vững và đáng tin cậy
(d) Đề tài xây dựng và ước lượng hàm tiền lương ở Việt Nam bằng phương pháp hồi quy phân vị cho từng nhóm lao động cụ thể: lao động nam và lao động nữ, lao động thành thị và lao động nông thôn, lao động nam ở thành thị và lao động nữ ở thành thị, lao động nam ở nông thôn và lao động nữ ở nông thôn
(e) Đề tài xác định mức chênh lệch tiền lương theo giới tính ở Việt Nam (trên toàn bộ mẫu số liệu cũng như ở từng khu vực thành thị - nông thôn) Đồng thời đề tài nghiên cứu sự thay đổi các mức chênh lệch này theo thời gian bằng cách so sánh kết quả tính toán giữa năm 2002 với 2012
(f) Đề tài phân rã khoảng chênh lệch tiền lương theo giới tính để xác định phần chênh lệch tiền lương thể hiện qua phần chênh lệch về đặc điểm lao
động và phần chênh lệch thể hiện qua sự khác nhau về hệ số hồi quy (được xem như là dấu hiệu của phân biệt đối xử tiền lương giữa nam và nữ)
(g) Đề tài xác định mức chênh lệch tiền lương giữa hai khu vực thành thị và nông thôn ở Việt Nam và nghiên cứu sự thay đổi của mức chênh lệch này theo thời gian bằng cách so sánh kết quả tính toán giữa hai hai thời điểm nghiên cứu là năm 2002 và 2012
(h) Đề tài phân rã khoảng chênh lệch tiền lương giữa hai khu vực thành thị và nông thôn nhằm xác định phần chênh lệch thể hiện qua khác nhau về đặc điểm lao động và phần chênh lệch thể hiện thông qua khác nhau về hệ số
hồi quy (được xem như là dấu hiệu của sự khác nhau trong chính sách đãi ngộ của khu vực thành thị - nông thôn)
Trang 5CHƯƠNG 1
CƠ SỞ LÝ THUYẾT VỀ HÀM TIỀN LƯƠNG
VÀ VẤN ĐỀ PHÂN TÍCH CHÊNH LỆCH TIỀN LƯƠNG BẰNG HỒI QUY PHÂN VỊ
Nhằm thực hiện các mục tiêu nghiên cứu đã nêu, đề tài áp dụng phương pháp hồi quy phân vị có hiệu chỉnh tính chệch do vấn đề chọn mẫu và có xử lý nội sinh để ước lượng hàm tiền lương dạng Mincer (1974) mở rộng Biến phụ thuộc được lựa chọn là logarit tiền lương thực tế dựa trên số liệu của VHLSS 2002 và VHLSS 2012 Sau đó, phương pháp Machado - Mata (2005) được áp dụng để tiến hành phân rã chênh lệch tiền lương và xác định các thành phần của khoảng chênh lệch này Do vậy, chương 1 sẽ bao gồm các nội dung sau đây:
- Trình bày hàm tiền lương do Mincer (1974) đề xuất và một số các mở rộng
- Trình bày phương pháp hồi quy phân vị do Koenker & Bassett (1978) đề xuất và các đặc điểm của hồi quy phân vị
- Tính chệch của ước lượng do vấn đề chọn mẫu và hiệu chỉnh ước lượng chệch do chọn mẫu đối với hồi quy phân vị
- Phương pháp phân rã chênh lệch do Machado - Mata(2005) đề xuất
RỘNG
Mincer (1974) đã giới thiệu phương trình tiền lương thể hiện mối quan hệ giữa logarit tiền lương (hoặc tiền công/thu nhập) với các yếu tố như số năm đi học, kinh nghiệm làm việc và bình phương của biến kinh nghiệm dựa trên lập luận rằng
Trang 6số tiền công được trả cho một người trong hiện tại phụ thuộc vào mức đầu tư vào
vốn con người (human capital) của bản thân họ trước đó
Ký hiệu mức tiền lương nhận được tại thời điểm t là E Mincer giả sử rằng đầu t
tư của một cá nhân vào vốn con người của bản thân ở kỳ t là k , hiệu quả tương ứng t
cùng kỳ mang lại cho mỗi đơn vị đầu tư là r t Khi đó, mức tiền lương nhận được ở thời điểm t được thể hiện như sau:
- Số năm đi học (s) là số năm được dành toàn thời gian cho việc học của người
lao động (trong thời gian đi học k0 k1 k s11 (năm))
- Hiệu quả mang lại của số năm đi học đối với tiền lương tiềm năng là không đổi theo thời gian (r0 r1 r s1)
- Hiệu quả mang lại của việc đầu tư cho đi học sau khi tốt nghiệp đối với tiền lương tiềm năng là không đổi theo thời gian (r s r t1)
Khi đó phương trình tiền lương được viết lại như sau
1 0
Ta có ln(1x) và x là hai vô cùng bé tương đương khi (x0)
Do đó, khi giá trị của , khá nhỏ, ta được
1
t
Trang 7Để xây dựng mối quan hệ giữa tiền lương tiềm năng và thâm niên công tác, Mincer giả sử rằng đầu tư vào học vấn sau tốt nghiệp giảm dần theo thời gian với dạng hàm số như sau:
1
s z
z k
.2
Trang 8Đây là phương trình tiền lương Mincer dạng tĩnh, được sử dụng rất nhiều trong các công trình nghiên cứu về tiền lương và phân tích sự chênh lệch tiền lương Một trong những công trình nghiên cứu xuất sắc, kế thừa phương trình tiền lương của Mincer (1974) được phát triển bởi Card (1994) Công trình này tập trung nghiên cứu tác động trung bình của số năm đi học đến tiền lương, thông qua kỹ thuật hồi quy theo phương pháp bình phương nhỏ nhất và phương pháp hồi quy với biến công cụ Dạng hàm tiền lương được mở rộng thành dạng
2
lnw t szz X u
Trong đó, s: số năm đi học
z: Số năm kinh nghiệm tính đến thời điểm t với z t s
X: Các biến độc lập khác có tác động đến tiền lương như giới tính, công việc, ngành nghề…
Sau công trình nghiên cứu của Card (1994), rất nhiều các nghiên cứu khác đã
mở rộng phương trình tiền lương của Mincer Các công trình này không phải chỉ nghiên cứu tiền lương trung bình và phân tích chênh lệch tiền lương trung bình, như nghiên cứu của Oaxaca-Blinder (1973), mà còn mở rộng ra nghiên cứu các tham số thống kê khác của hàm phân phối có điều kiện của tiền lương Trong số đó, Buchinsky (1994) thực hiện hồi quy phân vị trên hàm tiền lương của Mincer Tiếp theo đó là hàng loạt các nghiên cứu khác về tiền lương và chênh lệch tiền lương dựa trên phương trình tiền lương của Mincer đã được công bố Những nghiên cứu khác nhau sử dụng những biến độc lập khác nhau trong hàm tiền lương Mincer (1974) mở rộng
1.2 PHƯƠNG PHÁP HỒI QUY PHÂN VỊ
Phương pháp hồi quy phân vị được Koenker & Bassett giới thiệu lần đầu tiên năm 1978 Thay vì ước lượng các tham số của hàm hồi quy trung bình bằng phương pháp OLS, Koenker & Bassett (1978) đề xuất việc ước lượng tham số hồi quy trên từng phân vị của biến phụ thuộc để sao cho tổng chênh lệch tuyệt đối của hàm hồi quy tại phân vị τ của biến phụ thuộc là nhỏ nhất Nói một cách khác, thay vì xác định
Trang 9tác động biên của biến độc lập đến giá trị trung bình của biến phụ thuộc, hồi quy phân vị sẽ giúp xác định tác động biên của biến độc lập đến biến phụ thuộc trên từng phân vị của biến phụ thuộc đó Trong Mục 1.1.2, đề tài giới thiệu đầy đủ các định nghĩa, tính chất của hồi quy phân vị Đồng thời đề tài so sánh phương pháp hồi quy phân vị với phương pháp OLS của hồi quy cổ điển để cho thấy ưu điểm của hồi quy phân vị và sự phù hợp của hồi quy phân vị trong những nghiên cứu về chênh lệch tiền lương, cũng như trong các nghiên cứu về bất bình đẳng trong xã hội
a Giới thiệu phương pháp hồi quy phân vị
Định nghĩa về phân vị: Cho Y là một đ.l.n.n với hàm phân phối F Với Y
(0,1)
thì giá trị phân vị τ của Y là giá trị Q sao cho
Pr(YQ) Pr(YQ) (1.2) Hoặc có thể viết lại Q infy F y: Y( ) (1.3) Nếu Y là một đ.l.n.n liên tục, thì:
Pr(Yy)Pr(Yy)F y Y( )
Nếu F liên tục và tăng chặt thì Q F Y1( ).
Điều này có nghĩa là 100 % số quan sát của Y có giá trị không vượt quá giá trị phân
vị Q và 100(1)% số quan sát của Y có giá trị không thấp hơn Q
Giá trị phân vị, cũng như giá trị kỳ vọng của một đ.l.n.n, luôn là lời giải của
một bài toán cực trị liên quan đến đ.l.n.n đó Cụ thể, giá trị kỳ vọng E(Y) của đ.l.n.n
Y là lời giải cho bài toán tìm R sao cho 2
Trong khi giá trị trung bình của Y lời giải bài toán tìm cực tiểu (1.5) thì giá trị phân
vị Q của Y là lời giải của bài toán tìm cực tiểu hàm mục tiêu sau
Trang 10Hay arg min ( ) Y( ) ( 1) | | Y( ).
n i
Định nghĩa về xác suất có điều kiện và phân vị có điều kiện
Hàm phân phối xác suất đồng thời của hai biến ngẫu nhiên X và Y, ký hiệu là
Nếu X và Y có hàm mật độ đồng thời là f x y( , ) Khi đó hàm mật độ xác suất biên
(marginal density function) của Y được xác định bởi
Trang 11Nếu F Y X| ( | )y x là liên tục và tăng chặt thì 1
|
( | ) Y X( | )
Q Y X F X (1.12)
Trang 12Khi gần 0, Q Y X( | x) thể hiện phần đuôi trái của hàm phân phối có điều kiện
gọi là phương pháp hồi qui y theo x
Tương tự, Koenker & Bassett (1978) cũng đề xuất dạng mở rộng của bài toán (1.10) để tìm ra hàm phân vị có điều kiện Q Y X( | ) Phương pháp này gọi là phương
pháp hồi quy phân vị Để mở rộng bài toán (1.10), giả sử ta có mẫu số liệu với các
Trang 13Khi đó, phương trình (1.13) trở thành ˆ arg min ( ).
Q Y X h X trở thành hàm hồi quy phân vị ở phân vị
Tương tự, hàm hồi quy phân vị tuyến tính ở phân vị có dạng Q Y X( |i i)X i
Và hàm hồi quy phân vị tuyến tính mẫu ở phân vị sẽ là
ˆ( |i i) i
Q Y X X hay ˆ
Y X u với Q u( i |X i) 0. (1.14) Giá trị ˆ
Cách viết này cho thấy việc ước lượng tham số trong hàm hồi quy ứng với phân vị
là dựa trên toàn bộ mẫu số liệu Mỗi quan sát được gán trọng số tương ứng Cụ thể, những quan sát nằm phía trên đường hồi quy phân vị được gán trọng số và những quan sát nằm phía dưới được gán trọng số 1
Công thức V() ở (1.18) còn có thể viết dưới dạng khác như sau
Trang 14Nếu 1
2
, hồi quy phân vị sẽ cho kết quả hàm hồi quy trung vị có điều kiện
Q Y X X Đây cũng chính là lời giải của bài toán hồi quy theo phương
pháp LAD (Least Absolute Deviation – Độ lệch tuyệt đối nhỏ nhất) rất phổ biến
trong kinh tế lượng cổ điển
Nguồn: tác giả tính toán từ số liệu mô phỏng trên Stata
Hình 1 1: Đồ thị biểu diễn các kết quả hồi quy phân vị của Y theo X
Hồi quy bằng phương pháp OLS chỉ thu được một đường hồi quy duy nhất thể hiện giá trị trung bình có điều kiện của biến phụ thuộc Y theo các giá trị của biến độc lập X Trong khi đó, hồi quy phân vị cho thấy được nhiều hàm hồi quy ứng với từng
q10 q25 q50OLSq75 q90
Trang 15b Tính chất của phương pháp hồi quy phân vị
Theo Koenker (2005) và Hao & Naiman (2007), hồi quy phân vị có những tính chất quan trọng thể hiện ưu điểm của phương pháp hồi quy này so với phương bình phương nhỏ nhất
b.1 Tính đẳng biến (Equivariance)
Giá trị phân vị có tính đẳng biến khi biến đổi qua hàm số đơn điệu: với (.)h là
một hàm số bất kỳ không giảm và Y là một đ.l.n.n liên tục, thì ta có
P Y a P h Y h a Vì vậyQ h Y ( ) h Q Y( ) Từ đó, Koenker (2005) chứng các tính chất đẳng biến quan trọng của hồi quy phân vị 1
- Hồi quy phân vị có tính đẳng biến khi thay đổi quy mô (scale equivariance)
- Hàm hồi quy phân vị còn có tính chất đẳng biến khi thay đổi vị trí Nghĩa là,
nếuy i* y i X i và * là tham số của hồi quy phân vị của y*i theoX thì i
*
- Một tính chất khác của hồi quy phân vị là đẳng biến khi thay đổi dạng biến
số Cụ thể, nếu X* X A với A là ma trận không suy biến, thì ˆ* A 1ˆ Tính đẳng biến của hồi quy phân vị đặc biệt hữu ích trong các tính toán biến đổi để ước lượng tham số khi dùng phương pháp quy hoạch tuyến tính
b.2 Tính ổn định (robustness)
Trang 16
Với hồi quy cổ điển, các ước lượng của phương pháp bình phương nhỏ nhất thay đổi ngay khi Y thay đổi Mỗi sự thay đổi trong i Y sẽ dẫn đến sự thay đổi của i
các ước lượng hồi quy OLS Điều này làm cho ảnh hưởng của các quan sát bất
thường (extreme value) đến ước lượng của OLS là rất lớn Trong khi đó, đối với hồi
quy phân vị, khi Y thay đổi nhưng chưa làm biến đổi dấu của i ˆ
i i
Y X thì các tham
số ước lượng của hồi quy phân vị không thay đổi Nói khác đi, người ta có thể thay đổi giá trị của một quan sát ở một phía bất kỳ của đường hồi quy phân vị mà không làm ảnh hưởng đến kết quả hồi quy, nếu sự thay đổi đó không làm thay đổi phía của quan sát so với đường hồi quy phân vị Do đó, cho dù nếu có thay thế một quan sát ban đầu bằng một quan sát bất thường thì giá trị của tham số ước lượng trên hồi quy vẫn không thay đổi nếu quan sát bất thường này nằm cùng phía với quan sát ban đầu
so với hàm hồi quy Vì vậy ước lượng bằng phương pháp hồi quy phân vị được xem
là có tính ổn định hơn so với ước lượng OLS2
b.3 Hàm hồi quy phân vị k biến luôn đi qua ít nhất k quan sát của mẫu nghiên cứu
Xét hàm mục tiêu được viết dưới dạng công thức (1.17):
0
1
1( )
i i
n
i i
Y X i
Trang 17i n
dòng có chỉ số thuộc tập) và ( )y là vectơ cột cấp k1 với các phần tử tương ứng
là ,Y i i Khi đó hệ nghiệm cơ bản là b( ) X( ) ( ) 1 y với Mỗi phương án thỏa mãn miền ràng buộc đều chứa k trong số n quan sát của mẫu nghiên cứu,
Trang 18phương án b được nêu ra trước đó cũng là một trong số các phương án ( )b với trường hợp 1, , k ứng với kquan sát đầu tiên
Hình 1 2: Đường hồi quy phân vị 2 biến đi qua ít nhất 2 quan sát của mẫu
Nguồn: tác giả tính toán từ số liệu mô phỏng
Như vậy, phương án tối ưu của bài toán quy hoạch tuyến tính trong hồi quy phân vị là một trong số các phương án ( )b nên chắc chắc cũng sẽ đi qua ít nhất k
quan sát của mẫu Hay nói cách khác, có ít nhất k quan sát có phần dư bằng 0 trong hàm hồi quy phân vị của mẫu
Hình 1 2 là một ví dụ minh họa bằng hình ảnh của tính chất trên đối với một hàm hồi quy phân vị hai biến Nhìn trên đồ thị, mỗi dấu chấm là biểu diễn của một quan sát trong mẫu, ta nhận thấy mỗi hàm hồi quy phân vị trên hình đi qua ít nhất hai quan sát của mẫu số liệu có được
b.4 Số quan sát có phần dư âm của hàm hồi quy phân vị ứng với phân vị τ có thể đạt tỷ lệ cao nhất là τ
q25 q75
Trang 19Xét phần dư ˆ
i i i
e Y Xcủa hàm hồi quy phân vị có chứa hệ số tự do Ký hiệu P là số quan sát có phần dư dương; N là số quan sát có phần dư âm và Z là số quan sát có phần dư bằng 0 Khi đó
Từ tính chất này có thể suy ra rằng với mỗi hàm hồi quy ứng với phân vị thì
sẽ có không quá 100%số quan sát của mẫu nằm phía dưới đường hồi quy phân vị (có phần dư ui âm) và không quá (1).100%số quan sát nằm phía trên (có phần dư
i
u không âm) hàm hồi quy phân vị đang xét.4
b.5 Tính tăng dần của các hàm hồi quy phân vị 5 tại giá trị trung bình của X
Ký hiệu
1
1 n i i
4 Xem trang 56 của tài liệu Koenker (2005)
5
Trang 20Hình 1 3: Giá trị hồi quy tăng dần khi phân vị tăng dần tại X trung bình
Nguồn: tác giả tính toán từ số liệu mô phỏng
b.6 Ước lượng của hồi quy phân vị là ước lượng M-estimator
Ước lượng M-estimator được đề cập lần đầu tiên trong kết quả nghiên cứu của
Gouriéroux và Monfort (2008) Giả sử xét một mô hình tham số hoặc bán tham số với tham số và các quan sát (X y i, i i)1, ,n , một ước lượng được gọi là M- estimator của một hàm g( ) nếu ước lượng đó là lời giải của bài toán cực trị
Một M-estimator của một hàm được chứng minh là luôn hội tụ
về giá trị đúng của hàm số đó nếu thỏa mãn các điều kiện chính quy (regularity conditions)
+ Các cặp quan sát (X y là i.i.d (identical independent distribution- độc i, )i
lập và có cùng phân phối)
+ g( ) là một tập mở
X trung binh = 9,9524
q10 q25 q50 q75 q90
Trang 21+ là một hàm liên tục theo g, kỳ vọng có điều kiện của theo các giá trị thực của ( , )X y luôn tồn tại với mọi g
y X g
n
là hội tụ hầu chắc theo trên ( )g về E E X o( ,y X g i i, )
+ Lời giải duy nhất của bài toán cực trị là 0
0
( )
g g trong đó 0là tham số của hàm phân phối “đúng”
Trong bài toán hồi quy phân vị, ước lượng ˆ
là lời giải bài toán cực tiểu (1.17), vì thế ˆ
có thể coi là một M-estimator và khi mô hình hồi quy phân vị thỏa
mãn các điều kiện chính quy thì nó cũng hội tụ về giá trị đúng của tham số hồi quy cần tìm
b.7 Ước lượng của hồi quy phân vị có thể xem là xấp xỉ của ước lượng GMM (General Method of Moment)
Theo Buchinsky (1998b), ước lượng thu được từ (1.13) của hồi quy phân vị
có thể xem là xấp xỉ của một ước lượng GMM Điều này có thế được từ điều kiện cần (F.O.C – first order condition) để hàm số V() đạt cực trị:
Trang 22 , thì F Y X| (X i) phải bằng sao cho E m (, ,y X i i)0
Khi đó, các ước lượng tham số của hàm hồi quy phân vị tại phân vị có thể được xác định bằng phương pháp GMM với hàm kỳ vọng [ ( , , )] 0E m y X i i (1.32) Theo Buchinsky (1998), với hàm moment như trên, ta có
Trang 23Nếu không có hiện tượng phương sai thay đổi, hàm mật độ của sai số i độc lập với
i
h f
b.8 Tính vững (consistency)
Dựa vào (1.32) cho thấy ước lượng của hồi quy phân vị xấp xỉ một ước lượng GMM nên mang tính vững - vốn đã được chứng minh luôn xảy ra với các ước lượng của GMM (theo Green (2011))
c Kiểm định giả thuyết thống kê với hồi quy phân vị
Trong tài liệu về hồi quy phân vị của Koenker (2005), những suy diễn thống
kê liên quan đến kiểm định hệ số hồi quy của hồi quy phân vị cũng được chứng minh
và áp dụng giống như phương pháp OLS Những kiểm định được Koenker (2005) đề xuất gồm kiểm định Wald6 và kiểm định Likelihood ratio7
Trang 24Dưới giả thiết H 0
c.2 Kiểm định Likelihood ratio
Koenker & Machado (1999) cũng đã chứng minh được rằng giả thuyết
Hàm hợp lý likelihood trong trường hợp này là
d Ưu điểm và nhược điểm của hồi quy phân vị
Sau khi Koenker và Bassett (1978) giới thiệu mô hình hồi quy phân vị đầu tiên, rất nhiều các nghiên cứu được thực hiện sau đó nhằm khắc phục các nhược điểm,
Trang 25đồng thời mở rộng hồi quy phân vị Ngày càng có nhiều các bài nghiên cứu ứng dụng hồi quy được thực hiện và công bố, cho thấy hồi quy phân vị đang ngày càng được hoàn thiện và ngày càng trở thành công cụ đắc lực trong nghiên cứu kinh tế Theo Koenker (2005) và Hao & Naiman (2007), hồi quy phân vị có những ưu điểm như sau
Ưu điểm
- Thứ nhất, phương pháp hồi quy phân vị cho phép thể hiện một cách chi tiết về
mối quan hệ giữa biến phụ thuộc và các biến độc lập trên từng phân vị của biến phụ thuộc, không phải chỉ xét mối quan hệ này trên giá trị trung bình như hồi quy OLS Ưu điểm này thể hiện rõ trong Hình 1 1 Trong đó, Hình 1 1 thể hiện nhiều hàm hồi quy cho nhiều phân vị, cho thấy tác động khác nhau của biến độc lập X ứng với nhiều phân vị của biến phụ thuộc Y
- Thứ hai, mặc dù các tính toán thực hiện trong hồi quy phân vị là phức tạp và
khối lượng tính toán nhiều hơn trong OLS, nhưng với sự phát triển của toán học, thống kê học cộng với sự hỗ trợ của công nghệ thông tin thì những tính toán như quy hoạch tuyến tính, bootstrap, được thực hiện rất dễ dàng và nhanh chóng
- Thứ ba, trong hồi quy OLS, các quan sát bất thường (outliers) thường được loại
bỏ để ước lượng OLS không bị chệch Trong khi đó, hồi quy phân vị có tính ổn
định (robustness), không bị ảnh hưởng bởi sự hiện diện của các quan sát bất
thường đó
- Thứ tư, các kiểm định về tham số của hồi quy phân vị không dựa vào tính
chuẩn của sai số Hơn nữa, các kiểm định này không dựa trên bất kỳ một giả định nào về dạng phân phối của sai số hồi quy
- Thứ năm, hồi quy phân vị đặc biệt phù hợp khi phân tích trên mô hình hồi quy
có sự hiện diện của phương sai thay đổi hoặc trong mẫu số liệu mà hàm phân phối của biến phụ thuộc bất đối xứng quanh giá trị trung bình Khi đó, hàm hồi
Trang 26động không giống nhau của biến độc lập đến biến phụ thuộc ở những phân vị khác nhau
Nhược điểm của hồi quy phân vị
Bên cạnh các ưu điểm đã được nêu trên, hồi quy phân vị vẫn còn một số nhược điểm như sau:
- Một là, các tính toán trong hồi quy phân vị phức tạp hơn so với OLS Ví dụ như
trong OLS, muốn tìm ước lượng tham số hồi quy sao cho tổng bình phương sai
số là nhỏ nhất thì có thể áp dụng các công thức tìm cực trị của giải tích toán học như lấy đạo hàm riêng và giải hệ phương trình ứng với điều kiện cần của cực trị Trong khi đó, ước lượng tham số của hồi quy phân vị thực hiện thông qua việc giải bài toán quy hoạch tuyến tính Việc này sẽ khó khăn nếu không có sự
hỗ trợ của máy tính
- Hai là, phải thực hiện nhiều hàm hồi quy trên nhiều phân vị mới cho thấy được
toàn diện sự tác động của biến độc lập đến biến phụ thuộc thay vì chỉ có một hàm hồi quy trung bình có điều kiện trong OLS
- Ba là, việc áp dụng hồi quy phân vị cho các dạng hàm phi tuyến còn khá hạn
chế Các lý thuyết để xử lý tự tương quan hoặc nội sinh trong hồi quy phân vị còn chưa được phát triển hoàn thiện
1.2.1 Tính chệch của ước lượng do chọn mẫu khi xây dựng hàm tiền lương và
phương pháp hiệu chỉnh tính chệch do chọn mẫu
Sau khi hồi quy phân vị được Koenker & Bassett giới thiệu năm 1978, rất nhiều nghiên cứu đã ứng dụng hồi quy phân vị trong xây dựng hàm tiền lương cho các quốc gia trên thế giới Tuy nhiên, vấn đề xây dựng hàm tiền lương bằng hồi quy có thể đối mặt với khó khăn về vấn đề chọn mẫu do ước lượng Các hàm tiền lương xây dựng bằng hồi quy phân vị cũng không tránh khỏi những khó khăn này
Trang 27a Tính chệch do chọn mẫu (Sample selection bias)
Heckman (1979) trong một bài báo nổi tiếng của mình đã chỉ ra rằng, việc ước lượng hàm tiền lương dựa trên việc chọn mẫu chỉ lấy số liệu ở những người có việc làm và được nhận lương mà bỏ qua những người lao động không tham gia làm việc
sẽ làm cho ước lượng bình phương nhỏ nhất thu được bị chệch (biased) và không vững (inconsistent) Heckman gọi đó là tính chệch do vấn đề chọn mẫu (Sample selection bias)
Giả sử hàm tiền lương cần ước lượng có dạng tuyến tính
Y ký hiệu cho biến tiền lương tiềm năng (potential wage) Đây là
mức tiền lương tối thiểu mà người lao động thứ i mong muốn để làm một công việc nào đó Với những mức lương nhỏ hơn mức lương tiềm năng này, người lao động sẽ chấp nhận thất nghiệp thay vì đi làm Việc một người quyết định nhận một công việc hay thất nghiệp có thể được xây dựng thành một hàm lựa chọn như sau:
i
D D
Việc lựa chọn này phụ thuộc vào các yếu tố thể hiện trong Z i Z được giả định i
là chứa tất cả các biến trong X i và thêm một vài yếu tố khác ε i là sai số của hàm lựa chọn Số liệu của Z (vì vậy, của X i i) là thu thập được, không phân biệt là người đó có công việc hay không Chúng ta không thể quan sát được mức lương tiềm năng Y i*,
chúng ta chỉ có thể biết được rằng khi người lao động quyết định đi làm, tức D i = 1, thì mức lương tiềm năng được thể hiện ra chính là mức lương thực tế Y i mà người lao động nhận được
Trang 28Hệ số tương quan giữa u và là u,
và khi đó, hiệp phương sai giữa u và là u u, tức là Cov u( , ) E u( i i ) u u (1.42) Trong các nghiên cứu thông thường, mẫu chỉ được chọn ứng với D i 1.
Lấy kỳ vọng có điều kiện ở cả hai vế của phương trình (1.40), ta có
Vì u, độc lập với X Z, nên phương trình (1.44) có thể được viết lại
( |i i 1, i) i ( |i i i )
Nếu uvà không tương quan (u 0) thì E u( |i i Z i) 0 , và do đó ước lượng thu được bằng OLS của phương trình (1.40) vẫn là ước lượng không chệch và vững Tuy nhiên, do u và có thể tương quan với nhau (u 0) nên
E u Z , khi đó ước lượng sẽ bị chệch và không còn là ước lượng vững
nữa Sự chệch này là do vấn đề chọn mẫu gây ra, gọi là hiện tượng ước lượng bị chệch do chọn mẫu
Nếu chỉ thu thập số liệu ở những người lao động có đi làm và được nhận lương thì hàm tiền lương ước lượng được không phản ánh đúng hàm tiền lương của tổng thể Vì trong tổng thể có cả những người lao động không đi làm và không nhận lương Họ không làm việc vì họ được trả lương thấp hơn mức lương tiềm năng *
i
Trang 29thậm chí họ có thể đạt được mức lương cao hơn những lao động quan sát được trong mẫu có cùng giá trị các biến độc lập như họ Việc bỏ qua nhóm lao động này sẽ làm cho ước lượng tham số hồi quy thu được từ mẫu bị chệch và phản ánh sai mức độ tác động các yếu tố trong Xi đến tiền lương Yi
b Hiệu chỉnh tính chệch do chọn mẫu - Thủ tục Heckman hai bước
Từ các phân tích như trên, Heckman (1979) xem sự xuất hiện của
E u Z trong phương trình (1.45) gây ra tình trạng ước lượng chệch và không vững Sự xuất hiện của thành phần này làm cho hàm hồi quy tiền lương ban đầu giống như đã bỏ sót một yếu tố quan trọng Sự bỏ sót biến này gây ra hiện tượng nội sinh cho mô hình Do vậy, ước lượng thu được nếu chỉ hồi quy trên số liệu những quan sát có tiền lương sẽ bị chệch
Để khắc phục trường hợp này, Heckman (1979) đề xuất khắc phục bằng cách lượng hóa yếu tố bị bỏ sót và đưa biến này vào mô hình Theo Green (2011),
E u Z có thể được ước lượng thông qua tỷ lệ Mills nghịch đảo8 Tỷ lệ Mills nghịch đảo, được đặt theo tên của John P Mills, cho biết tỷ lệ giữa hàm mật độ xác suất so với hàm phân phối tích lũy của một đ.l.n.n; tỷ lệ này được xây dựng dựa trên tính chất sau đây của hàm phân phối chuẩn:
u Mills ratio
trong đó (.) là hàm mật độ xác suất Gauss,
(.) là hàm phân phối của phân phối Gauss
Trang 30i thỏa mãn các giả thiết hồi quy cổ điển
Trong phương trình (1.49), số hạng ( Zi ) đóng vai trò như là biến bị bỏ sót, được
bổ sung vào mô hình Vì biến bỏ sót đã được đưa vào mô hình tiền lương nên ước
lượng β thu được khi hồi quy theo (1.49) sẽ là ước lượng không chệch
Từ các bước lập luận như trên, Heckman(1979) đề xuất thủ tục hồi quy hiệu chỉnh chệch do chọn mẫu theo hai bước theo đề xuất của Heckman được thực hiện như sau:
- Bước 1: Ước lượng hồi quy probit với biến phụ thuộc
i
D được định nghĩa ở phương trình (1.41) để thu được ước lượng ˆ của Với mỗi
quan sát trong mẫu, tính tỷ lệ Mills với công thức ˆ ( ˆ)
ˆ
i i
i
Z Z
- Bước 2: Hồi quy Yi theo X và ˆ theo phương trình (1.49) bằng OLS
để thu được ước lượng không chệch của
Với việc phát hiện tính chệch của ước lượng do vấn đề chọn mẫu và đề xuất thủ tục hiệu chỉnh tính chệch này, Heckman đã được trao giải Nobel về kinh tế năm
2000 Tuy nhiên, Cosslett(1991), Gallant & Nychka (1987), Powell (1987), Klein & Spady(1993) và Newey (1991) chỉ ra rằng, thủ tục hai bước của Heckman sẽ cho ước
lượng không vững nếu các sai số u
Trang 31có phân phối chuẩn và từ đó để xuất phương pháp ước lượng bán tham số
(semiparametric) trong khắc phục tính chệch do chọn mẫu Bên cạnh đó, Donald
(1995) chỉ ra rằng hiện tượng phương sai thay đổi nếu hiện diện trong hàm tiền lương cũng ảnh hưởng đến kết quả thu được từ thủ tục Heckman và đề xuất thủ tục hiệu chỉnh tính chệch do chọn mẫu trong điều kiện có phương sai thay đổi, nhưng
Donald lại giữ nguyên giả định về phân phối chuẩn của u i , ε i Chen & Khan (2003)
đề xuất thủ tục hiệu chỉnh tính chệch trong trường hợp giả thuyết về tính chuẩn không được đảm bảo và có hiện tượng phương sai thay đổi
Phương pháp hiệu chỉnh sai số theo Buchinsky (1998) trong hồi quy phân vị
Buchinsky (1998a và 2001) là người đầu tiên đề xuất việc hiệu chỉnh tính chệch
do chọn mẫu đối với phương pháp hồi quy phân vị cũng bằng một thủ tục gồm hai bước Phương pháp này cũng dựa trên những ý tưởng của Heckman (1979) nhưng có
hai điểm khác biệt lớn Thứ nhất, thay vì chỉ hiệu chỉnh tính chệch cho hàm tiền
lương trung bình với phương pháp OLS như Heckman đề xuất, phương pháp của Buchinsky hiệu chỉnh tính chệch cho ước lượng hồi quy theo phương pháp hồi quy
phân vị Thứ hai, thủ tục do Buchinsky đề xuất không có giả thiết về phương sai
không đổi Hai bước trong phương pháp của Buchinsky như sau:
- Bước 1: Buchinsky thực hiện ước lượng hàm lựa chọn (1.41) bằng hàm probit
theo phương pháp do Ichimura (1993) đề xuất
- Bước 2, Xây dựng số hạng dùng để hiệu chỉnh tính chệch do chọn mẫu, ước
lượng và xây dựng phương pháp ước lượng hiệu chỉnh tính chệch đối với hàm hồi quy trên từng phân vị Buchinsky xây dựng số hạng hiệu chỉnh chênh lệch trong hàm tiền lương,P Z i , dưới dạng một đa thức và đưa số hạng này vào hàm hồi quy phân vị
Q Y X D( |i i, i 1) Xi ( P Zi ).
Phương pháp của Buchinsky (1998a) vẫn còn phụ thuộc vào giả định tính chuẩn của sai số Để cải tiến phương pháp của Buchinsky (1998a), trong việc nới lỏng giả
Trang 32thiết về tính chuẩn của sai số, Coelho et al (2007), Huber & Melly(2011) sử dụng phương pháp ước lượng bán tham số của Klein & Spady (1993) trong bước 1 để hồi quy hàm lựa chọn, tìm được ước lượng tham số trong hàm lựa chọn và đưa vào tính toán hệ số hồi quy hiệu chỉnh sai số ở bước 2
1.2.2 Vấn đề nội sinh và phương pháp hồi quy phân vị hai bước (two - stage
quantile regression)
Vấn đề nội sinh là một vấn đề quan trọng trong hồi quy vì nó liên quan đến tính vững của hệ số hồi quy nhận được ước lượng Ameniya (1982) là người đầu tiên xem xét đến hiện tượng nội sinh đối với hồi quy phân vị Tuy nhiên, Ameniya chỉ mới xét đến hiện tượng nội sinh hàm hồi quy trung vị, tức là hàm hồi quy ứng với phân vị τ = 0,5 Những nghiên cứu tiếp theo của Powell (1983) và Chen & Portnoy(1996) cũng mở rộng hướng tiếp cận của Ameniya (1982) Powell (1983) đề
xuất phương pháp trị tuyệt đối nhỏ nhất hai giai đoạn (DSLAD – Double stage least absolute deviations) để ước lượng hàm hồi quy phân vị 0,5 trong trường hợp biến
độc lập bị nội sinh Powell (1983) đề xuất phương pháp hồi quy phân vị hai giai
đoạn (DSQR – Double Stage Quantile Regression), không phải chỉ xét trên phân vị
0,5 mà mở rộng ra trên tất cả các phân vị của biến phụ thuộc Mở rộng phương pháp của Powell (1983), Kim T & Muller C (2004) đề xuất khắc phục nội sinh của hồi quy phân vị bằng cách dùng hồi quy phân vị hai giai đoạn với cả hai giai đoạn đều được ước lượng bằng phương pháp hồi quy phân vị
Giả sử hàm hồi quy có dạng Y X1 0 X2 0 u ,
trong đó X 1 là ma trận cấp n g gồm số liệu của g biến độc lập nội sinh trong
mô hình hồi quy; X 2 là ma trận cấp n k 1, gồm số liệu của k 1 biến ngoại sinh Giả sử tìm được k 2 biến công cụ, số liệu của các biến công cụ này được thể hiện trong ma trận Z có cấpn k 2 Hiện tượng nội sinh xảy ra trong mô hình làm cho
1
Trang 33biến nội sinh trong X 1 có thể được biểu diễn quan các biến công cụ và các biến ngoại
sinh như sau
*
X Z V trong đó Z*[X2 Z] là ma trận cấp n k với k k1 k2,
Z là số liệu của biến phụ thuộc và các biến độc lập cũng như biến
công cụ ở quan sát thứ i; q là hằng số dương được chọn bởi người nghiên cứu; ˆ và ˆ
j
là các ước lượng thu thập được từ giai đoạn 1 của hồi quy phân vị hai giai đoạn Các ước lượng của giai đoạn 1 này cũng được ước lượng bằng phương pháp hồi quy phân vị, nghĩa là, ˆ và ˆ
j
cũng là lời giải của các bài toán cực trị
* 1
Trang 34Việc viết lại công thức của biến phụ thuộc y dưới dạng qY i (1 q Z) i*ˆ đã được Ameniya (1982) sử dụng như là một tính chất của 2SLS và là một trong các hướng cải thiện tính hiệu quả của ước lượng
Kim T & Muller C (2004) cũng dùng phương pháp mô phỏng Monte Carlo
để khảo sát tính chất của các ước lượng thu được từ DSQR Kết quả kiểm định cho thấy các tính chất tiệm cận chuẩn, tính tiệm cận vững và tính ổn định của ước lượng
DSQR với bước 1 thực hiện bằng QR luôn được đảm bảo
Năm 2009, mở rộng nghiên cứu của Kim T & Muller C, một nhóm các tác giả khác là Chevapatrakul và các cộng sự (2009) cũng đề xuất phương pháp 2SQR
(two-stage quantile regression) để xử lý nội sinh đối với hồi quy phân vị Theo
phương pháp của Chevapatrakul, ở bước 1, biến độc lập nội sinh được hồi quy theo các biến công cụ bằng phương pháp bình phương nhỏ nhất rồi tính ra giá trị ước lượng cho các biến nội sinh này Trong bước 2, biến phụ thuộc được hồi quy theo các biến độc lập ngoại sinh và giá trị ước lượng của các biến nội sinh đã tính toán ở bước 1
1.3 Phương pháp phân rã chênh lệch bằng hồi quy phân vị
Phương pháp phân rã chênh lệch bằng hồi quy phân vị được Machado - Mata (2005) phát triển từ phương pháp phân rã của Oaxaca – Blinder (1973) Theo Oaxaca – Blinder (1973), sự chênh lệch tiền lương giữa hai nhóm lao động nam và nữ có thể được phân tích thành hai phần chênh lệch: chênh lệch gây ra do sự khác biệt về các biến độc lập và chênh lệch gây ra do khác biệt về hệ số hồi quy giữa hai nhóm Để
mô hình hóa hai phần chênh lệch này, Oaxaca – Blinder (1973) xây dựng hàm hồi quy như sau
Gọi T : số quan sát trong mẫu nghiên cứu,
k : số tham số,
Y : tiền lương của người lao động,
Y : tiền lương trung bình,
Trang 35X : ma trận n k bao gồm giá trị cụ thể của các yếu tố tác động đến tiền lương,
X : Ma trận k1 các giá trị trung bình của các yếu tố trong X ,
: Vectơ là ước lượng của
Giả sử hàm hồi quy tiền lương tuyến tính Y X u.
Khi đó, hàm hồi quy mẫu có dạng Y Xˆe.
Hàm hồi quy tuyến tính tại giá trị trung bình Y Xˆ.
Giả sử cần phân tích chênh lệch tiền lương giữa nhóm lao động nam (m) và nhóm lao động nữ (f) Khi đó hàm hồi quy tiền lương trung bình giữa 2 nhóm như sau:
số nghiên cứu khác thì phần chênh lệch chưa được giải thích này được xem như là
Trang 36Xét hàm hồi quy Y f0 Xfˆ m (1.54) Hàm (1.54) được gọi là hàm hồi quy tiền lương trung bình khi không có sự phân biệt đối xử đối với nữ giới Vì trong hàm hồi quy này lao động nữ được trả công như lao động nam, thể hiện qua việc sử dụng hàm hồi quy với đặc điểm lao động trung bình của nữ (X ) nhưng được trả lương với hệ số hồi quy của lao động f
f
Machado & Mata (2005) áp dụng kỹ thuật tương tự cho hàm hồi quy phân vị của tiền lương Giả sử hàm hồi quy phân vị phân vị ở phân vị ở nhóm lao động nam như sau
Y X và đặt Q Y X( m| m) Xm m và Q u( m| Xm) 0 (1.56) Hàm hồi quy phân vị tương ứng của nhóm lao động nữ là
Y X u trong đó Q Y( f |X f) Xff và Q u( f |X f)0 (1.57) Gọi Q Y( f |X m) X mf là hàm hồi quy phân vị tiền lương đối chứng được xây dựng
Trang 37nam Khi đó, khoảng cách tiền lương giữa hai nhóm sẽ được Machado & Mata (2005) phân rã thành hai nhóm như sau
Số hạng Q Y( m|X m) Q Y( f |X m) trong ngoặc vuông thứ nhất ở vế phải cho biết phần chênh lệch tiền lương gây ra bởi sự chênh lệch trong hệ số hồi quy phân vị, trong khi số hạng thứ hai Q Y( f |X m) Q Y( f |X f) cho biết phần chênh lệch tiền lương ở phân vị đang xét gây ra bởi chênh lệch về đặc điểm giữa hai nhóm lao động
1.4 Sự phù hợp của hồi quy phân vị với các nghiên cứu về chênh lệch tiền lương
Theo Hao & Naiman (2007), hồi quy phân vị đặc biệt phù hợp với việc nghiên cứu chênh lệch tiền lương9, vì những lý do như sau:
Một là, trong nội dung nghiên cứu về chênh lệch tiền lương, ngoài yêu cầu
phân tích chênh lệch tiền lương trung bình, các nhà nghiên cứu còn cần chú ý phân tích chênh lệch tiền lương trung bình ở nhóm tiền lương thấp, nhóm tiền lương cao
và các nhóm khác từ thấp đến cao Do đó, có thể vận dụng hồi quy phân vị ứng với các phân vị khác nhau để cho thấy mức độ chênh lệch theo từng nhóm tiền lương
Hai là, hàm phân phối của biến tiền lương thường là hàm phân phối bất cân xứng, có dạng phân phối nặng đuôi (heavy – tailed), là điển hình của mẫu số liệu bị
hiện tượng phương sai thay đổi Phương pháp hồi quy phân vị thích hợp với các mẫu
số liệu có hiện diện hiện tượng phương sai thay đổi vì phương pháp này không những cho thấy tác động theo vị trí mà còn phân tích tác động theo quy mô của hàm phân phối
Ba là, phương pháp hồi quy phân vị có thể thực hiện tại một mức phân vị bất
kỳ (0,1) Vì vậy, nếu có một nghiên cứu kinh tế hay một lý thuyết kinh tế nào đó công bố thông tin về bất bình đẳng tại một phân vị cụ thể nào đó, thì nhà nghiên cứu
Trang 38có thể thực hiện hồi quy tại phân vị tương ứng để phân tích Ví dụ, trong nghiên cứu
về tình trạng đói nghèo tại Việt Nam cho thấy tỷ lệ hộ nghèo ở Việt Nam năm 2010
là 9,45% (theo Tổng cục Thống kê), khi thực hiện hồi quy phân vị có thể tiến hành hồi quy theo phân vị tương ứng với tỷ lệ này để có những kết luận phù hợp Đây là điều không thể thực hiện được nếu dùng OLS
Bốn là, phương pháp hồi quy phân vị về tiền lương có thể được thực hiện đối
với nhiều phân vị (cách nhau 5% hoặc 1%) Do đó, có thể thấy được tác động của các yếu tố đến tiền lương ở từng phân vị khác nhau sẽ khác nhau như thế nào Ứng với mỗi nhóm phân vị khác nhau có thể có những yếu tố tác động khác nhau Từ đó, nhà nghiêu cứu có thể đề xuất các chính sách, các giải pháp cho phù hợp
Năm là, các nghiên cứu về chênh lệch tiền lương, chênh lệch thu nhập, chênh
lệch mức sống cũng như các nghiên cứu về tình trạng bất bình đẳng trong xã hội thường ít dựa trên các mô hình mà dựa trên các chỉ tiêu đo lường sự bất bình đẳng như đường cong Lorenz, hệ số Gini, chỉ số Theil… Với các ưu điểm nêu trên, hồi quy phân vị được bổ sung vào kho công cụ để nghiên cứu sự bất bình đẳng như là một công cụ nghiên cứu thuận tiện và hiệu quả
Trang 39CHƯƠNG 2
TỔNG QUAN CÁC NGHIÊN CỨU VỀ
CHÊNH LỆCH TIỀN LƯƠNG
TRÊN THẾ GIỚI
2.1.1 Những nghiên cứu về chênh lệch tiền lương trước khi hồi quy phân vị
được áp dụng vào phân tích tiền lương
Các nghiên cứu về sự chênh lệch tiền lương trên thế giới được bắt đầu từ những năm hai mươi của thế kỷ trước, thông qua công trình nghiên cứu của Edgewort (1922) Tuy nhiên, chủ đề này thực sự được quan tâm từ sau những nghiên cứu được công bố vào những năm 1950, đặc biệt là sau nghiên cứu của Becker (1957) Vào thời điểm này, những nghiên cứu đầu tiên về sự chênh lệch tiền lương giữa các ngành công nghiệp được công bố bởi rất nhiều nhà kinh tế học hàn lâm Một trong những bài nghiên cứu đầu tiên của Dunlop (1957) đã xác định sự tồn tại của chênh lệch tiền lương giữa các ngành Ông cũng đã minh chứng bằng sự chênh lệch rất lớn trong tiền lương trung bình (theo giờ) của những người công nhân lái xe tải với mức chênh lệch cao nhất là 2,25USD và thấp nhất là 1,25USD tùy theo từng ngành công nghiệp
Những nghiên cứu sơ khởi này không những chỉ ra sự tồn tại của vấn đề chênh lệch tiền lương mà còn cung cấp một mô hình nghiên cứu chênh lệch tiền lương ở những dạng sơ khai Slichter (1950) tìm thấy mối tương quan cao giữa nghề nghiệp và sự chênh lệch tiền lương, đã tồn tại ổn định nhiều năm trong nền kinh tế Hoa Kỳ Sự ổn định trong cấu trúc tiền lương của Hoa Kỳ cũng tiếp tục được nghiên cứu bởi Cullen (1956) Những nghiên cứu giai đoạn đầu này chú trọng xem xét hàm cầu trên thị trường lao động và tập trung vào việc phân tích ảnh hưởng của những đặc thù ngành công nghiệp đến cấu trúc tiền lương Các nghiên cứu về chênh lệch
Trang 40tiền lương trong suốt những năm 60 và đầu những năm 70 cũng được thực hiện theo cùng hướng như vậy Nghiên cứu của Thomas và các cộng sự (1967) tập trung vào ước lượng tác động của các đặc thù ngành (như lợi nhuận, mức độ chiếm lĩnh thị trường, tỷ lệ tham gia công đoàn, quy mô công ty…) đến sự chênh lệch trong mức tiền lương trung bình Trong suốt những năm 70, sự phát triển của các mô hình về vốn con người làm cho các nghiên cứu trở nên hướng về khía cạnh hàm cung Vô số các nghiên cứu phân tích tầm quan trọng của kỹ năng nghề nghiệp cá nhân, kinh nghiệm và các biến số về vốn con người trong việc xác định tiền lương
Sự phát triển của các mô hình về vốn con người và sự phát triển của các công
cụ phân tích số liệu làm sản sinh ra một loạt các nghiên cứu mới về sự khác biệt tiền lương trong suốt những năm 70 và 80 Những nghiên cứu này sử dụng tiền lương
làm biến phụ thuộc, kiểm định mức ý nghĩa của hệ số góc của các biến độc lập trong
phương trình tiền lương bao gồm cả sự khác nhau về những đặc điểm cá nhân của người lao động Ví dụ, Dalton & Ford (1977) và Long & Link (1983) phát hiện ra rằng sức mạnh thị trường (được đo lường bằng biến mức độ chiếm lĩnh thị trường) là tương quan dương với mức tiền lương trung bình tại doanh nghiệp Freeman và Medoff (1981) đã tìm ra rằng quy mô trung bình của công ty làm tăng tiền lương trung bình của cả hai nhóm công nhân có tham gia và không tham gia công đoàn Dunn (1986) cũng khẳng định sự tương quan dương giữa quy mô công ty và tiền lương trung bình Tuy nhiên, các nghiên cứu tập trung vào mối quan hệ giữa sự khác biệt tiền lương và các đặc trưng ngành đã không đưa ra được các mô hình nghiên cứu để giải thích kết quả một cách thuyết phục và rõ ràng
Mặc dù vậy, ở một mức độ nào đó, các nhà nghiên cứu cũng đã nêu được mối quan hệ giữa tiền lương và những đặc trưng của ngành Nói tóm lại, những nghiên cứu này chứng tỏ rằng, trong nền kinh tế Hoa Kỳ, công nhân làm việc trong những hãng lớn có xu hướng nhận được mức tiền lương cao hơn Đồng thời, năng lực tài chính của doanh nghiệp cũng tác động làm tăng đến sự chênh lệch tiền lương Ngoài
ra, tỷ lệ gia nhập công đoàn cũng cho thấy một tác động nhất định đến tiền lương trung bình Trong một vài nghiên cứu khác, Dickens & Katz (1987) lại cho thấy tỷ lệ