Vì vậy mục đích của luận văn tập trung vào nghiên cứu nguyên lý tạo ảnh 3D từ các ảnh 2D theo kỹ thuật bóc tách ảnh, trộn ảnh, các nguyên lý hình học chiếu về phương diện toán học khi bi
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
Người hướng dẫn khoa hoc
PGS.TS PHAN TRUNG HUY
HÀ NỘI – 2013
Trang 2MỤC LỤC
LỜI CẢM ƠN 4
PHẦN MỞ ĐẦU 5
1 ĐẶT VẤN ĐỀ 5
2 MỤC ĐÍCH CỦA LUẬN VĂN 6
3 NHỮNG ĐÓNG GÓP CỦA LUẬN VĂN 6
CHƯƠNG 1 TỔNG QUAN VỀ ẢNH SỐ 7
1.1 Khái niệm ảnh số 7
1.2 Biểu diễn ảnh 7
1.3 Qui trình tạo ảnh số 9
1.4 Một số tính chất 10
1.5 Thành phần màu của điểm ảnh 15
1.6 Phân loại ảnh 16
1.7 Một số kỹ thuật nâng cao chất lượng ảnh 17
CHƯƠNG 2 MỘT SỐ KỸ THUẬT TẠO ẢNH 3D 24
2.1 Lược sử các loại ảnh 3D 24
2.2 Khái niệm ảnh nổi 3D 26
2.3 Vai trò ảnh 3D trong giáo dục 28
2.4 Nguyên lý 3D 29
2.5 Các bước dựng ảnh 3D anaglyph 40
2.6 Một số kỹ thuật dựng ảnh 3D anaglyph 46
2.7 Một số thuật toán vẽ hình cơ bản 51
2.8 Một số phép biến đổi hình 56
Trang 32.9 Một số công cụ dựng hình 59
CHƯƠNG 3 XÂY DỰNG PHẦN MỀM 62
3.1 Định dạng ảnh BMP 62
3.2 Sơ đồ hoạt động của hệ thống 66
3.3 Thuật toán ghép hai ảnh 66
3.4 Giao diện của phần mềm 67
KẾT LUẬN 68
TÀI LIỆU THAM KHẢO 69
PHỤ LỤC 1 70
Trang 4Lời cảm ơn
Lời đầu tiên, em xin bày tỏ lòng biết ơn chân thành, sâu sắc đến PGS.TS.Phan Trung Huy, người đã tận tình chỉ bảo, hướng dẫn, cung cấp tài liệu để luận văn này được hoàn thành
Em cũng xin gửi lời cảm ơn đến các thầy cô đã tận tình giảng dạy trong lớp cao học Toán Tin Ứng Dụng tại Hà Tĩnh khoá 2011-2013 Trong quá trình làm luận văn, em đã gặp phải nhiều điều kiện khó khăn về môi trường làm việc và hướng tiếp cận vấn đề, tuy nhiên được sự chỉ bảo nhiệt tình của PGS.TS Phan Trung Huy, em
đã từng bước giải quyết được các khó khăn gặp phải
Bên cạnh đó, em cũng xin gửi lời cảm ơn đến các thành viên trong lớp cao học, đã có nhiều sự giúp đỡ lẫn nhau trong học tập, đoàn kết, tạo một môi trường thân thiện và nghiên cứu tốt
Em cũng xin chân thành cảm ơn các thầy cô, những người điều hành Viện Đào tạo Sau đại học, Đại học Bách Khoa Hà Nội đã tạo ra môi trường học tập và nghiên cứu tốt
Cuối cùng em xin gửi lời cảm ơn đến gia đình, bạn bè, những người thân yêu
đã luôn bên cạnh động viên khuyến khích em trong quá trình thực hiện đề tài nghiên
cứu của mình
Học viên Nguyễn Thị Lan Hương Lớp 11ATOANHT
Trang 5PHẦN MỞ ĐẦU
1 ĐẶT VẤN ĐỀ
Khoa học kỹ thuật phát triển mang lại cho con người những ứng dụng công nghệ mới hiện đại Trong đó công nghệ ảnh số đang ngày càng phát triển Tuy nhiên việc ứng dụng công nghệ ảnh số vào các lĩnh vực khoa học, giáo dục như ở Việt Nam vẫn còn có những hạn chế chưa khai thác được hết các mặt mạnh của nó
Xử lý ảnh được đưa vào giảng dạy ở các trường đại học trong nước ta khoảng chục năm nay Nó là môn học liên quan nhiều đến nhiều lĩnh vực và cần nhiều kiến thức
cơ sở khác Đầu tiên phải kể đến Xử lý tín hiệu số là một môn học hết sức cơ bản cho xử lý tín hiệu chung, các khái niệm về tích chập, các phép biến đổi Fourier, biến đổi Laplace, các bộ lọc hữu hạn… Thứ hai, các công cụ toán như: Đại số tuyến tính, Xác suất, thống kê Một số kiến thức cần thiết như Trí tuệ nhân tạo, mạng Neuron nhân tạo cũng được đề cập đến trong quá trình phân tích và nhận dạng ảnh Hiện nay, ảnh số là loại ảnh được quan tâm và xử lý nhiều nhất vì nó quá thông dụng và tiện lợi trong việc truyền tải, xử lý, lưu trữ và hiển thị Việc nâng cao chất lượng ảnh không chỉ chú trọng đến việc cải thiện kích thước, bộ nhớ, độ nét, trung thực mà còn liên quan đến việc nhìn và cảm nhận hình ảnh trực quan sinh động như thật
Do đó, sự ra đời của công nghệ 3D đã mở ra một hướng nghiên cứu mới Mặc dù xây dựng ảnh 3D có ý nghĩa rất quan trọng trong các lĩnh vực khoa học kỹ thuật như là: việc xây dựng các mô hình, các động cơ máy…cũng như trong giáo dục khi giảng dạy bộ môn hình học không gian đòi hỏi học sinh phải có một cái nhìn trực quan trong không gian 3 chiều 3D đang dần đi vào cuộc sống (từ giải trí, y tế, cho tới truyền thông hay các lĩnh vực khoa học chuyên biệt,v.v ) nhưng không nhiều người có được hiểu biết tường tận về nó
Trang 62 MỤC ĐÍCH CỦA LUẬN VĂN
Công nghệ ảnh 3D có ý nghĩa thiết thực trong cuộc sống Trong tương lai sẽ được ứng dụng rộng rãi vào các lĩnh vực của đời sống xã hội
Vì vậy mục đích của luận văn tập trung vào nghiên cứu nguyên lý tạo ảnh 3D từ các ảnh 2D theo kỹ thuật bóc tách ảnh, trộn ảnh, các nguyên lý hình học chiếu về phương diện toán học khi biểu diễn ảnh 3D theo các góc nhìn của mắt trái và mắt phải khác nhau Trên cơ sở đó xây dựng kỹ thuật Anaglyph tạo ảnh màu 3D, ảnh đa cấp xám 3D từ hai ảnh khác nhau được quan sát từ mắt trái và mắt phải (nhận được bằng máy ảnh hay bằng một chương trình phần mềm) khi sử dụng các cặp kính lọc màu khác nhau cho hai mắt của người xem như: Red – Cyan, Green – Blue…
3 NHỮNG ĐÓNG GÓP CỦA LUẬN VĂN
Luận văn cung cấp cho người dùng cái nhìn tổng thể về quy trình xử lý ảnh
số Cũng như lược sử của công nghệ 3D;
Luận văn trình bày nguyên lý tạo độ nổi khi xây dựng ảnh 3D;
Trình bày các kỹ thuật tạo ảnh nổi 3D anaglyph;
Giới thiệu các công cụ được sử dụng trong quá trình tạo ảnh;
Xây dựng phần mềm tạo ảnh 3D analyph hỗ trợ các thao tác trộn và dịch chuyển các ảnh thành phần
Trang 7Trên không gian hai chiều, ảnh số được biểu diễn như một ma trận Mỗi phần tử của
ma trận biểu diễn một điểm ảnh Vị trí của điểm ảnh được xác định thông qua chỉ số hàng và chỉ số cột, độ sáng và màu sắc được xem là giá trị của điểm ảnh chính là giá trị của phần tử trong ma trận
Ví dụ: Giá trị của ảnh đa cấp xám được biểu diễn từ 0 255
Giá trị của ảnh màu chia làm 3 vùng, mỗi vùng biểu diễn giá trị từ 0 255
1.2 Biểu diễn ảnh
Ảnh trên máy tính là kết quả thu nhận theo phương pháp số hoá được nhúng trong các thiết bị kỹ thuật khác nhau Quá trình lưu trữ ảnh nhằm 2 mục đích:
- Tiết kiệm bộ nhớ;
- Giảm thời gian xử lý;
Việc lưu trữ thông tin trong bộ nhớ ảnh có ảnh hưởng rất lớn đến việc hiển thị, in ấn
và xử lý ảnh được xem như là một tập hợp các điểm với cùng kích thước nếu sử dụng càng nhiều điểm thì bức ảnh càng đẹp, càng mịn và càng thể hiện rõ hơn chi tiết của ảnh người ta gọi đặc điểm này là độ phân giải
Việc lựa chọn độ phân giải phù hợp tuỳ thuộc vào nhu cầu sử dụng và đặc trưng của mỗi ảnh cụ thể, trên cơ sở đó các ảnh thường được biểu diễn theo 2 mô hình cơ bản sau:
Trang 81.2.1 Mô hình Raster
Đây là cách biểu diễn thông tin thông dụng nhất hiện nay, ảnh được biểu diễn dưới dạng ma trận các điểm (điểm ảnh) Thường thu nhận qua các thiết bị như Camara, Scanner Tuỳ theo yêu cầu thực tế mà mỗi điểm ảnh được biểu diễn qua 1 hay nhiều bít
Mô hình Raster thuận lợi cho hiển thị và in ấn Ngày nay công nghệ phần cứng cung cấp những thiết bị thu nhận ảnh Raster phù hợp với tốc độ nhanh và chất lượng cao cho cả đầu vào và đầu ra thuận lợi cho việc hiển thị trên môi trường Windows là Microsoft đưa ra khuôn dạng ảnh DIB (Device Independent Bitmap) làm trung gian Một trong những hướng nghiên cứa cơ bản trên mô hình hiển thị này là kỹ thuật nén ảnh Theo cách tiếp cận này người ta đã đề ra nhiều quy cách khác nhau như: BMP, TIF GIF…
Hiện nay trên thế giới có hơn 50 khuôn dạng ảnh thông dụng bao gồm cả trong kỹ thuật nén có khả năng phục hồi dưc liệu 100% và nén khả có khả năng phục hồi với sai số nhận được
Hình 1.1 Quá trình hiển thị, chỉnh sửa và lưu ảnh thông qua DIB
1.2.2 Mô hình Vector
Biểu diễn ảnh ngoài mục đích tiết kiệm không gian lưu trữ dễ dàng cho hiển thị và
in ấn còn đảm bảo dễ dàng cho việc sao chép di chuyển, tìm kiếm…Theo những yêu cầu này kỹ thuật biểu diễn Vector ưu việt hơn
Trang 9Trong mô hình Vector người ta sử dụng hướng giữa các Vector của điểm ảnh lân cận để mã hoá và tái tạo ảnh ban đầu, ảnh Vector được thu nhận trực tiếp từ các thiết bị số hoá như Digital hoặc được chuyển đổi từ ảnh Raster thông qua các chương trình số hoá
Công nghệ phần cứng cung cấp những thiết bị xử lý với tốc độ nhanh và chất lượng cho cả đầu vào và ra nhưng lại chỉ hỗ trợ cho ảnh Raster
Do vậy, những nghiên cứu về biểu diễn Vector đều tập trung chuyển đổi từ ảnh Raster
Hình 1.2 Sự chuyển đổi giữa các mô hình biểu diễn
1.3 Qui trình tạo ảnh số
Đầu tiên, ảnh tự nhiên từ thế giới ngoài được thu nhận qua các thiết bị thu (như Camera, máy chụp ảnh) Trước đây, ảnh thu qua Camera là các ảnh tương tự (loại Camera ống kính kiểu CCIR) Gần đây, với sự phát triển của công nghệ ảnh màu hoặc ảnh đen trắng được lấy ra từ Camera, sau đó được chuyển trực tiếp thành ảnh
số theo sơ đồ sau:
Hình 1.3 Các bước cơ bản trong xử lý ảnh
hoá
Raster hoá
Trang 101.4 Một số tính chất
1.4.1 Điểm ảnh (Picture Element)
Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng Để xử lý bằng máy tính (số), ảnh cần phải được số hoá Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám) Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x, y).[4]
Như vậy: Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc màu nhất định Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật Mỗi phần tử trong ma trận được gọi là một phần
tử ảnh
1.4.2 Độ phân giải (Resolution)
- Định nghĩa: Độ phân giải của ảnh là mật độ điểm ảnh được ấn định trên một ảnh
số được hiển thị Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được phân bố theo trục x và y trong không gian hai chiều
- Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic Adaptor) là một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc * 200 điểm ảnh (320*200) Rõ ràng, cùng màn hình CGA 12” ta nhận thấy mịn hơn màn hình CGA 17” độ phân giải 320*200 Lý do: cùng một mật độ (độ phân giải) nhưng diện tích màn hình rộng hơn thì độ mịn (liên tục của các điểm) kém hơn
Trang 111.4.3 Mức xám của ảnh
Một điểm ảnh (pixel) có hai đặc trưng cơ bản là vị trí (x, y) của điểm ảnh và độ xám của nó Dưới đây chúng ta xem xét một số khái niệm và thuật ngữ thường dùng trong xử lý ảnh
- Định nghĩa: Mức xám của điểm ảnh là cường độ sáng của nó được gán bằng giá trị
số tại điểm đó
- Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (Mức 256 là mức phổ dụng Lý do: từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức xám: Mức xám dùng 1 byte biểu diễn: 28 = 256 mức, tức là từ 0 đến 255)
- Ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác) với mức xám
Trang 12
Gamma = 1, chế độ bình thường Gamma = 2, mắt khó phân biệt các điểm
ảnh
Gamma=1/3, ảnh sáng hơn rất ề
Gamma = 1/2, ảnh sáng hơn và các điểm
ảnh dễ phân biệt hơn
Trang 13Gamma=1/4, ảnh gần giống với việc chụp quá sáng vào ban ngày
1.4.5 Histogram
- Khái niệm: Là một đồ thị với trục hoành là độ sáng và trục tung là số lượng điểm ảnh ở độ sáng tương ứng Chiều cao của các cột đen trên histogram cũng thể hiện số lượng pixel ở mức sáng đó Như vậy, khi nhìn vào độ cao của các "đỉnh núi" trên histogram, ta sẽ biết cách để điều chỉnh độ sáng tối cho phù hợp
- Lược đồ xám là một hàm cung cấp tần suất xuất hiện của mỗi mức xám (Gray Level)
Độ sáng biểu thị tăng từ trái qua phải: phía tay trái là tối, ở giữa là độ sáng trung bình, còn tay phải là sáng nhất Một số thí dụ như sau:
- Histogram tốt có hình ngọn núi với độ cao tăng dần từ trái, cao nhất ở giữa và thấp nhất ở bên phải Điều đó chứng tỏ số lượng điểm ảnh nhiều nhất là ở độ sáng trung bình
Trang 14- Ảnh bị quá tối: histogram bị nghiêng về bên trái, có một cái cột gần như thẳng đứng sát trái
- Ảnh bị quá sáng: histogram bị nghiêng về bên phải, có một cái cột gần như thẳng đứng sát phải
- Ảnh bị quá tương phản: có hai cái cột nằm ở 2 đầu trái phải
Trang 15- Ảnh bị kém tương phản: dải màu bị dồn vào giữa, hai đầu không có gì
- Sau nhiều lần chỉnh sửa thì phổ của ảnh sẽ bị như thế này:
1.4.6 Độ tương phản
Ảnh số là tập hợp các điểm, mỗi điểm có giá trị độ sáng khác nhau Ở đây, độ sáng
để mắt người dễ cảm nhận ảnh song không phải là quyết định Thực tế chỉ ra rằng 2 đối tượng có cùng độ sáng nhưng đặt trên 2 nền khác nhau sẽ cho cảm nhận sáng khác nhau Như vậy độ tương phản biểu diễn sự thay đổi độ sáng của đối tượng so với nền Nói cách khác độ tương phản là độ nổi của điểm ảnh hay vùng ảnh so với nền Như vậy nếu ảnh có độ tương phản kém ta có thể thay đổi tuỳ ý theo ý muốn
1.5 Thành phần màu của điểm ảnh
Màu của điểm ảnh là tổ hợp của 3 thành phần màu cơ bản R, G, B Tuỳ theo số lượng màu của ảnh để xác định số bít biểu diễn cho mỗi thành phần màu Trong trường hợp ảnh là đa cấp xám thì các thành phần màu R = G =B
Đối với ảnh màu, thông thường số bít biểu diễn của |R| = |B| = |G| = 8 (kí hiệu |R| là
độ dài theo bít để biểu diễn thành phần R)
Ngoài không gian màu RGB, trong lĩnh vực xử lý ảnh còn xử dụng một số không gian màu khác như YCbCr, YUV Để chuyển đổi trên các không gian màu khác
Trang 16nhau chúng ta cần xác định các hàm biến đổi thuận và ngược tương ứng với 2 không gian màu cụ thể, như đã trình bày trên
1.6 Phân loại ảnh
1.6.1 Ảnh đen trắng
Ảnh đen trắng là ảnh chỉ bao gồm 2 màu: màu đen và màu trắng Người ta phân mức đen trắng đó thành L mức nếu sử dụng số bít B=8 bit để mã hoá mức đen trắng (hay mức xám) thì L được xác định:
L = 2B (trong ví dụ L = 28 = 256 mức)
Nếu L = 2, B =1, nghĩa là chỉ có 2 mức: mức 0 và mức 1, còn gọi là ảnh nhị phân Mức 1 ứng với màu sáng, còn mức 0 ứng với màu tối Nếu L lớn hơn 2 ta có ảnh đa cấp xám
Nói cách khác, với ảnh nhị phân mỗi điểm ảnh được mã hoá trên 1 bít, còn với ảnh
256 mức, mỗi điểm ảnh được mã hoá trên 8 bit Như vậy với ảnh đen trắng: nếu dùng 8 bit (1 byte) để biểu diễn mức xám, số các mức xám có thể biểu diễn được là
256 Mỗi mức xám được biểu diễn dưới dạng là một số nguyên nằm trong khoảng
từ 0 đến 255, với mức 0 biểu diễn cho mức cường độ đen nhất và 255 biểu diễn cho mức cường độ sáng nhất
Ảnh nhị phân, các phần tử có thể coi như các phần tử Logic Ứng dụng chính của nó được dùng theo tính logic để phân biệt đối tượng ảnh với nền hay để phân biệt điểm biên với điểm khác
1.6.2 Ảnh đa cấp xám
- Khái niệm
Ảnh đa mức xám là ảnh được biểu diễn bởi L lớn hơn 2 mức (L= 4, 8, 16, 32, 64,
128, 256) thông thường người ta sử dụng L=256 mức để biểu thị mức độ đậm nhạt của các điểm ảnh
Trang 17- Đặc điểm:
Để biểu diễn cho một điểm ảnh màu cần 24 bit 24 bit này được chia thành 3 khoảng 8 bit Mỗi màu cũng được phân thành L cấp khác nhau (thường L = 256) Mỗi khoảng này biểu diễn cho cường độ sáng của một trong các màu chính
Do đó, để lưu trưc ảnh màu người ta có thể lưu trữ từng màu riêng biệt, mỗi màu lưu trữ như một ảnh đa cấp xám Vì vậy, không gian nhớ dành cho một ảnh màu lớn hơn 3 lần một ảnh đa cấp xám cùng kích thước
Ta có thể chuyển đổi ảnh màu về ảnh đa cấp xám bằng công thức:
Ảnh hưởng của màu đến mức xám giảm dần từ G, R đến B
1.7 Một số kỹ thuật nâng cao chất lượng ảnh
Các kỹ thuật nâng cao chất lượng ảnh là nhằm làm cho chất lượng ảnh tốt hơn theo
ý đồ của người sử dụng Một số kỹ thuật như sau:
Y(m,n) = 1 nếu X(m,n) ≥ θ Y(m,n) = 0 nếu X(m,n) < θ
G = 0.299R + 0.587G + 0.114B
Trang 181.7.1 Lọc nhiễu
Thông thường ảnh thu được sẽ có nhiều nhiễu cần phải loại bỏ hay ảnh không sắc nét bị mờ hoặc cần làm rõ các chi tiết như biên Các toán tử trung gian dùng trong
kỹ thuật tăng cường ảnh được phân theo nhóm công dụng: làm trơn nhiễu, nỗi biên
Để làm trơn nhiễu hay lọc nhiễu người ta sử dụng bộ lọc tuyến tính (lọc trung bình, thông thấp), hay lọc phi tuyến ( trung vị, giả trung vị, lọc đồng hình) Do bản chất của nhiễu là ứng với tần số cao và cơ sở lý thuyết của lọc là bộ lọc chỉ cho tín hiệu
có tần số nào đó thông qua dãi tần bộ lọc Do vậy để lọc nhiễu ta dùng lọc thông thấp theo quan điểm tần số không gian hay lấy tổ hợp tuyến tính để san bằng (lọc trung bình) Để làm nổi cạnh (ứng với tần số cao) người ta dùng bộ lọc thông cao Laplace Một số kỹ thuật lọc:
Lọc trung bình
Với lọc trung bình, mỗi điểm ảnh được thay thế bằng trung bình trọng số của các điểm lân cận Tư tưởng của thuật toán lọc trung bình: ta sử dụng một cửa sổ lọc (ma trận 3x3) quét qua lần lượt từng điểm ảnh của ảnh đầu vào input Tại vị trí mỗi điểm ảnh lấy giá trị của điểm ảnh tương ứng trong vùng 3x3 của ảnh gốc “lấp” vào ma trận lọc Giá trị điểm ảnh của ảnh đầu ra là giá trị trung bình của tất cả các điểm ảnh trong cửa sổ lọc Việc tính toán này khá đơn giản với 2 bước gồm tính tổng các thành phần trong cửa sổ lọc sau đó chia tổng này cho số các phần tử của cửa sổ lọc
n 1 1
Trang 19Giả sử ta có ảnh I, điểm ảnh P, cửa sổ w(p) và ngưỡng θ Khi đó kỹ thuật lọc trung bình không phụ thuộc không gian bao gồm các bước sau:
) (
P AV
P I
1
2
1 1
2
4
1 2
16
4
2 3
1
2
1 1
2
4
1 2
3
4
2 3
Trang 20Giả sử ta có ảnh I, điểm ảnh P, cửa sổ w(p) và ngưỡng θ Khi đó kỹ thuật lọc trung
vị phụ thuộc không gian bao gồm các bước sau:
) (
P Med
P I
1
2
1 1
2
4
1 2
16
4
2 3
1
2
1 1
2
4
1 2
2
4
2 3
Trang 21g t round
Ví dụ: Cân bằng ảnh sau với new_level= 4
1
4
1 9 6
2
7
5 4 3
1
2
7 6 4
0
2
0 3 2
1
3
2 2 1
0
1
3 2 2
1
0
Ảnh sau khi thực hiện cân bằng chưa chắc đã là cân bằng "lý tưởng
Trang 221.7.3 Điều chỉnh tương phản
Tăng độ tương phản (Stretching Contrast)
Xử lý điểm ảnh thực chất là biến đổi giá trị một điểm ảnh dựa vào giá trị của chính
nó mà không hề dựa vào các điểm ảnh khác Có 2 cách tiếp cận phương pháp này Cách thứ nhất dùng một hàm biến đổi thích hợp với mục đích và yêu cầu đặt ra để biến đổi giá trị mức xám của điểm ảnh sang một giá trị mức xám khác Cách thứ 2 dùng lược đồ mức xám (Gray Histogram) Về mặt toán học, toán tử điểm là một ánh
xạ từ giá trị cường độ sáng u(m,n) tại toạ độ (m,n) sang giá trị cường độ sáng khác v(m.n) thông qua hàm f(.), tức là:
v(m,n) = f(u(m.n))
Nói một cách khác, toán tử điểm là toán tử không bộ nhớ, ở đó một mức xám
u [0,N]được ánh sáng sang một mức xám v [0,N] : v =f(u)
Tăng độ tương phản:
Ảnh có độ tương phản thấp có thể do điều kiện sáng không đủ hay không đều, hoặc
do tính không tuyến tính hay biến động nhỏ của bộ cảm nhận ảnh Để điều chỉnh lại
độ tương phản của ảnh, cần điều chỉnh lại biên độ trên toàn dải hay bằng cách biến đổi tuyến tính biên độ đầu vào (dùng hàm biến đổi là hàm tuyến tính) hay phi tuyến (hàm mũ hay hàm lôgarit) Khi dùng hàm tuyến tính các độ dốc α, β, ɤ phải chọn lớn hơn một trong miền cần dãn Các tham số a, b (các cận) có thể chọn khi xem xét lược đồ xám của ảnh Chú ý, nếu dãn độ tương phản bằng hàm tuyễn tính ta có:
Trang 231.7.4 Điều chỉnh sáng tối
Giả sử I ~ kích thước m x n và số nguyên c
Khi đó kỹ thuật tăng, giảm độ sáng được thể hiện như sau:
For (i=0; i < m; i++)
Trang 24CHƯƠNG 2 MỘT SỐ KỸ THUẬT TẠO ẢNH 3D
Chương 2 của luận văn trình bày về lược sử các loại ảnh 3D, khái niệm ảnh nổi 3D anaglyph, nguyên lý tạo độ nổi cũng như một số kỹ thuật tạo ảnh nổi 3D anaglyph
2.1 Lược sử các loại ảnh 3D
2.1.1 Ảnh stereo nhìn chéo và nhìn song song
Phương pháp sơ khai nhất để quan sát hiệu ứng nổi 3D là đặt hai ảnh trái phải của đối tượng bên cạnh nhau Mắt trái nhìn vào ảnh bên phải, mắt phải nhìn vào ảnh bên trái (Cross view) Ta sẽ thấy một bức ảnh 3D nổi ra ngoài màn ảnh
Ngược lại nếu đảo vị trí hai ảnh, rồi mắt trái nhìn vào ảnh bên trái, mắt phải nhìn
vào ảnh bên phải (Parallel view), ta sẽ thấy một bức ảnh 3D lõm sâu vào trong màn ảnh
Nhược điểm của phương pháp này là phải tập luyện rất nhiều, không phải ai cũng
có thể nhìn ra được Và nhìn nhiều quá cũng gây chóng mặt nhức đầu do sự tập trung và điều tiết mắt quá độ
2.1.2 Ảnh ảo không gian ba chiều (Auto-stereogram)
Đối tượng ba chiều cần quan sát là ảo và được giấu dưới cấu trúc nền Nhược điểm
là phân giải kém, màu sắc đơn điệu do trùng với màu nền, và cần tập luyện nhiều
mới quan sát được Đây là trò chơi giấu hình được lớp trẻ hưởng ứng một thời 2.1.3 Ảnh toàn phương (Hologram)
Là ảnh không ghi trực tiếp hình ảnh lên phim, mà ghi các mẫu giao thoa bằng laser lên một môi trường nhạy quang Khi xem ảnh không cần dùng kính mà vẫn thấy nổi Tuy nhiên, nhược điểm là độ phân giải kém do kết hạt và rất ít màu sắc Ảnh Hologram đã xuất hiện ở Việt Nam từ cách đây hàng chục năm, dưới dạng đồ chơi
của trẻ em
2.1.4 Ảnh và phim phân màu Anaglyph
Trang 25Hai ảnh gốc stereo mỗi ảnh được phân một kênh màu khác nhau rồi lồng vào nhau Khi quan sát ảnh anaglyph, ta phải đeo kính Red-Cyan Nhờ mỗi mắt kính
có tác dụng lọc màu chỉ cho ảnh tương ứng truyền qua nên mắt trái ta chỉ thấy ảnh trái, mắt phải chỉ thấy ảnh phải Và do đó, ta sẽ có cảm giác nổi 3D mà không cần
nỗ lực điều tiết mắt đặc biệt gì cả Hạn chế của phương pháp này là bị mất bớt màu sắc khi quan sát ảnh do phải qua kính lọc màu Công nghệ Anaglyph mà khá phổ biến trong điện ảnh 3D nhưng ít khi được dùng để xem ảnh tĩnh
2.1.5 Ảnh lật (Flip) và ảnh biến hình (Morphing)
Khi nhìn vào tấm ảnh Flip hay Morphing dưới các góc khác nhau, ta thấy những hình ảnh khác nhau lật qua lật lại (2 đối với Flip và 3-10 với Morphing) Khá sống động vì có thể mô tả sự chuyển động của một vật thể nào đó Tuy nhiên, hoàn toàn không có hiệu ứng ba chiều (và không được xếp vào dạng ảnh nổi) Thường thấy trên các móc chìa khóa hay thước kẻ nhựa nhập từ Trung Quốc
2.1.6 Ảnh cắt lớp giả 3D (multi-layers 2D to pseudo-3D)
Được tạo ra bằng cách đặt các lớp phẳng bẹt chồng lên nhau (từ 2-5 lớp), mỗi lớp
là một layer tương ứng với một đối tượng Cảm giác nổi có được là nhờ hiệu ứng tạo khoảng cách giữa các lớp Không gian giả 3D là không gian rời rạc và lượng thông tin trong tấm ảnh đó chỉ ngang với một ảnh 2D Ưu điểm là rất dễ làm nên giá thành rẻ
2.1.7 Ảnh nổi 3D tích hợp (integrated image)
Hay còn gọi là ảnh 3D chân thực (real-world 3D) dùng tấm vi thấu kính (lenticular) Đây là công nghệ tiên tiến nhất hiện nay
2.1.8 Phim nổi 3D dùng công nghệ phân cực
Dùng nguyên lý phân cực ánh sáng để tách hình ảnh mắt trái và mắt phải Là công nghệ chiếu phim nổi 3D phổ biến nhất hiện nay ở các rạp phim 3D Một số mẫu
TV 3D của các hãng lớn cũng dùng công nghệ này (loại TV 3D dùng kèm kính)
Trang 262.1.9 Màn hình 3D dùng công nghệ chớp tắt điện tử theo thời gian (shutter)
Các hình ảnh trái và phải của phim 3D hay ảnh 3D được tách ra rồi tạo thành các dòng điểm ảnh xen kẽ (dòng chẵn-lẻ tương ứng với ảnh trái-phải) Dùng card đồ họa chuyên dụng có thể điều khiển các dòng chẵn lẻ chớp tắt liên tục và xen kẽ theo thời gian với tần số cực nhanh Người xem sử dụng một kính điện tử được đồng bộ hóa với tần số đó có thể quan sát thấy hiệu ứng 3D Công nghệ này cũng được nhiều hãng phát triển dùng để xem phim nổi 3D hoặc chơi game 3D Nhược điểm do sự chớp tắt liên tục (dù rất nhanh) có thể gây mỏi mắt nếu xem trong thời gian dài
2.1.10 Màn hình 3D dùng vi thấu kính (lenticular) hoặc parallax barrier
Cho hiệu ứng 3D tương tự như ảnh 3D tích hợp Là công nghệ dùng cho TV 3D của tương lai (một số hãng đã bắt đầu phát triển và giới thiệu ở CES '09) Không cần dùng kính để xem hiệu ứng 3D, tuy nhiên có thể bị hạn chế về vị trí quan sát
2.2 Khái niệm ảnh nổi 3D
Ảnh 3D nổi là loại ảnh cho phép chúng ta nhìn 2 ảnh khác nhau khi quan sát dưới các góc nhìn khác nhau của mắt trái và mắt phải, từ đó tạo nên hiệu ứng nổi khi được tổng hợp ở trong não của người quan sát (hiệu ứng nổi)
Công nghệ 3D hoạt động dựa trên một nguyên tắc chung là "đánh lừa não bộ" Não
bộ bị đánh lừa sẽ cho ra một hình ảnh 2D có thêm chiều sâu của ảnh Cách thức đơn giản nhất để tạo ra điều này là áp dụng "hiện tượng nhìn nổi" (hiện tượng xảy ra khi một hình ảnh được nhìn từ 2 mắt có sự khác nhau rất nhỏ và khi não chúng ta trộn 2 hình ảnh nhìn được lại sẽ ra được một hình ảnh 3 chiều) Cho đến bây giờ để xem được hình ảnh 3D chúng ta có 2 sự lựa chọn : sử dụng kính xem 3D (hoặc các thiết
bị phụ trợ khác cho mắt) và xem trực tiếp
Có nhiều công nghệ để dựng ảnh nổi 3D, trong giới hạn luận văn này chỉ đề cập đến
kỹ thuật dựng ảnh nổi 3D anaglyph Theo đó ảnh nổi 3D anaglyph được hiểu như sau: Ảnh nổi 3D- Anaglyph là sự kết hợp giữa 2 ảnh với góc quan sát khác nhau của
Trang 27cùng một đối tượng để tạo ra hiệu ứng nổi sau khi sử dụng cặp kính khác màu để lọc màu
Một trong số những thuộc tính quan trọng nhất của thế giới vật chất xung quanh ta
là sự tồn tại của không gian 3 chiều Con người có thể trực tiếp cảm nhận không gian 3 chiều thông qua các giác quan (thị giác, xúc giác, các cảm giác bản thể ), trong đó thị giác thu nhiều thông tin nhất Khi quan sát xung quanh bằng mắt, có 2 yếu tố làm ta cảm nhận được chiều sâu hay khoảng cách, đó là sự điều tiết của thủy tinh thế và góc chập của 2 mắt Ấn tượng chìm hay nổi của không gian và các đối tượng có được nhờ sự tổng hợp của não bộ từ các hình ảnh ghi nhận đồng thời từ mắt trái và mắt phải Hãy thử làm một thí nghiệm nhỏ: Nhắm 1 mắt lại rồi cầm 2 cây bút chì ở 2 tay rồi thử tìm cách chạm 2 đầu chì vào nhau từ nhiều hướng Bạn sẽ thấy rõ sự khác biệt của thế giới quan cảm thụ bằng một mắt và hai mắt Nhờ tiếp thu được thông tin từ 2 góc nhìn khác nhau, thị giác hai mắt giúp chúng ta định được khoảng cách xa gần và do đó, nhận thức được tính vô tận và liên tục của 3 chiều không gian
Hình 2.1 Mô phỏng sự chập hình của hai mắt
Trang 28Để nhìn rõ đối tượng, hai mắt cùng phải hướng về đối tượng Đó là sự hợp thị Ta
có điểm hợp thị và góc hợp thị Mỗi mắt cũng phải điều tiết hay lấy nét (accommodation) vào vật Nhờ nhận thức của não bộ đối với góc chập α, ta có thể ước lượng được khoảng cách tới đối tượng
Nguyên lý căn bản của hầu hết các thể loại hình ảnh nổi là sự mô phỏng thị giác hai mắt đối với đối tượng sự vật Nói cách khác, hiệu ứng 3D ở các loại ảnh nổi hay phim nổi đều giống nhau ở bản chất: nhằm gửi đến mắt trái và mắt phải người quan sát một cách tách biệt hai hình ảnh tương ứng với góc lệch bên trái và bên phải của đối tượng (nếu tách biệt không tốt sẽ có hiện tượng nhòe hình) Sự chập ảnh vô thức của não bộ sẽ gây nên ấn tượng chìm hay nổi của đối tượng sự vật Đó
là sự khác biệt lớn nhất đối với hình ảnh 2D truyền thống - khi người quan sát dù đứng ở bất kỳ góc nào thì mắt trái và phải cũng chỉ nhìn thấy một khuôn hình giống hệt nhau
Trong công nghệ dựng ảnh 3D anaglyph, khi trộn 2 ảnh 2D được chụp từ máy chụp hình tuỳ theo đối tượng muốn chụp là xa hay gần để chọn khoảng cách đặt các ống kính chụp tương ứng với mắt trái và mắt phải là lớn hơn hay nhỏ hơn 6cm Thông thường các đối tượng chụp trong phạm vi 200m trở lại ta chọn khoảng cách đặt mắt là 6cm, còn nếu đối tượng chụp xa hơn ta phải điều chỉnh đặt 2 mắt
xa hơn để tạo độ nổi khi tiến hành trộn 2 hình
2.3 Vai trò ảnh 3D trong giáo dục
Ứng dụng CNTT vào giáo dục đã mang lại nhiều hiệu quả tích cực góp phần đổi mới phương pháp dạy học và năng cao chất lượng giáo dục
Hầu hết các trường học hiện nay đã ứng dụng CNTT vào công tác giảng dạy cũng như công tác quản lý thông qua hệ thống thiết bị, các phần mềm…
Việc ra đời công nghệ ảnh 3D để mang lại một cái nhìn mới về thế giới trực quan sinh động Đối tượng được xây dựng dưới dạng 3D được thể hiện gần gũi hơn với thế giới thực
Trang 29Do đó ứng dụng công nghệ ảnh 3D sẽ mang lại ý nghĩa quan trọng cho nền giáo dục Giúp bài giảng thêm sinh động, hình ảnh minh hoạ trung thực Giúp học sinh
dễ dàng nắm bắt được các được bài học, hiểu rõ hơn bản chất của các đối tượng khi
mô phỏng trên không gian 3 chiều
Bên cạnh đó công nghệ 3D đã và đang được áp dụng rộng rãi vào các lĩnh vực khoa
Nguyên nhân của việc này là các màu nhìn thấy trong tự nhiên được tuân theo các bước sóng của chúng chính vì vậy có thể tổng hợp các màu sắc từ bước sóng này sang bước sóng kia một cách dễ dàng
Nhưng theo các nhà khoa học mắt người nhạy cảm nhất với 3 màu sắc Blue, chính vì vậy các nhà khoa học đã thống nhất chọn Red – Green – Blue là 3 màu cơ bản.[6]
Red-Green-Hãy tưởng tượng, ví dụ, chiếu một đèn có ánh sáng đỏ, một đèn có ánh sáng xanh lá cây và một đèn có ánh sáng xanh nước biển lên một bức tường trắng Nếu chỉ chiếu màu đỏ, bức tường sẽ có màu đỏ, chỉ chiếu đèn xanh lá cây, bức tường sẽ có màu xanh lá cây, chỉ chiếu đèn xanh nước biển, bức tường sẽ có màu xanh nước biển, nếu đèn đỏ và xanh lá cây cùng chiếu, bức tường chuyển màu vàng Giảm ánh sáng
đỏ, bức tường sẽ chuyển màu vàng xanh, giám ánh sáng đèn xanh bức tường sẽ chuyển màu cam Nếu ta chiếu thêm đèn blue vào và tăng dần lên, màu cam sẽ ít dần và dần xuất hiện màu trắng Các thiết lập trên được tạo ra là do các gam màu được chiếu bởi các đèn màu đơn sắc
Trang 30Một màn hình LCD cũng được coi như một mạng lưới hàng ngàn đèn đỏ, xanh lá, xanh biển Trên mỗi điểm phát ánh sáng sẽ có ba đèn tương ứng Gam màu của màn hình hiển thị sẽ phụ thuộc vào ba loại đèn với màu sắc được sử dụng ở trên
Hình 2.2 Các hệ màu
3 điểm nhạy sáng được thể hiện ở 3 đỉnh của tam giác màu sắc
Ứng với các bước sóng : 460nm – 470nm, 500nm-550nm, 600nm-620nm là các màu Blue, Green và Red
Trang 31Hình 2.3 Không gian màu
Sơ đồ trên thể hiện không gian màu sắc cơ bản Mỗi màu được tổng hợp từ ba thành phần màu RGB với các giá trị (x,y,z) tương ứng Như vậy nếu muốn bóc tách các lớp màu R,G hay B ta chỉ cần đưa các giá trị ứng với nó là x, y hay z về 0
Ví dụ: Muốn một bức ảnh chỉ có giá trị Green ta đưa toàn bộ các điểm ảnh về giá trị (0, y, 0) thì bức ảnh sẽ có màu Green của chính nó
Hình 2.4 Ảnh được bóc tách màu đỏ
Trang 32- Hệ màu sRGB
Hệ màu sRGB là một tiêu chuẩn của không gian màu RGB được tạo ra bởi sự hợp tác của HP và Microsoft vào năm 1996 để sử dụng trên màn hình, máy in và internet
sRGB sử dụng tiêu chuẩn màu cơ bản ITU-R BT.709 hay viết tắt là REC 709 Kỹ thuật này cho phép sRGB hiển thị trực tiếp trên màn hình truyền hình độ nét cao (HDTV)
Không giống hầu hết các không gian màu RGB, độ gamma của sRGB không được thể hiện là một số duy nhất
Độ gama là độ mã và giải mã độ sáng của video hoặc hình ảnh , và thông thường với các hệ màu RGB thì độ gama (γ) = 1 [7]
Y’ là viết tắt của các thành phần luma (độ sáng) và U và V là hai đơn sắc màu Tín hiệu Y’UV thường được tạo ra từ nguồn RGB Y’ được tổng hợp từ các trọng
số R, G, B đó chính là độ sáng của ảnh hoặc độ xám (grayscale) dùng với chuẩn hóa REC 601 hoặc PAL ( ở Việt Nam dùng chuẩn PAL nên ta sử dụng công thức bên dưới để chuyển đổi và tính toán grayscale)
Và công thức chuyển đổi Y’UV được xác định từ các hằng số sau:[8]
WR = 0.299
WB = 0.144
WG = 1 - WR - WB = 0.587
Trang 33Tương đương, thay giá trị cho các hằng số và biểu thị chúng như ma trận ta có
Đối với chuẩn REC 709 truyền hình độ nét cao ta có ma trận chuyển đổi tương ứng cho độ sáng (Y’) như sau:
WR = 0.2126
WB = 0.0722
Trang 34Như vậy với chuẩn truyền hình REC 601/PAL thì ta sử dụng công thức ma trận (1)
Và chuẩn truyền hình độ nét cao REC 709 thì ta sử dụng công thức ma trận (2)
để tính độ sáng/ mức xám (grayscale) cho ảnh màu
- Hệ màu đối nhau
Hình 2.5 Hệ màu đối nhau
Như ta đã biết, 3 màu cơ bản Red – Green – Blue tổng hợp lại được các màu Chính
vì vậy sẽ có những màu khi chồng lên nhau sẽ trở thành màu đen Ta gọi những màu tổng hợp cùng nhau trở thành màu đen trong hệ màu là những màu đối nhau Trên hình ta có thể thấy Red – Cyan, Green – Magenta, Blue – Yellow là 3 hệ màu đối nhau
Mắt người sẽ tổng hợp những màu sắc sáng tối để phân tích, phán đoán vật thể 3 chiều dựa vào màu sắc sáng tối của màu sắc của vật
Chính việc xuất hiện những màu đối nhau này là cơ sở để ảnh nổi Anaglyph màu sắc ra đời!
Trang 35Hiện tại trên thế giới có nhiều cách tạo thành ảnh nổi Anaglyph nhưng ở đây tôi chỉ đưa ra cách phổ biến và sử dụng rộng rãi nhất: Phương pháp sử dụng màu sắc đối nhau Đây là phương pháp rất phổ biến vì cách tạo ra là rất đơn giản
Cơ sở của việc này là mắt trái và mắt phải sẽ được đeo một loại kính 2 màu đặc biệt Ảnh được tạo ra thông qua việc tính toán khoảng cách từ màn hình tới mắt người xem và được chỉnh sửa về màu sắc sao cho khi được nhìn qua kính đặc biệt
sẽ cho hiệu quả nổi như nổi hẳn ra khỏi màn hình
Hình 2.7 Kính màu Red - Cyan
Nếu sử dụng 2 ống kính đặc biệt, đặt cách nhau một khoảng được tính phụ thuộc khoảng cách giữa vật cần chụp và người chụp ta có thể chụp và tạo được trực tiếp ảnh nổi 3D – Anaglyph
Ví dụ: 2 ống kính của Canon được thiết kế như hình vẽ, ống bên trái có thể lọc màu
đỏ và ống bên phải có thể lọc màu xanh da trời Khi chụp, 2 ống này lấy ảnh đã được lọc màu, trộn vào nhau sẽ được ảnh nổi Red – Cyan Thực tế phương pháp này
đã được sử dụng trong các trận bóng đá để mang lại hình ảnh sống động
Trang 36Hình 2.8 Ống kính chụp ảnh nổi
2.4.2 Cơ sở hình thành ảnh với độ nổi tự do
Xét điểm ảnh O trên ảnh muốn nổi, chiếu ảnh nổi lên màn hình ta thấy mắt trái sẽ thấy điểm O trên màn hình là Ot và mắt phải sẽ thấy điểm O trên màn hình là Op Đồng thời phần ảnh mắt trái nhìn thấy sẽ bị lọc đi màu Đỏ và chỉ còn lại màu Xanh
da trời, phần ảnh mắt phải nhìn thấy sẽ bị lọc đi màu Xanh da trời và chỉ còn lại màu Đỏ
Chính vì vậy khi mắt trái nhìn qua kính màu Đỏ và mắt phải nhìn qua kính màu Xanh da trời sẽ đem lại hiệu quả nổi như hình vẽ