“ MG DAT Trong thời đại pha triển ứng, dụng công nghệ thông tin liện nay, việc Iruyển các hình ảnh động qua mạng ngày cảng có nhiễu ứng, dụng, Khi chúng {a tro truyện với mội người bạn
Trang 1
BO GIAO DUC VA DAO TAO ‘TAP DOAN BUU CHINH VIEN THONG VIET NAM HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIÊN THÔNG
P
TRAN VƯƠNG NGUYÊN
AP DUNG MOT SO KY THUAT NEN ANH CHO
TRUYEN DU LIEU ANH DONG QUA MẠNG
MA SO: 60.48.15 Người hướng dẫn khoa học: PGS.TS Ngô Quốc Tạo
TOM TAT LUAN VAN THAC SĨ KỸ THUAT
HANOI-2011
Trang 2
“
MG DAT
Trong thời đại pha triển ứng, dụng công nghệ thông tin liện nay, việc Iruyển các hình ảnh động qua mạng ngày cảng có nhiễu ứng, dụng, Khi chúng {a tro truyện với mội người bạn qua ruang, chúng ta
có thể nhìn thấy người bạn đỏ, khi chúng ta tham gia một cuộc họp
trực tuyến, chủng ra có thể nhin thấy những rhành viên khác của cuộc
hop, ede bie si có thể tham gia theo đối và chỉ đạo một ca md quan trọng mà không có điểu kiên có mặt trực tiếp — bắt chấp khoăng rách
về mặt địa lý Với sự phái triển của Iniemet, ngành: công nghiệp truyền hình có thêm một phương tiện nữa để có thể truyễn tâi nôi
đụng tới người xem Tắi cả những điều này đều dựa trên cơ sở truyễn
đủ liệu ảnh động,
Một trong những yên tổ quan trọng trong truyền các bình ánh
chuyển động động là vấn để đường truyền Nguyên đo là khi truyền
các hình ảnh động chúng ta phải truyền liên tục hết Kmmg hình này
độn khung hình khác với tốc độ rắt cao để đảm bão hin ảnh liên tục
Để giải quyết vấn để này, giải pháp don giân và ñ tấn kém nhất là thực kiện nén hình ảnh trước khử truyền
Trang 3Chương 1
TONG QUAN VE CAC BINH DANG ANH PHO BIEN
1.1ĐỊNH DẠNG ÄNH BMP
1.11 - Giới thiệu vàlịch sử phát triển
Dinh dạng lập tin BMP, củn được biết đến với lên gọi tp lim ảnh Bitmap hoặc định đạng tập tin Bitmap dc lap voi thiết bị (DIB), là
một định đạng tập tin ánh đồ họa Raster duoc dang để Imi trữ các
hinh duh số, độc lập với thiết bị hiển thị
1111 Cẩn trúc chủng
Tập tin anh bitmap bao gém phần tiêu đề là một cấu trúc có kích thước cổ định miêu là các đặc điểm của lập tin ảnh Các phiên bản
MP khác nhau có thế có phân tiều để này khác nhan
Một tập ti ảnh Bitmap khi nạp vào bộ nhớ sẽ trô thành một cấu trúc đít liệu IDTR - mét thanh phan quan trong cia, Windows GT
APIL Các cầu trúc đứ ligu DIB trong bộ nhớ gân như giống với định
dang tp tin BMP, nhung no khong, cluta 14 byte Tiéu dé tap tin
bitrnap và bắt đầu với các Tiêu đề DI
DEL Tiéu dé tap tin bitmap
Cac byte nay la phan hắt đân của tập tin và được sử đụng để xác
định các tập thì Một ứng đụng sẽ đọc phân bắt
Tầng tập tin thực sự lä một tập tín BMP và không bị lỗi Hai byte dau
tiên của định dạng tập từa BMP là ký tự “B', sau đó là ký tụ “M" trong bang mA 1-byte ASCTT
này để đâm tảo
Trang 41114 Tiêu đề DỊP (Tiêu đà Thẳng từt biimapj
Các byte này báo cha các ứng đụng thông tin chỉ tiết về hình ảnh
sẽ được cử dựng đễ hiển thị trên mãn hình
Bảng mẫu (còn gọi là Palette) lu it trong tap tin nh BMP ngay san Tiêu dé lap lin BMP va DIB (va co thé sau ba mil na meu R, G,
ITMAPINFOITFADRR) Vì vậy, vị trí của nó là kích thước của BITMAPFILEHEADER công với kích thước của tiêu để DIB (cộng, thêm 12 byte cho ba mặt na bi!)
Số lượng các xuục trong bảng xuàu là 2” hoặc là một số nhỏ hơn được quy định trong phần Tiêu để Thông thường, mỗi mục trong bảng, màn cần 4 byle theo thứ tự l, G, R, 0x00,
HH Pixel
Các bit được đừng để thế hiện các Pixel được đóng gói thành các
hàng, Kích thước của mỗi hàng là một bội số của 4 byte Khi hink
ảnh có chiển cao lớn hơn 1 (Pixel) sẽ củ nhiễu hàng được limu trữ Tiên tục tao think ming Pixel
Téng s6 byte cAn thiết để lưu trữ một màng Pixel trong, mét hink ảnh có Số Bút mỗi Pixel (bụp) là n, với 2° màu, có thể được tính dựa trên sư làm trên lên kích thước của mỗi hàng là một bội số của 4
te
11.17 Mông Pixel (dit ligu bitmap}
Ming Pixel la mét khdi chc DWORD 32 bit ma té cac điểm ánh trong hình wnlL Thông thường các pixel được lưu trữ theo thử Lự quét
từ póc dưới bên trải, đã từ trấi sang, phải vá từ đưới lên trên Ban đân,
độ sâu uủa màu là 1, 4, 8, và 24 bụp, tuy nhiên hiệu nay cho phép đính đang với 1, 2 4 8, 16, 24, và 32 bpp.
Trang 5‘Néu mot bitmap 24 bit man có độ rộng là [, sẽ cân 3 hựre dít liệu
cho mỗi hàng, (R, Œ, B) và L byfe đệm Nêu độ rộng là 2 sẽ củ 2 byte
đệm, nên là 3 sẽ cô 3 byta đêm, và nên là 4 thì không cần byte dim
Khi tập tin hình ảnh bixmap được hữu trên đĩa hoặc bộ nh, các điểm ảnh có thể được định ngiữa bằng một số bí! (1bi, 2Ùä, 4bÄ, 16bit, 24bit, 32bit)
Sự đơn giân của định đạng BMP, cùng với sự phổ biến của hệ
điền hành Windows, cộng thêm với việc miễn phi bản quyên, cũng,
như thực tế cho thấy nó
làm cho nó trở nên phổ biễn và hần hết các chương trình xử lý ảnh
đều có thể làm việc với BMP
12DỊNH DANG ANH PNG
1.2.1 Giới thign va lich af phát triển
Portable Nervork Graphics @NG) là một phương thức mã hóa đỉnh đạng hình ảnh sử dụng thuật toán nén không mắt dữ liệu PNG được tạo ra để cải liếm và thay thế định dạng GIF (Graphics Interchange Format) va 14 mét định dang tập tin hình ảnh không yêu
hiệu quả trung việc vao chụp các tài liêu
can ban quyền
ĐNG hỗ trợ hình ảnh đựa trên bảng màu (24 bít RGB hoặc 32 bít
RGBA), ảnh xảm {có hoặc không có kênh alpha), va Anh RGR (có hoc khong cé kénh alpha)
1.2.2 Cấu trúc tập tin
1321 Tiểu đề tập tin
Mỗi tập tin PNG được khởi đần bằng 8 hyre ký hiện, mang các
giá trị theo hệ Liexa là 89 50 4t 47 0D 0A 1A 0A (hệ Decinal là
137 80 78 71 13 10 26 10)
Trang 61322 Cứ khỗi trong tap tin
Ngay san phân tiên đề tập tin là đến một loạt các khối, mỗi khối nay chữa một số thông tín về hình ảnh Mỗi khỏi sẽ xác định đó là quam trọng bay phụ Irự, và khủ chương trình xú lý gấp mmột khỏi phụ trợ thì có thể bỏ qua nó Các khôi được lưu trữ đựa trên cơ sở lớp cấu trúc, được thiết kế cho phép định dạng lập tin PNG có thể mở rộng, trong khi vẫn đny trì khô năng tương thích với các phiên bản cũ
Một khối bao gồm: mô tả chiều đải (4 byte), loại hoặc tên khối (4 byte), dữ liệu chỉnh (một chuỗi byte), và mã kiểm tra CRC (4 byte),
Phân loại hoặc tên khỏi chứa 4 byte tương đương 4 kỷ tự chữ cải trong bảng mã ASCI Các chữ cái này sẽ cung cấp thống tỉn về bản chất của khôi
Hình anh PNG co thé sit dung bang miu lap chỉ mục hoặc được
tạo thành từ một hoặc nhiêu kênh (số các giá trị trực tiếp đại điện cho
số lượng các điểm ânh) Khi có nhiền hơn một kênh trong mét hink
ảnh tắt cả các kênh sẽ có củng một số bit được phân hố cho mỗi điểm
ảnh (được gọi tà độ sâu bịt của kênh)
PNG cung cị
màu xám, giả trỉ mỗi điểm ảnh có thể được xác định là trong suốt hoặc một kênh aipha có thể được thêm vào (cho phén bắt ký tý lệ phan trăm của độ trong suốt được sử đụng)
12.3 Ứng dụng
PNG được sử dụng rộng rãi én muung inlcrnrL đủ nó hỗ trợ thi
trong suốt, và nở sứ dụng một thuật toán nén khong mat dit ign,
các lựa chọn Irong suối Với hình ảnh màu thực và
Trang 7“
1.3Đ[NH DẠNG ÄNTI JPG
thép hựa chọn một sự cắn bằng giữa kích thước bưu trữ và chất lượng,
ảnh có thể mang lại cảm nhận gân như không khác so với ảnh gốc
143.2 Cấutrúc lập tu
1321 Phần mở rộng lên (p tìnJPBEG
Phân mở rộng tên tập tin phổ biển nhất cho các tập tin sử đụng
d
thương pháp xiên JPEG là jpg, jpeg, mặc dù jpe, jñf và jif cũng được
sử đụng,
4.472 416 so mau
"Nhiều tập tin JPEG nining mét hé so min ECC (héng, pian mam)
Các hỗ sor man thnrémg duoc sir dung bao gém sRGR va Adobe RGR
1323 Củ pháp và cầu trúc
Một hình ảnh TPEG bao gồm một chuỗi các đoạn bắt đâu với một
+ỷ hiệu đảnh dẫu, mỗi ký liệu đánh đấu đó bắt đâu với một byte OxFF theo sau bôi một byte chỉ ra loại của ký hiệu
13.3 Ứng dụng
Các thuật toán nén JPEG là tốt nhất trên các bức ảnh và các bức
tranh cña những cánh thực tế với các biến thể hình ảnh vả màn sắc
mịn Đỗi với việc sữ đụng web, nơi đữ liện đạng hình ảnh là quan
trọng, JPEG là rât nhỗ biên TPEG / Ezif cũng là định đạng phd biến
nhảt được xử đụng bởi may ảnh kỹ (huật số
Trang 81.4KÉT LUẬN CHƯƠNG
Chương 1 trình bày về cầu trúc các định đạng ảnh phổ hiển việc nắm vững cân trúc các định đạng ãnh cho pháp lựa chọn cách thức tật nhất để lu trữ và xử lý các ânh tùy (heo từng trường hợp,
Chương 2
CAC THUAT TOAN NEN ANH
2.1THUAT TOAN NEN DU LIEU HUFFMAN
2.11 Téng quan
Mã hóa Hulinan là ruồi thuật toán anã húa đữ liệu ngẫu nhiền được sử đụng để nén không mắt đí liệu Thuật ngữ này đẻ cập đến việc sử dụng mội bảng mã có chiều dải biển đổi để mã hóa mội dữ liêu nguên (chẳng hạn sửnr các ký từ trong, một tập tin) ma bang mi
chiều đải thay đổi đã được bắt nguôn một cách cụ thẻ dựa trên tức
tỉnh xác suất xây ra cho mỗi có thể giá trị của đữ liện nguồn Nó được phái triển bởi David A Huffiman trong khi ông là một nghiên cứu sink tại MIT, và công bổ năm 1952 với tên “Một ương pháp
xây đưng mã hóa số đư tối thiểu “
2121 Dink nghĩa một số vẫn dễ
“Cha biết: Một tập hợn đữ liệu và trọng số của chứng (thường là tý
lệ xắc snẤt)
Cẩn tim: Ma tiên tô nhị phãn (một tập hợp các tử mã) với chiểu
lừ mã tôi thiểu
Doin vao: Tap hop ky tir alphabet vai chién dim: A= ay, a3 , a.)
Trang 9Đâu ra: Mã € (A, W) = {ey ca , c„} là một tập hợp các tử mã (ni phân), trong, đó c là từ mã của a, EES
Ký thuật này hoại động bằng cách tao ra xuôi cây rấu phâu của
các nút Ở đây có thể được lưu trữ trang một mảng thông thường,
là một nút lá hoặc mút nội bộ Ban đần, tắt cả các nút là nút lá, có
ehửa các đữi liệu riêng của minh lã trọng số (tần số xuấi hiện) cũa đt
liêu, một liên kết đền một nứt cha mẹ làm cho nó để đàng để đọc mã
(ngược lại) hắt đâu tử một nút lá Các mút nội bộ có chứa trọng sé dit
trong đó phụ thuộc vào sỐ lượng đữ liệu ø, Một nút
một nút chủ, Như quy ước chung, bịt “0° đại điện cho nút con trải và bửt “1” đại điện cho nút con phải Một cây hoàn thiện đã lên đến mút lá ø và núi nội bộ „1
‘Noi chung, quá trình giải mã đơn giản chỉ là một vấn đề của địch
liệu, các liền kết đến hmi nủi con và Hếi
n
aid tri byte của đởng mã tiễn tổ, thường là bằng cách vượt qna các nút của tây Hufftuan như là mỗi tửt được đọc tà dòng đầu vào (dat dén một mất lá nhất thiết phải chấm đứt việc tìm kiểm giá tri byte cu thổ)
3.2THUẬT TOÁN
2.21 Tổng quan
Các phương pháp nén IPEG thường tốn hao, có nghĩa là một số
thăng tin hinh ảnh ban đâu 1â bị mắt và không thế phục hỗi, có thế
ảnh hướng đến chải lượng trình ảnh,
NEN ANH JPEG
Trang 1010
Mặc đủ một tập tin TPEG có thể được mã hóa trong nhiên cách
+hác nhan, phố biên nhất được thực hiện với mã hóa TFIF Quả trình
mã hóa bao gain cac bude:
1 Các đại điện của các màu sắc trang hình ảnh được chuyển đổi
từ RGH sang, YCbCr, bao gồm một thành phần luma (Y}, đại diện
cho độ sảng, và hai thành phần sắc độ (CD và Cr), đại điện cho Trân
2 Giâm độ phân giải cân đữ liệu, thường là một hệ số 2 Điền này
phan ánh thực tế là mắt ít nhạy cám với các chỉ Hiểt màu sắc tốt
ơn các chủ tiết độ sáng tối
3 Hình ânh được chia thành các khối điểm ảnh 8 > 8, và với mỗi
khối, mỗi dữ liệu Y, Cb, và Ct trải qua một biễn đổi cusirt rời rạc
(@CT)
- Biên độ của các thành phân tần số được lượng tứ hảa
5 Các đữ liệu kết qu cho tt ca cdc khối 8 + 8 nén với một thuật
u, một biến thế của mã hỏa HufRnan
toan khéng mat dit
Quá trình giải xnú đâo ngược các bước này, ngoại trừ lượng Lữ bởi vì
nó là không thể đảo ngược
'hiễu tùy chọn trang tiêu chuẩn JPEG không được sử đụng phố
triễn, trong khi những thứ khác quy định cụ thể các phrơmg pháp mã
hóa Đây là một mô tâ ngắn gọn của một trong các phương, pháp mã
hứa phổ biên khi áp dung cho mét dan vào co 24 hit cho méi pixel
2322 Không gian biển đôi màu
Thứ nhất, hình ảnh được chuyển đổi từ RGR thành một không,
gian mau khác nhau gợi là YCbCr Nó có ba Ihãnh phần Y, Cb va Cr:
`: thành phân đại điện cho độ sáng của điểm ảnh, và các thành phẩn
Trang 11
lL
Ch va Cr dai dign cho man (chia thành các thành phần màu xanh và đổ)
Do đặt điểm về nhạy câm trong mất người đối với một độ của màu sắc và độ sing, con người cĩ thể căm nhận tốt hơn đảng kế đồi
"bão hịn màn sắc của một hình ảnh (các thành phần CbCz),
3224 Phân tách khát
Sau khí lây mẫu, mỗi kênh được chia thành các khỏi 8 s‹
khối 8 * 8 cửa mỗi thành phẫn (Y, Cb, Cz) chuyển đổi sang, một miễn tằn số dại điện, thẳng thường là biên đổi casin xi rac
(DCT) hai chiều
Mắt người cĩ thể nhìn thấy sự Khác biệt về độ sáng Irên một trên một tân số thấp, nhưng, khơng phân biệt chính xác mức độ của sự thay đổi
độ sáng ở tan gỗ cao Diễu nảy cho phép giảm đăng kế số lượng,
lỗi Comin rửi rac
Tiép theo, 1
thơng tin trong các thành phẩm tồn số cao Điều này được thực hiện don giản là bằng cách chia mỗi thành phân trong các mức tần số với một hằng số, và sau đĩ làm trịn đến số nguyên gần nhái
Mã ha entropy lá một hình thúc đặc biệt của nén khơng mắt dy liêu, Nĩ liên quan đến việc sắp xếp các thành phẩn hình ảnh trong,
Tmột trật tự "ngoÄn ngo¿o" sử đựng thuật toản mã hĩa duyệt chiên đái
(RLE) tính tốn tần số các nhĩm tương tự nhau, chèn mã đánh số chiêu đài, vá zau đĩ xử đựng mã hĩa Huffiran vào những gị cơn lại