Cross-Reference Table Bảng tham chiếu chéo Incremental Update Cập nhật gia tăng Doucument Catalog Bảng xếp hạng tài liệu Tay sách Là khuôn in trước và sau của một tời giấy Hạt Tram’t hay
Trang 1TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYỄN THẾ THÀNH
XÂY DỰNG PHẦN MỀM BÌNH BẢN TỰ ĐỘNG PHỤC VỤ NGÀNH CÔNG NGHIỆP IN
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
HÀ NỘI - 2014
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYỄN THẾ THÀNH
XÂY DỰNG PHẦN MỀM BÌNH BẢN TỰ ĐỘNG PHỤC VỤ NGÀNH CÔNG NGHIỆP IN
Ngành: Công nghệ thông tin Chuyên ngành: Kỹ thuật phần mềm
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC: TS ĐỖ TRUNG TUẤN
HÀ NỘI - 2014
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan kết quả đạt được trong luận văn là sản phẩm nghiên cứu, tìm hiểu của riêng cá nhân tôi Trong toàn bộ nội dung của luận văn, những điều được trình bày hoặc là của
cá nhân tôi hoặc là được tổng hợp từ nhiều nguồn tài liệu Tất cả các tài liệu tham khảo đều có xuất xứ rõ ràng và được trích dẫn hợp pháp
Tôi xin hoàn toàn chịu trách nhiệm và chịu mọi hình thức kỷ luật theo quy định cho lời cam đoan của mình
Hà Nội, ngày 28 tháng 4 năm 2014 Người cam đoan
Nguyễn Thế Thành
Trang 4LỜI CẢM ƠN
Tôi cũng xin gửi lời cám ơn tới các Thầy, Cô giáo của Khoa Công nghệ thông tin, đã giảng dạy những kiến thức bổ ích, hiện đại về lĩnh vực Công nghệ phần mềm mà tôi học tập Tôi đã được tiếp cận một môi trường học thuật cao, hiểu được sự vất vả cũng như thành quả đạt được khi tham gia nghiên cứu khoa học
Tôi xin chân thành cảm ơn Tiến Sĩ Đỗ Trung Tuấn là những cán bộ giảng viên của Đại học Công Nghệ đã tận tình giúp đỡ tôi về cả chuyên môn, nghiên cứu và định hướng phát triển trong suốt quá trình làm luận văn
Với bạn bè cùng khóa Xin cám ơn vì đã cho tôi cơ hội trao đổi, chia sẻ kiến thức và kinh nghiệm thực tế qua các môn học Mọi người đã giúp tôi hiểu thêm những vấn đề mà tôi không có điều kiện tìm hiểu, chỉ cho tôi những thứ tôi chưa làm được Tôi có thể tiếp thu được thêm nhiều vấn đề mới và biết được giá trị của việc không ngừng cố gắng học tập, nghiên cứu
Cuối cùng, với gia đình, tôi xin gửi lời biết ơn sâu sắc vì gia đình đã luôn ở bên và ủng
hộ tôi trên con đường học tập và nghiên cứu khó khăn, vất vả Tôi mong rằng với sự cố gắng học tập nâng cao kiến thức, sau này sẽ có thể lĩnh hội nhiều công nghệ, tạo ra nhiều sản phẩm phần mềm có giá trị sử dụng cao, giúp ích được trong nhiều lĩnh vực của cuộc sống
Hà Nội, tháng 4 năm 2014
Nguyễn Thế Thành
Trang 5MỤC LỤC
LỜI CAM ĐOAN 3
LỜI CẢM ƠN 4
MỤC LỤC 5
DANH MỤC CÁC TỪ VIẾT TẮT 8
DANH MỤC CÁC HÌNH VẼ, BẢNG BIỂU 10
MỞ ĐẦU 12
Đặt vấn đề, định hướng nghiên cứu 12
Mục tiêu của luận văn 14
Phương pháp và phạm vi nghiên cứu của luận văn 15
Nội dung của luận văn 15
Chương 1 Giới thiệu tổng quan về công nghệ in, Các kỹ thuật bình bản hiện nay và các yêu cầu bài toán 17
1.1 Khái niệm chung kỹ thuật in 17
1.1.1 Lịch sử ra đời 17
1.1.2 Kỹ thuật chung 18
1.2 So sánh kỹ thuật cổ điển và kỹ thuật bình bản qua các giai đoaạn 19
1.2.1 Giai đoạn 1 19
1.2.2 Giai đoạn 2 19
1.2.3 Giai đoạn 3 20
1.3 Các kỹ thuật bình bản và yêu cầu bài toán 20
1.3.1 Tổng quát 20
1.3.2.Kỹ thuật chính 21
1.4 Kết luận 23
Chương 2 Cấu trúc chuẩn nén PDF 25
2.1 Tổng quan về PDF 25
2.1.1 Đối tượng 25
2.2 Các đối tượng Objects 26
2.2.1 Đối tượng String 26
2.2.2 Đối tượng Mảng 26
2.2.3 Đối tượng từ điển 26
Trang 62.2.4 Đối tượng Stream 27
2.3 Mô tả chi tiết cấu trúc tệp 27
2.3.1 Phần đầu 28
2.3.2 Phần thân tệp 28
2.3.3 Bảng tham chiếu chéo 28
2.3.4 Cập nhật gia tăng 28
2.3.5 Cây trang 29
2.3.6 Đối tượng trang 29
2.3.7 Thừa kế thuộc tính trang 30
2.3.8 Dòng nội dung và tài nguyên 30
2.3.9 Đối tượng String 31
2.3.10 Đối tượng Rectangles 31
2.4 Đồ họa 32
2.4.1 Các toán tử về trạng thái đồ họa 32
2.4.2 Các toán tử xây dựng đường 32
2.4.3 Không gian màu 32
2.5 Hình ảnh 34
2.5.1 Định nghĩa 34
2.5.2 Các tham số ảnh 35
2.5.3 Hệ trục tọa độ cho hình ảnh 35
2.5.5 Các khuôn dạng XObjects 36
2.6 Văn bản 37
2.7 Kết luận 37
Chương 3 Phân tích, thiết kế hệ thống bình bản 38
3.1 Đặt vấn đề 38
3.2 Phân tích các yêu cầu 39
3.3 Đặc tả các chức năng 39
3.4 Thiết kế hệ thống 40
3.4.1 Đặc tả lần lượt các Use case 41
3.4.2 Thiết kế lớp và Class Diagram 45
3.5 Thiết kế giao diện tương tác 45
3.6 Kết luận chương 50
Trang 7Kết luận chung 52
Tài liệu tham khảo 53
Phụ lục 54
1 Thiết kế Class chính 54
2 Giải thuật Uscase tay sách 8 trang 56
3 Use case Bình 16 trang: 58
3 Giải thuật cho việc đống lồng hai vạch 60
4 Thuật toán về tiện ích 62
Trang 8Cross-Reference Table Bảng tham chiếu chéo
Incremental Update Cập nhật gia tăng
Doucument Catalog Bảng xếp hạng tài liệu
Tay sách Là khuôn in trước và sau của một tời giấy
Hạt Tram’t hay còn gọi là
Hafltone
Là phần tử in nhỏ trong phạm vi của một ô vuông mà mực in có thể phủ lên, nó tùy thuộc vào độ phân giải của máy in hay còn gọi là DPI ( dot per Inch)
Page tree Cây trang, cấu trúc cây của các trang trong tệp PDF
String Object Đối tượng xâu ký tự
Rectangles Object Đối tượng hình chữ nhật
Graphic State Trạng thái đồ họa
Graphic state Operator Toán tử trạng thái đồ họa
Color Model Hệ màu sắc ( từ sử dụng trong ngành in, nghệ thuật vẽ)
Trang 9Sample Reprentation Mẫu trình bày
Image Coordinate System Hệ tọa độ hệ thống cho hình ảnh
Image dictionary Từ điển hình ảnh
Struct Parent Cấu trúc cha
Character Spacing Khoảng cách giữa các ký tự
Word spacing Khoảng cách giữa các từ
Kerning Khoang cách giữa các từ trong dòng Text Knockout Chữ bị đục rỗng ở giữa
Actor Tác nhân giao tiếp hành động với Usecase
Trang 10DANH MỤC CÁC HÌNH VẼ, BẢNG BIỂU
Hình 1.1: Máy in Offset nhiều cụm màu 17
Hình 1.2: Máy in Phim dùng cho chế bản 18
Hình 1.3: Máy phơi bản 18
Hình 1.3: Mô hình nhà máy in với các công đoạn 19
Hình 1.4: Ví dụ tay sách 16 trang 21
Hình 1.5: Ví dụ về bình bản thủ công 21
Hình 1.6: Ví dụ kỹ thuật đóng lồng 2 vạch 22
Hình 1.7: Ví dụ kỹ thuật khâu chỉ 2 vạch 23
Hình 2.1: Hình cấu trúc tệp PDF 25
Hình 2.2: Mô tả cấu trúc tệp 27
Hình 2.3: Cấu trúc tệp có gia tăng Cập nhật 29
Hình 2.4: Kế thừa các thuộc tính của trang 30
Hình 2.5: Ví dụ Sampled Image 34
Hình 2.6: Hệ trục tọa độ 36
Hình 2.7: Mapping the Source Image 36
Hình 3.1: Bình khuôn tay sách 16 39
Hình 3.2: Bình khuôn 32 40
Hình 3.3: Đặc tả Usecase 41
Hình 3.4: Bình khuôn 8 trang 42
Hình 3.5: Đóng lồng 2 vạch 43
Hình 3.6 Biểu đồ lớp 45
Hình 3.7: Giao diện chính 46
Hình 3.8: Bình đóng lồng: 46
Hình 3.9: Giao diện Bình khâu chỉ 47
Hình 3.10: Giao diện bình Bìa 47
Hình 3.12: Chọn nơi có file thiết kế 48
Trang 11Hình 3.13:Lựa chọn phương thức bình 49
Hình 3.14: Chọn nơi lưu kết quả 49
Hình 3.15: Thể hiện kết quả 50
Hình 3.16: Phóng to kết quả 50
Trang 12MỞ ĐẦU
Phần mềm bình bản tự động là một tiên ích vô cùng quan trọng trong qui trình in của một Nhà máy in Bởi vì với kỹ thuật hiện đại sử dụng công nghệ thông tin trong dây truyền sản xuất sản phẩm in thì phòng kỹ thuật thiết kế sách báo và chế bản (Hay còn gọi là bình bản, tiếng anh còn gọi là Impose), sau khi người thiết kế sản phẩm in như sách, báo, tạp chí, bằng các phần mềm Indesign, Coreldraw, QuarkExpress, Word, và được Ban Giám đốc duyệt in, người kỹ thuật viên sẽ chuyển sách thành tệp.PDF Vì cấu trúc tệp.PDF rất đặc biệt, độc lập với với các hệ điều hành, có tính bảo mật cao và là tiêu chuẩn của tệp đầu vào cho các loại máy in bản in hoặc bản tệp (chuẩn quốc tế) Cấu trúc tệp này bảo toàn nội dung trang in, cho ra sản phẩm in hoàn hảo về chất lượng của độ phân giải, cũng như không gian màu (Color Space) của các đối tượng trong từng trang PDF Mặt khác Tệp.PDF được chuyển đi nơi khác in cũng bảo toàn nội dung, nhất là nội dung của báo chí mang tính chất chính trị, văn hóa Sau đó tệp
sẽ được phần mềm bình bản tạo ra những cặp trang in mặt trước và mặt sau của tờ giấy in loại
to gọi là tay sách (Danh từ chuyên ngành in) Tệp.pdf nay sẽ được đưa vào một máy Trạm có tên là Rip station viết tắt của từ (Raster Imaging Processing), máy này kết nối với máy In bản hoặc máy in Phim, mỗi một trang sẽ in ra thường là bốn màu (CMYK) cũng có thể có nhu cầu
về sản phẩm họ có thể in thêm màu thứ năm;
So với sản phẩm phần mềm của nước ngoài như Prepress của hãng Kodak, và Quite box, thì phần mềm ta làm dễ thao tác hơn rất nhiều, đảm bảo chất lượng tuyệt đối, nhiều tính năng mở rộng, dễ thao tác bằng tiếng việt giúp người thợ bình không sai sót trong kỹ thuật tránh bù lỗ sản phẩm, tiết kiệm thời gian và tiền bạc
Chính vì vậy nội dung của khóa học đã giúp tôi nghiên cứu phần mềm lần đầu tiên của Nước ta trong lĩnh vực in ấn và thiết kế quảng cáo truyền thông đa phương tiện Phần mềm ra đời đánh dấu sự thành công của công nghệ in nước ta, do Bộ thông tin và Truyền thông quản lý ngành xuất bản và phát hành in Qua khóa học về công nghệ phần mềm giúp tôi có cái nhìn tổng quan hơn về thiết kế phần mềm, và bố cục thiết kế mềm dẻo, thuật toán chính xác đã cho kết quả khả quan Mục đích giúp các nhà máy in nhà nước và tư nhân có phần mềm tốt, yên tâm trong việc bình bản, tăng năng xuất lao động
Đặt vấn đề, định hướng nghiên cứu
Trong xã hội phát triển công nghệ như hiện nay, công nghệ thông tin đóng vai trò rất quan trọng trong các ngành sản xuất công nghiệp, đã có rất nhiều ứng dụng thông tin với ngành cơ khí, điện tử… Trong đó ngành công nghiệp in là một ví dụ về ứng dụng khoa học kỹ thuật, nhất là ứng dụng công nghệ thông tin để điều khiển máy móc, so với các thập kỷ 80, 90, thì các hệ thống máy in Offset, máy in Flexo, Máy in cuộn , đã dần ứng dụng tự động hóa trong sản xuất, đã góp phần tăng năng xuất lao động, làm ra nhiều của cải vật chất cho xã hội
Trang 13Thông tin về ấn phẩm càng ngày càng phong phú hơn, mẫu mã đẹp hơn, đã có các tờ tạp chí nổi tiếng, báo hàng ngày đến bạn đọc nhanh hơn, các công ty, các tổ chức đua nhau giới thiệu các loại ấn phẩm với các hình thức đẹp, làm cho sự cạnh tranh về phát triển quảng cáo cho họ ngày càng đa dạng, kiến thức được đưa tới nền giáo dục toàn xã hội được cải thiện, học sinh đã
có đủ sách với hình thức cải thiện đa dạng, có hình ảnh màu sắc nét, chữ không bị nhòe, đó là một công cuộc cải thiện hệ thống in trên toàn cầu Việt Nam là một nước đang phát triển đã đi đầu trong lĩnh vực đầu tư hệ thống máy in, được nhập từ các nước Cộng hòa liên bang Đức, Nhật bản và số ít là của Trung quốc
Mặt khác lĩnh vực thiết kế đồ họa đã được đào tạo và phát triển trong nhiều trường đại học và cao đẳng, các trung tâm dạy nghề, đã áp dụng các phần mềm nổi tiếng như CorelDraw, Photoshop, Illustrator, Indesign, QuarkExpress, đặc biệt là bộ phần mềm Office của hãng Microsoft Do đó khi kỹ năng sử dụng cũng như các phiên bản ra đời đã làm cho các Designer thao tác dàn trang, thiết kế linh hoạt hơn, họ biết vận dụng kiến thức công nghệ thông tin và kỹ thuật đồ họa để làm ra các sản phẩm ấn phẩm hàng ngày
Hãng phần mềm Adobe đã cho ra đời bộ các phiên bản Acrobat cho phép người dung xem nội dung của PDF và chỉnh sửa căn bản, là cuộc cách mạng lớn trong ngành công nghệ thông tin về đảm bảo sự truyền thông mang tính chất toàn vẹn và gắn thêm bộ phần mềm biên dịch các tệp DOC, ID, XL, RT, Tiff, PNG, AI ra tệp định dạng PDF đó là phần mềm Driver
PDF Printer chuyển thành Tệp.PS, Tệp.prn, rồi tiếp tục qua phần mềm AcrobatDistiller biên
dịch ra tệp PDF;
Từ bản Acrobat 6 trở đi sản phẩm in được chuyển từ các phần mềm thiết kế đồ họa sau
đó được convert sang Tệp.PS qua phần mềm AcrobatDistiller cho ra kết quả là Tệp.pdf thật
đáng ngạc nhiên, vì các đường nén, hình ảnh font chữ không bị ―răng cưa‖ như các phiên bản Acrobat 5 trở về trước;
Tháng Riêng năm 2007 Hãng phần mềm Adobe đã công bố và phát hành bản Full PDF 1.7 và được đặc tả do Viện tiêu chuẩn đánh giá (American National Standard Institute (ANSI)
và hiệp hội quản lý thương mại AIIM và hướng tới tiêu chuẩn ISO Mùa xuân năm năm 2008 ISO 32000 tài liệu đã được chuẩn bị bởi Adobe dựa trên bản tham khảo PDF ấn bản thứ sáu
Mục tiêu của PDF là để cho phép người dùng trao đổi và xem các tài liệu điện tử dễ dàng và đáng tin cậy, độc lập với môi trường mà chúng được tạo ra hay môi trường mà ở đó họ được xem hoặc in Cốt lõi của PDF là một mô hình chụp ảnh tiên tiến có nguồn gốc từ PostScript ® mô tả trang ngôn ngữ Hình ảnh mẫu PDF cho phép mô tả của văn bản và đồ họa trong một thiết bị độc lập và cách giải quyết độc lập Để cải thiện hiệu suất tương tác, PDF định nghĩa một nhiều hơn định dạng cấu trúc hơn so với sử dụng bởi hầu hết các chương trình ngôn ngữ PostScript Không giống như Postscript, PDF là một ngôn ngữ lập trình, PDF dựa trên một định dạng tập tin nhị phân có cấu trúc được tối ưu hóa cho hiệu suất cao PDF cũng
Trang 14bao gồm các đối tượng, chẳng hạn như các chú thích và các liên kết siêu văn bản, đó không phải là một phần của nội dung trang đó nhưng rất hữu ích để xem tương tác và trao đổi tài liệu
Trong mười bốn năm qua, được hỗ trợ bởi sự tăng trưởng bùng nổ của Internet, PDF đã trở thành sử dụng rộng rãi cho trao đổi điện tử của tài liệu Có một số ứng dụng cụ thể của PDF mà đã phát triển việc sử dụng một số tính năng của PDF và yêu cầu sử dụng của người khác, giúp tăng cường tính hữu dụng của PDF ISO 32000 là một tiêu chuẩn ISO cho các chức năng PDF đầy đủ; các tiêu chuẩn sau đây để sử dụng chuyên biệt hơn PDF /X (ISO 15930 ) hiện nay là tiêu chuẩn công nghiệp cho các đại diện trung gian của tài liệu in trong điện tử hệ thống chế bản cho các ứng dụng in ấn thông thường PDF / A (ISO 19005 ) hiện nay là tiêu chuẩn công nghiệp cho việc lưu trữ các tài liệu kỹ thuật số PDF / E (ISO 24.517 ) cung cấp một cơ chế để đại diện cho kỹ thuật tài liệu và trao đổi dữ liệu kỹ thuật Như các tập đoàn lớn, các Cơ quan Chính phủ, và tổ chức giáo dục, sắp xếp hợp lý hoạt động của mình bằng cách thay thế công việc trên giấy với trao đổi điện tử của thông tin, tác động và cơ hội cho các ứng dụng của PDF sẽ tiếp tục tăng trưởng với tốc độ nhanh chóng;
Trong quy trình công nghệ in Giai đoạn Sau khi thiết kế rồi đưa vào bình bản là giai đoạn quan trong nhất Vì qui trình bình có nhiều phương thức bình bản tương ứng với nhiều loại sản phẩm khác nhau: chẳng hạn phương thức của sách đóng lồng khác với phương thức của sách khâu chỉ, khuôn in 16, 12, 24, 32,64 trang đều khác nhau về phương thức gấp;
Ngoài ra với việc in tờ rơi, tem nhãn, cũng là mội vấn đề nhức nhối, loay hoay của các
kỹ thuật viên trong lúc dàn trang in Vì vậy việc thiết kế phần mềm bình bản dựa vào tệp nguồn là tệp PDF là một hướng đi đúng đán cho việc thiết kế ứng dụng cho ngành in nước ta Ngoài ra cũng phát triển thêm các ứng dụng xây dựng Form mẫu trên tệp PDF
Mục tiêu của luận văn
Trên cơ sở của nhu cầu ngành công nghiệp in trong nước, trên cơ sở nghiên cứu bản tham chiếu PDF 1.7 của hãng ADOBE, kết hợp với các hàm API mở PDF, iTexsharp, PDF Sharp để phát triển phần Với cấu trúc đặc biệt, mô tả nội dung tệp Đầy đủ về hình ảnh và nội dung phù hợp nhất cho tất cả các máy in dạng kỹ thuật số, máy in Lazer, máy Phim, máy in Plate cho chế tạo bản in Nên mục tiêu của luận văn là thiết kế phần mềm phù hợp với người Việt Nam, nhanh chóng, chính xác Đồng thời gắn yêu cầu của thợ chế bản trong các nhà máy điển hình để phát triển phẩn mềm bình bản tự động với các chức năng cơ động chính xác và dễ
sử dụng
Việc khảo sát được thực hiện trên các nhà máy: Nhà in khoa học và công nghệ thuộc viện công nghệ khoa học việt nam, Xưởng sản xuất in thực nghiệm của trường Cao đẳng công nghiêp in Công ty in Phim Indesign, và các đồng nghiệp ngành in trên cả Nước đã đóng góp
ý kiến cho việc hoàn thành phần mềm
Trang 15Phương pháp và phạm vi nghiên cứu của luận văn
Đây là một đề tài mang nhiều tính áp dụng công nghệ và nâng cao khả năng lập trình trong lĩnh vực mới đó là đồ họa, cung cấp các giải pháp cho ngành thiết kế, chế bản trong lĩnh vực sản xuất in ấn phẩm cho xã hội trên các loại chất liệu Trong đó Tệp in cuối cùng là định dạng PDF, PDF là đầu vào chuẩn của tất cả các loại máy in kỹ thuật số theo nhiều dạng khác nhau;
Khác với các loại chủ đề nghiên cứu như các phần mềm quản lý sử dụng Database, hoặc truyền thông mạng Để mang lại lợi ích nho nhỏ cho Ngành in Việt Nam tôi đã mạnh dạn đề xuất nghiên cứu với sự đồng ý, tán thành của PGS.TS Đỗ Trung Tuấn, qua quá trình nghiên cứu và theo dõi sát sao nội dung của đề tài PGS.TS Đỗ Trung Tuấn đã góp ý và sửa chữa rất nhiều cho tôi để có thể hoàn thành Đề tài này
Trong đề tài đã hiểu sâu nội dung của định dạng PDF, và mã nguồn mở ItextShap, tìm
ra hướng phát triển phần mềm, phân tích kỹ các nội hàm của các phương thức gấp của các loại máy in, máy gấp trong các nhà máy in
Để xây dựng bộ Framwork làm nền tảng cho Phần mềm, luận văn tham khảo bộ tham chiếu PDF: Document management — Portable document format — Part 1: PDF 1.7 © Adobe Systems Incorporated 2008 – All rights reserved., trên http:// www adobe com/devnet/ pdf/ pdf_reference.html
Sau khi xây dựng xong các tính năng nền tảng, tập trung vào nghiên cứu các thuật toán tính layout và gấp của các trang sách định dang PDF
Nội dung của luận văn
Luận văn thực hiện xuyên suốt trong quá trình từ khi hình thành các khái niệm, ý tưởng nghiên cứu, cho đến khi hoàn thành sản phẩm và được người sử dụng kiểm tra, đánh giá Nội dung chính sẽ bao gồm các phần sau:
1 Mở đầu: đặt ra vấn đề, mục tiêu và giải pháp cho bài toán Bình bản tự động, các
ưu và nhược điểm của các phần mềm ngoại từ đó xây dụng bài toán phù hợp cho người Việt Nam
2 Chương 1: Giới thiệu tổng quan về công nghệ in, Các kỹ thuật bình bản hiện nay đối với các sản phẩm sách, báo, tạp chí, tem nhãn, các yêu cầu bài toán
3 Chương 2: Tóm tắt Cơ sở lý thuyết dựa trên nghiên cứu bản tham chiếu Cấu trúc PDF của Adobe và Itextsharp
4 Chương 4: Phân tích, thiết kế hệ thống Phần mềm bình bản theo sơ đồ Use case, đặc tả cách thức hoạt động của từng chức năng của hệ thống (input, output, mô tả các bước)
Trang 16Cuối cùng là phần kết luận, đánh giá về triển khai, đánh giá và thực nghiệm, cài đặt phần mềm, khảo sát các phản hồi từ người sử dụng Lập các biểu đồ dựa trên các kết quả khảo sát và từ đó đưa ra kết luận về các tính năng của hệ thống, khả năng áp dụng trong thực tế Phần này tổng kết lại những kiến thức đã tích lũy, kinh nghiệm được áp dụng trong suốt quá trình thực hiện luận văn Đưa ra được các hướng phát triển trong tương lai
Trang 17Chương 1 Giới thiệu tổng quan về công nghệ in, Các kỹ thuật bình bản hiện nay và các yêu cầu bài toán
1.1 Khái niệm chung kỹ thuật in
1.1.1 Lịch sử ra đời
Ngành công nghiệp in ra đời từ rất lâu, trước thập kỷ 80 nước ta đang sử dụng công nghệ in là Typo, in bản là chữ chì, in lưới, in ống đồng ;
Hình 1.1: Máy in Offset nhiều cụm màu
(Máy in offset hiện đại nhiều cụm màu để in mỗi cụm một loại mực trong các mực CMYK)
Đến giữa thập kỷ 90 công nghệ in Offset ra đời đánh dấu một bước ngoặt mới trong lĩnh vực in ấn, tốc độ in nhanh hơn, kích thước bản in cũng lơn hơn và đa dạng, có máy in từ một cụm màu đến mười hai cụm màu cho in tự lật trở đầu giấy, chất lượng hình ảnh cũng tăng cao; Hai nước phát triển máy in nhiều nhất là Cộng hòa liên bang Đức và Nhật bản, chuyên sản xuất Máy in, máy gấp, may keo, máy cắt , và dây truyền sản xuất giấy mực
Trang 18Hình 1.2: Máy in Phim dùng cho chế bản
(Máy in phim dùng để in từ máy tính bản thiết kế hoặc tay sách ra phim)
Hình 1.3: Máy phơi bản
(Máy phơi bản dùng để cho tấm phim lên trên bản, ánh sáng sẽ chiếu xuyên qua phim làm cho các phần tử in trên bản bị mất khi có ánh sáng và còn lại khi không có ánh sáng xuyên qua khi nhúng bản vào dung dịch NaOH)
Ở nước ta đa số nhập máy in của nước ngoài, hiện nay chưa nghiên cứu và chế tạo được, thậm chí các phần mềm điều khiển máy cũng không nghiên cứu được, mà mua của nước ngoài là chủ yếu Công nghệ thông tin phát triển cũng là nhịp cầu nối cho ngành công nghiệp
tự động hóa tăng lên, trong đó ngành in đã đem công nghệ thông tin ứng dụng trong kỹ thuật điều khiển máy in, máy in bản, máy in phim, máy in kỹ thuật số tốc độ cao
Từ những năm 2008 trở về những năm 1995 Là kỹ thuật in Offset sử dụng máy in phim
để in ra bản phim sau đó phim được chiếu chụp lên bản hợp kim, qua qua trình rửa bản bời dung dịch sút những phần tử không được chiếu sang được giữ lại bản kim loại và sau đó người thợ sẽ lắp lên khuôn in (thường sách in màu họ sử dụng 4 bản CMYK tưng ứng với 4 bản kim loại của cùng một khuôn in) Sau đó từ những năm 2008 trở lai đây máy in bản trực tiếp thay thế dần máy in phim, các màu đều được in lần lượt trên bốn bản hợp kim
1.1.2 Kỹ thuật chung
Sau đó bốn bản hợp kim này được lắp vào máy in Offset Ngày nay họ còn phát minh ra loại máy in kỹ thuật số cũng in ra hình ảnh mà không cần công đoạn tạo bản, nhưng tốc độ không nhanh bằng in Offset Nói chung dù kỹ thuật in nào thì ngày nay họ đều sử dụng tín hiệu số để tạo ra hình ảnh trên khuôn in
Trang 19Hình 1.3: Mô hình nhà máy in với các công đoạn
Đó là qui trình từ khâu chế bản đến in ra sản phẩm chưa kể khâu gấp sách và gia công đóng bìa…, Riêng khâu chế bản từ dàn trang, thiết kế mẫu, sau đó bình bản thành khuôn, rồi in thử sản phẩm (Proof) sau đó đến CTP
Phần mềm tôi đang xây dựng chính là công đoạn quan trọng trong khâu chế bản và thiết
kế Vì tất cả các tệp thiết kế từ các phần mềm chuyên dụng như CorelDraw, Indesign, Illustrator, QuarkExpress, Word, đều được chuyển thành Tệp.Pdf sau đó những Tệp.PDF sẽ qua máy in phim hoặc in bản (Phim machine, Plate Machine);
1.2 So sánh kỹ thuật cổ điển và kỹ thuật bình bản qua các giai đoaạn
1.2.1 Giai đoạn 1
Những năm nước ta mới tiếp cận công nghệ thông tin, hồi đó Trường cao đẳng công nghiệp in và các nhà máy in trên cả nước ta đều sử dụng chương trình BKET của trường đại
học Bách khoa để gõ chữ trên phần mềm Ventura, với hệ đều hành MSDOS để soạn thảo văn
bản với Font chữ hữu hạn 16 bit, sau đó window 3 ra đời có MS OFFICE ra đời có máy in Phun và Lazer thế hệ cũ giúp các nhà máy in soạn thảo văn bản thay chữ chì bằng chữ in trên giấy mỏng có thể như là gần trong suốt gọi là giấy ―can‖, thợ kỹ thuật Layout hay gọi là bình bản sẽ xếp lên trên một bàn có tấm kính mờ phía dưới và có bóng đèn huỳnh quang, họ kẻ ô và xếp theo các kiểu khuôn in, sau đó tấm Polyme (Gọi là tấm đệm có dính các trang giấy in bằng băng dinh) gọi chung là các tay sách đã bình xong được đưa vào buồng Phơi hay máy Phơi Sau khoảng thời gian được chiếu sang, người thợ sẽ đưa bản vào máy rửa có dung dịch kiềm, bằng phương pháp ăn mòn hóa học, các phần tử in được giữ lại trên bản, chỗ nào không có
phần tử in ta gọi là phần trong suốt Phần tử người ta còn gọi là Halftone hay hạt Tram
1.2.2 Giai đoạn 2
Trong những năm này với sự ra đời các thế hệ máy tính MAC của hãng APPLE giúp cho thế hệ kỹ thuật xử lý ảnh Photoshop ra đời cùng phần mềm Acrobat 3.0, 4.0, và phần mềm CorelDraw, đồng thời các Máy tạo bản như máy Phim có các loại khổ được các nhà in mua về với giá hàng tỷ đồng để in trực tiếp các đối tượng đồ họa và văn bản lên trên Phim, làm cho
Trang 20sản phẩm in ra có được chất lượng độ nét và hình thức đẹp hơn, nhưng lúc này thợ thiết kế đồ họa trong phòng kỹ thuật phải bình bản bằng thủ công họ sử dụng CorelDraw, dùng chuột vẽ các khung chính xác và kéo thả các trang vẽ vào khung, việc này tốn kém nhiều thời gian và công sức, sau đó khâu kiểm tra rất nghiêm ngặt đảm bảo các Tay sách bình chính xác, nếu không sách báo in ra mà sai một trang cũng làm mất hàng triệu đồng, ảnh hưởng tiến độ công việc và vật tư sản xuất
1.2.3 Giai đoạn 3
Khi thế hệ các máy tính PC và MAC cùng phát triển phần cứng thông minh và chạy nhanh hơn, bộ nhớ ngoài tăng gấp hàng trăm lần, cùng với sự phát triển hệ điều hành Window
và OS, các phần mềm đồ họa với sự trợ giúp của các Card Màn hình có bộ vi xử lý đồ họa nên
các kỹ thuật viên thao tác nhanh và chính xác hơn, sự ra đời của các phần mềm Bình bản bắt
đầu, hiện nay giá thành rất cao và xử lý vẫn còn chậm, đa số các nhà in dụng bản phần mềm đã Crack, vi phạm bản quyền, vì lý do đó luận văn của tôi tập trung nghiên cứu phát trển phần
mềm Bình bản tự động cho Nước nhà và thế giới, phần mềm với đầu vào là dữ liệu Tệp.PDF, đầu ra là Tệp đã được bình và là Tệp.PDF
1.3 Các kỹ thuật bình bản và yêu cầu bài toán
1.3.1 Tổng quát
Bình bản là quá trình sau khi kỹ thuật viên thiết kế sách báo xong, họ chuyển tệp sang dạng PDF để in, tệp thiết kế thường được làm bằng các phần mềm Indesign, word, QuarkExpress, Coreldraw, publichser, Tệp được bình là tệp đã được quyết định in ( Được duyệt in) nếu không sau này thay đổi sẽ không được nữa vì mang đi in, nên phải đảm bảo chuẩn, nếu không sẽ rất tốn kém mực và giấy, và còn thời gian sản xuất nữa Kỹ thuật viên sẽ đem tệp.PDF chuẩn sang bình sách theo nhiều loại khuôn tùy theo kích thước máy in Offset
Do vậy việc bình này thường sử dụng thủ công, họ phải nhóm ( Group) từng trang một cho vào khuôn, việc này gây ra nhầm lẫn, nếu số trang sách nhiều sẽ mất thười gian, ngoài ra còn phải căn chỉnh các trang trong khuôn một cách thẳng hàng và đúng khuôn mẫu
Kỹ thuật bình trang hay bình bản có nhiều cách khác nhau tùy theo nhu cầu khách hàng, chẳng hạn: Bình sách đóng lồng khác với sách khâu chỉ hoặc keo gáy, ngoài ra còn bình tem nhãn, hộp,…
Mỗi một cuốn sách có thể tùy theo đặc thù mà họ có thể sử dụng phương thức khâu chỉ, đóng kẹp hoặc phương thức đóng lồng, kích thước khuôn in dựa vào các máy in khác nhau mà định ra qui tắc của khuôn khổ giấy cũng như khuôn in khác nhau;
Mỗi một tờ giấy đều được sử dụng in hai mặt do đó hai mặt in trên tệp người ta gọi là một ―tay sách‖ Vậy một cuốn có nhiều tay sách khác nhau Sách nhiều trang sẽ rất nhiều tay sách;
Trang 21Mỗi một cuốn sách có thể tùy theo đặc thù mà họ có thể sử dụng phương thức khâu chỉ, đóng kẹp hoặc phương thức đóng lồng, kích thước khuôn in dựa vào các máy in khác nhau mà định ra qui tắc của khuôn khổ giấy cũng như khuôn in khác nhau
Mỗi một tờ giấy đều được sử dụng in hai mặt do đó hai mặt in trên tệp người ta goi là một tay sách Vậy một cuốn có nhiều tay sách khác nhau Sách nhiều trang sẽ rất nhiều tay sách
Thường bình đóng lồng có hai loại khuôn:
Trang 22 Khuôn 2 vạch gấp
Khuôn 3 vạch gấp Bình hai vạch gấp có dạng như hình sau:
Trang 23Kỹ thuật bình khâu chỉ có các tay sách xếp liên tiếp với nhau theo chiều từ nhỏ đến lớn, tay số 1 đầu tiên, sau đó đến tay số 2, rồi đến tay cuối cùng, nếu có số trang dư mà không đủ xếp vào khuôn hiện tại, thì có thể xếp xuống khuôn nhỏ hơn
Mỗi tay sách đã nói ở phần trước gồm có hai mặt in, mặt đầu tiên là mặt in của tờ giấy, mặt thứ hai là mặt sau hay còn gọi là mặt trở của khuôn in dùng để in mặt sau của tờ giấy
Sau đây là hình minh họa về kỹ thuật đóng lồng
Hình các tay sách xếp liên tiếp
Hình 1.7: Ví dụ kỹ thuật khâu chỉ 2 vạch
Các trang số: 1, 4, 5 , 8 là các trang của khuôn in của tay sách, còn các trang số: 2, 3, 6,
7 thuộc khuôn trở của tay sách Ngoài ra các đầu sách quay ngược vào nhau để khi gấp đúng chiều trang chữ
1.4 Kết luận
Qua phần giới thiệu tổng qua công nghệ in một cách rõ ràng, thì giai đoạn Layout là một quá trình làm việc cực kỳ phức tạp và tốn công sức, là yếu tố quyết định sản phẩm in có đạt chất lượng hay khộng? trong trường hợp có sai sót nhỏ cũng làm ảnh hưởng tới chất lượng của sản phẩm (Sách, báo, tạp chí) Thậm chí làm chậm thời gian và tiền công, tiền mua vật
Trang 24tư… Vì vậy phần mềm Bình bản là công nghệ tiến tiến mà tôi nghiên cứu cho ngành In nước nhà Góp phần nhỏ vào công nghệ chế bản phục vụ cho dây truyền sản xuất trong các nhà máy
in Qua đề tài này Tôi rút ra kinh nghiệm trong quá trình xây dựng và thiết kế phần mềm, và biết vận dụng những kiến thức đã học trong các môn học của Trường đại học Công nghệ
Trang 25Chương 2 Cấu trúc chuẩn nén PDF
Do cấu trúc PDF cực kỳ phức tạp, nội dung mô tả rất nhiều phần Nên trong nội dung luận văn tôi chỉ đề cập các nội dung chủ yếu, còn nội dung chính là xây dựng phần mềm Bình bản Tự động trong chương 3
2.1 Tổng quan về PDF
Bao gồm tất cả mọi thứ về cú pháp của PDF vào đối tượng, tập tin, và mức độ tài liệu
Nó đặt kịch bản cho các mục, trong đó mô tả như thế nào về nội dung của một tập tin PDF được hiểu như mô tả trang, hỗ trợ tương tác định hướng và cơ cấu hợp lý ở cấp ứng dụng Cú pháp PDF được hiểu rõ nhất bằng cách xem xét nó như là bốn phần như hình sau:
Hình 2.1: Hình cấu trúc tệp PDF
2.1.1 Đối tượng
Một tài liệu PDF là một cấu trúc dữ liệu bao gồm từ một tập nhỏ các loại cơ bản của các đối tượng dữ liệu, " mô tả các bộ ký tự được sử dụng để viết các đối tượng và các yếu tố cú pháp khác "OBJECT", mô tả cú pháp và tính chất thiết yếu của các đối tượng., "đối tượng Stream, " cung cấp đầy đủ chi tiết của các kiểu dữ liệu phức tạp nhất, các đối tượng Stream là một ví dụ
2.1.1.1 cấu trúc tệp
Cấu trúc tệp (file structure) PDF xác định cách đối tượng được lưu trữ trong một tập tin PDF, làm thế nào chúng được truy cập, và làm thế nào chúng được cập nhật Cấu trúc này là độc lập với ngữ nghĩa của các đối tượng
Trang 262.1.1.2 cấu trúc tài liệu
Document structure PDF quy định cụ thể như thế nào các loại đối tượng cơ bản được sử dụng để đại diện cho các thành phần của một tài liệu PDF: Trang, font chữ, chú thích, và vv
mô tả cấu trúc tài liệu tổng thể; các phần sau giải ngữ nghĩa chi tiết của các thành phần
3.1.1.3 Dòng nội dung
Một Content Stream PDF có chứa một chuỗi các hướng dẫn mô tả sự xuất hiện của một trang hoặc đối tượng đồ họa khác Những hướng dẫn này, đồng thời cũng biểu diễn như là đối tượng, là khái niệm khác biệt với các đối tượng đại diện cho cấu trúc tài liệu và được mô tả một cách riêng biệt "Nội dung của Streams và Tài nguyên, " thảo luận về các Stream nội dung PDF và các tài nguyên liên quan của chúng trong các phần sau
2.2 Các đối tƣợng Objects
PDF bao gồm tám loại cơ bản của các đối tượng: Giá trị Boolean, Integer và số thực, chuỗi, tên, mảng, Từ điển, Stream, và các đối tượng null Boolean nhận hai giá trị true và False Một số nguyên được viết như một hoặc nhiều chữ số thập phân tùy chọn trước bởi một dấu Giá trị được hiểu như một số nguyên thập phân đã ký và phải được chuyển đổi sang một đối tượng số nguyên
kỳ độ sâu nào
2.2.3 Đối tƣợng từ điển
Một đối tượng từ điển là một bảng kết hợp chứa các cặp của các đối tượng, được gọi là các mục của từ điển Yếu tố đầu tiên của mỗi mục là chìa khóa và yếu tố thứ hai là giá trị Chìa khóa sẽ là một tên (không giống như khóa từ điển trong PostScript, có thể là đối tượng bất kỳ cách nào) Giá trị có thể là bất kỳ loại đối tượng, bao gồm cả từ điển khác Một mục từ điển có giá trị là null ("đối tượng Null") được xem như là nếu mục không tồn tại (Điều này khác với
Trang 27PostScript, nơi vô giá trị hoạt động như bất kỳ đối tượng khác là giá trị của một mục từ điển.)
Số lượng các mục trong từ điển phải chịu giới hạn thực hiện; Một từ điển có mục không (0);
2.2.4 Đối tƣợng Stream
Một Đối tượng Stream, giống như một đối tượng chuỗi là một chuỗi các byte Hơn nữa, một dòng có thể có chiều dài không giới hạn, trong khi một chuỗi phải chịu giới hạn thực hiện
Vì lý do này, các đối tượng với số lượng có tiềm năng lớn của dữ liệu, chẳng hạn như hình ảnh
và mô tả trang, được biểu diễn như là Stream Ví dụ Một hình ảnh với 10 hàng và 20 cột, sử dụng một thành phần màu duy nhất và 8 bit cho mỗi thành phần, đòi hỏi chính xác 200 byte dữ liệu hình ảnh Nếu Stream sử dụng một bộ lọc, có phải đủ byte dữ liệu được mã hóa trong các tập tin PDF để sản xuất những 200 byte Lỗi xảy ra nếu Chiều dài quá nhỏ, nếu một EOD đánh dấu rõ ràng xảy ra quá sớm, hoặc nếu dữ liệu được giải mã không chứa 200 byte
2.3 Mô tả chi tiết cấu trúc tệp
Mục này mô tả cách đối tượng được tổ chức trong một tập tin PDF cho truy cập ngẫu nhiên hiệu quả và cập nhật gia tăng Một tập tin PDF Tuân thủ cơ bản được xây dựng trong bốn yếu tố sau đây :
Một tiêu đề line xác định các phiên bản của đặc tả PDF mà chiếu theo tập tin;
Body chứa các đối tượng tạo nên tài liệu chứa trong tập tin;
Một bảng tham chiếu chéo có chứa thông tin về các đối tượng gián tiếp trong các tập tin;
Hình 2.2: Mô tả cấu trúc tệp
Một trailer cho vị trí của bảng tham chiếu chéo và của một số đối tượng đặc biệt trong Body của các tập tin Cấu trúc ban đầu này có thể được sửa đổi bằng cách cập nhật sau đó, mà thêm các yếu tố bổ sung cho sự kết thúc của tập tin
Trang 282.3.1 Phần đầu
Dòng đầu tiên của một tập tin PDF sẽ là một tiêu đề bao gồm các ký tự 5 ―%‖ PDF, tiếp theo là cách ghi một số phiên bản của 1.N hình thức, trong đó N là một chữ số từ 0 đến 7 Một đầu đọc phù hợp sẽ chấp nhận các tập tin với bất kỳ tiêu đề sau đây:
2.3.2 Phần thân tệp
Một tập tin PDF sẽ bao gồm một chuỗi các đối tượng gián tiếp đại diện các nội dung của một tài liệu Các đối tượng, trong đó có các loại cơ bản được mô tả trong "đối tượng", đại diện cho các thành phần của tài liệu như font chữ, các Page, và hình ảnh mẫu Bắt đầu với PDF 1.5, Phần thân cũng có thể chứa các đối tượng Stream mỗi trong số đó có chứa một chuỗi các đối tượng gián tiếp, xem "đối tượng Streams"
2.3.3 Bảng tham chiếu chéo
Bảng tham chiếu chéo chứa thông tin cho phép truy cập ngẫu nhiên các đối tượng gián tiếp trong các tập tin để toàn bộ tập tin không cần phải đọc để xác định vị trí bất kỳ đối tượng
cụ thể Bảng phải có một mục line cho từng đối tượng gián tiếp, xác định số byte của đối tượng
đó trong Body của tập tin (Bắt đầu với PDF 1.5, một số hoặc tất cả các thông tin tham chiếu chéo có thể cách khác được chứa trong Stream tham chiếu chéo Xem thêm, "Cross-Reference Streams‖ Bảng tham chiếu chéo là phần duy nhất của một tập tin PDF với một định dạng cố định, cho phép các mục trong bảng để được truy cập ngẫu nhiên;
2.3.4 Cập nhật gia tăng
Các nội dung của một tập tin PDF có thể được cập nhật từng bước mà không cần viết lại toàn bộ tập tin Khi cập nhật một tập tin PDF từng bước, thay đổi sẽ được nối vào cuối của tập tin, để lại nội dung ban đầu của nó còn nguyên vẹn Ưu điểm chính để cập nhật một tập tin theo cách này là những thay đổi nhỏ để một tài liệu lớn có thể được lưu một cách nhanh chóng
Có lợi thế bổ sung: Trong hoàn cảnh nhất định, chẳng hạn như khi chỉnh sửa một tài liệu trên một kết nối HTTP hoặc sử dụng OLE nhúng (một công nghệ đặc trưng cho Windows), phù
Trang 29hợp không thể ghi đè lên nội dung của tập tin gốc Cập nhật cộng dồn có thể được sử dụng để lưu các thay đổi tài liệu trong bối cảnh này
Hình 2.3: Cấu trúc tệp có gia tăng Cập nhật
Ví dụ mỗi trang của tài liệu được đại diện bởi một đối tượng một trang từ điển bao gồm tài liệu tham khảo nội dung của trang và các thuộc tính khác, chẳng hạn như hình ảnh của mình trước ("Hình thu nhỏ hình ảnh") và bất kỳ chú thích ("Annotations" ) liên kết với nó Các đối tượng trang cá nhân được gắn với nhau trong một cấu trúc được gọi là cây trang (được mô tả trong "Page Tree"), do đó được xác định bởi một tham chiếu gián tiếp trong danh mục tài liệu Cha mẹ, con, anh chị em và các mối quan hệ các đối tượng trong PDF
2.3.5 Cây trang
Các trang của một tài liệu được truy cập thông qua một cấu trúc được gọi là cây trang, trong đó xác định thứ tự của các trang trong tài liệu Bằng cách sử dụng cấu trúc cây, phù hợp với đầu đọc chỉ sử dụng bộ nhớ hạn chế, có thể nhanh chóng mở một tài liệu có chứa hàng ngàn trang Cây có chứa các nút của hai loại trung cấp các nút, được gọi là các nút cây trang,
và các nút lá, được gọi là trang đối tượng-có hình thức được mô tả trong các điểm tiếp theo Phù hợp với sản phẩm này sẽ được chuẩn bị để xử lý bất kỳ hình thức cấu trúc cây xây dựng các nút như vậy Chú thích cấu trúc đơn giản nhất có thể bao gồm một nút cây trang duy nhất
mà tài liệu tham khảo tất cả các trang của tài liệu đối tượng trực tiếp Tuy nhiên, để tối ưu hóa hiệu suất ứng dụng, phù hợp với một writer có thể xây dựng cây của một hình thức đặc biệt, được gọi là cây cân bằng Thông tin thêm về hình thức cây có thể được tìm thấy trong cấu trúc
dữ liệu và giải thuật, bởi Aho, Hopcroft và Ullman
2.3.6 Đối tƣợng trang
Page OBbject Là được phân cấp theo sơ đồ hình cây gọi là: ‖Cây trang‖ là các đối tượng trang, mỗi trong số đó là một từ điển xác định các thuộc tính của một trang duy nhất của tài liệu
Trang 302.3.7 Thừa kế thuộc tính trang
Một số các thuộc tính trang trình bày trong bảng sau được chỉ định là di truyền Nếu một thuộc tính như vậy được bỏ qua từ một đối tượng trang, giá trị của nó được thừa hưởng từ
tổ tiên một nút trong cây trang Nếu thuộc tính là một trong những yêu cầu, một giá trị được cung cấp bằng một nút tổ tiên Nếu thuộc tính là tùy chọn và không có giá trị thừa kế được chỉ định, giá trị mặc định sẽ được sử dụng Một thuộc tính do đó có thể được xác định một lần cho một tập hợp toàn bộ các trang bằng cách xác định nó trong một nút cây trang trung gian và sắp xếp các trang chia sẻ các thuộc tính như con cháu của nút đó Hình sau minh họa thừa kế các thuộc tính Trong cây trang hiển thị, trang 1, 2, và 4 được xoay chiều kim đồng hồ 90 độ, trang
3 của 270 độ, trang 6 180 độ, và các trang 5 và 7 quay ở (0 độ)
Hình 2.4: Kế thừa các thuộc tính của trang
2.3.8 Dòng nội dung và tài nguyên
2.3.8.1 Dòng nội dung
Là phương tiện chính để mô tả sự xuất hiện của các trang và các yếu tố đồ họa khác Một dòng nội dung phụ thuộc vào thông tin chứa trong một từ điển tài nguyên liên quan; kết hợp, các đối tượng tạo thành một thực thể khép kín Điều khoản phụ này mô tả các đối tượng này
2.3.8.2 đối tượng dòng
Là một đối tượng dòng PDF có dữ liệu bao gồm một chuỗi các hướng dẫn mô tả yếu tố đồ họa được vẽ trên một trang Các hướng dẫn sẽ được biểu diễn dưới dạng các đối tượng PDF, sử dụng cú pháp cùng một đối tượng như trong phần còn lại của các tài liệu PDF Tuy nhiên, trong khi các tài liệu như một toàn thể là một tĩnh, cấu trúc dữ liệu truy cập ngẫu nhiên, các đối tượng trong dòng nội dung được hiểu và thực thi tuần tự
Trang 312.3.8.3 Từ điển tài nguyên
Như đã nêu ở trên, các toán hạng cung cấp cho các nhà khai thác trong một dòng nội dung thì chỉ được các đối tượng trực tiếp; các đối tượng gián tiếp và tài liệu tham khảo đối tượng không được phép Trong một số trường hợp, một Operator sẽ đề cập đến một đối tượng PDF được định nghĩa bên ngoài dòng nội dung, chẳng hạn như một từ điển chữ hoặc một dòng chứa dữ liệu hình ảnh Này được thực hiện bằng cách xác định các đối tượng như các nguồn tài nguyên được đặt tên và đề cập đến tên của họ từ bên trong dòng nội dung Tài nguyên được đặt tên sẽ chỉ có ý nghĩa trong bối cảnh của một dòng nội dung Phạm vi của một tên tài nguyên được cho một dòng nội dung cụ thể và sẽ không liên quan đến bên ngoài biết đến định danh cho các đối tượng như font chữ Tài liệu tham khảo từ một đối tượng bên ngoài của nội dung Stream khác bên ngoài của Stream nội dung được thực hiện bằng cách tham chiếu đối tượng gián tiếp chứ không phải là nguồn tài nguyên được đặt tên
2.3.9 Đối tƣợng String
PDF hỗ trợ một đối tượng chuỗi cơ bản ("String Object") Các đối tượng chuỗi sẽ được tiếp tục đủ điều kiện như là một chuỗi văn bản, một chuỗi PDFDocEncoded, chuỗi ký tự ASCII, hoặc byte chuỗi Trình độ chuyên môn tiếp tục phản ánh mã hóa được sử dụng để đại diện cho các nhân vật hoặc glyphs mô tả bởi chuỗi Chú thích Loại chuỗi văn bản là một subtype của loại dây và đại diện cho dữ liệu được mã hóa bằng cách sử dụng quy ước cụ thể;
Loại chuỗi văn bản được sử dụng cho các chuỗi ký tự đó sẽ được mã hóa trong một trong hai PDFDocEncoding hoặc các chương trình mã hóa ký tự Unicode UTF-16BE PDFDocEncoding có thể mã hóa tất cả các tiêu chuẩn ISO Latin 1 ký tự và là tài liệu trong Phụ lục D UTF-16BE có thể mã hóa tất cả các ký tự Unicode UTF-16BE và Unicode mã hóa ký
tự được mô tả trong tiêu chuẩn Unicode bằng Unicode Consortium;
PDFDocEncoding không hỗ trợ tất cả các ký tự Unicode trong khi UTF-16BE cho chuỗi văn bản được mã hóa trong Unicode, hai byte đầu tiên được 254 tiếp theo 255 Hai byte đại diện cho Unicode để byte đánh dấu, U + FEFF, chỉ ra rằng chuỗi được mã hóa trong UTF-16BE (về cuối lớn) chương trình mã hóa được quy định trong tiêu chuẩn Unicode
Trang 322.4 Đồ họa
Các toán tử Graphic được sử dụng trong các dòng nội dung PDF mô tả sự xuất hiện của trang đó sẽ được sao chép vào một thiết bị đầu ra raster Các cơ sở mô tả trong mục này được dành cho cả máy in và màn hình hiển thị các ứng dụng
2.4.1 Các toán tử về trạng thái đồ họa
Đồ họa khai thác trạng thái thao tác các cấu trúc dữ liệu được gọi là trạng thái đồ họa, global Framework trong đó các nhà khai thác đồ họa khác thực hiện Trạng thái đồ họa bao gồm các ma trận biến đổi hiện (CTM) viết tắt của cụm từ: current transformation matrix, mà các bản đồ tọa độ không gian người dùng sử dụng trong một dòng nội dung PDF vào đầu ra tọa
độ thiết bị Nó cũng bao gồm các màu sắc hiện tại, con đường cắt hiện tại, và nhiều thông số khác là các các toán tử vẽ (Painting Operator)
2.4.2 Các toán tử xây dựng đường
Chỉ định đường dẫn, trong đó xác định hình dạng, quỹ đạo đường, và khu vực của các loại khác nhau Chúng bao gồm điều hành để bắt đầu New Path, thêm đoạn thẳng và đường cong với nó và đóng kín;
2.4.3 Không gian màu
PDF bao gồm cơ sở để xác định màu sắc của các đối tượng đồ họa được vẽ trên trang hiện tại Cơ sở vật chất màu được chia thành hai phần: Đặc điểm kỹ thuật màu Một Writer phù hợp có thể chỉ định màu sắc trừu tượng một cách thiết bị độc lập Màu sắc có thể được mô tả trong bất kỳ của một loạt các hệ thống màu sắc, hoặc không gian màu Một số không gian màu
có liên quan đến màu sắc đại diện thiết bị (màu xám, RGB, CMYK ), những người khác để cảm nhận thị giác của con người (CIE -based) Một số tính năng đặc biệt cũng được mô hình hóa như không gian màu : mô hình, lập bản đồ màu, phân ly, và độ trung thực cao và màu sắc multitone vẽ màu Reader phù hợp sẽ tái tạo màu sắc trên các thiết bị đầu ra Raster theo một quy trình nhiều bước bao gồm một số sự kết hợp của chuyển đổi màu sắc, hiệu chỉnh gamma, bán sắc, và chuyển đổi quét Một số khía cạnh của quá trình này sử dụng thông tin được xác định trong PDF Tuy nhiên, không giống như các cơ sở đặc điểm kỹ thuật màu sắc, các cơ sở màu vẽ là thiết bị phụ thuộc và không nên được bao gồm trong một trang mô tả
Sự minh họa sự phân chia giữa PDF (Thiết bị độc lập) đặc điểm kỹ thuật màu sắc và cơ
sở vật chất màu rendering (Phụ thuộc vào thiết bị) Phần này mô tả các tính năng đặc điểm kỹ thuật màu sắc, bao gồm tất cả mọi thứ mà các tài liệu PDF cần phải xác định màu sắc Các cơ
sở cho việc kiểm soát màu vẽ (Mô tả trong phần sau) Như mô tả trong "Path-Painting Operator‖ Trong đó quy đinh S Toán tử tô viền viết tắt của chữ ―Stroke‖ và F viết tắt của chữ
―Fill‖ toán tử tô màu bên trong