EPUB Định dạng ePub viết tắt của Electronic Publication là một định dạng file chuẩn được dùng cho việc lưu trữ và đọc ebook trên các thiết bị di động phát triển bởi International Digital
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO
CỤC CÔNG NGHỆ THÔNG TIN
CÁC ĐỊNH DẠNG VÀ CÔNG CỤ TẠO EBOOK
Nội dung
I Một số thuật ngữ, khái niệm liên quan
- Công nghệ DRM:
Công nghệ DRM (Digital Rights Management) cho phép chủ sở hữu nội dung số như
nhạc, phim, sách, phần mềm kiểm soát thông tin của họ bằng cách hạn chế số lượng sao chép, thời gian sử dụng
DRM hoạt động thế nào? DRM sẽ xáo trộn thông tin trong file để người sử dụng không thể đọc được trừ khi có khóa mã hợp pháp Các file nhạc DRM có thể được gửi qua Internet nhưng trở nên vô dụng với những ai không trả tiền mua chúng
Ai sử dụng DRM? Mạng chia sẻ file ngang hàng, công nghệ nén MP3 và sự phổ biến của băng rộng không dây đã khiến nạn tải lậu tăng cao Do đó, các xưởng phim nằm trong số những công ty đầu tiên ứng dụng DRM cho định dạng DVD, tiếp đến là các hãng thu âm Một số công ty sản xuất CD cũng cho ra mắt sản phẩm chỉ có thể phát trực tiếp từ đĩa chứ không thể copy vào máy tính
Hạn chế của DRM? Một trong những vấn đề lớn là các công nghệ DRM không tương thích với nhau, vì thế người sử dụng không nghe nhạc tải từ dịch vụ Napster trên iPod được Thay đổi nhà cung cấp nhạc hoặc máy nghe nhạc đồng nghĩa với việc những ca khúc mà họ mua trước đó không còn hiệu lực
- Định dạng Reflowable và Unreflowable:
Có 2 định dạng nội dung file ebook cơ bản: Reflowable và Unreflowable
Reflowable là dạng tài liệu mà các chữ cái có thể phóng to, thu nhỏ, đổi font để
hiển thị vừa vặn với màn hình thiết bị một cách dễ dàng Nói một cách dễ hiểu, khi bạn chỉnh lại kích cỡ của cửa sổ hiển thị thì các dòng chữ sẽ được tự động chỉnh lại sao cho phù
Trang 2hợp với lề phải của trang văn bản, khi hết dòng thì tự động xuống dòng Các định dạng dạng này như HTML, EPUB, MOBI
Unreflowable (hay còn gọi là Fixed-layout) là dạng tài liệu giữ nguyên được format,
giữ nguyên y xì trải nghiệm đọc trên mọi thiết bị, và rất tốt cho in ấn Điển hình của định dạng này là PDF
Xu hướng tương lai đương nhiên là đọc trên nhiều thiết bị với kích cỡ màn hình khác
nhau nhiều, do đó Reflowable sẽ là chuẩn mực tốt.
Trang 3II Các định dạng Ebook
II.A Các định dạng Ebook chính
II.A.1 EPUB
Định dạng ePub (viết tắt của Electronic Publication) là một định dạng file chuẩn được
dùng cho việc lưu trữ và đọc ebook trên các thiết bị di động phát triển bởi International Digital Publishing Forum (IDPF) Đây là định dạng được thiết kế sao cho những văn bản hiển
thị trên màn hình có thể được tối ưu hóa cho các thiết bị hiển thị cụ thể được sử dụng bởi người đọc file ePub Tiền thân của ePub chính là chuẩn Open eBook (OEB) đưa ra năm 1999 Phiên bản Epub 2 được giới thiệu năm 2007, phiên bản Epub 3 ra đời năm 2011 với nhiều cập nhật đáng kể
Kiểu file: epub
Đặc điểm chính:
- Dựa trên XHTML và XML: Epub 2 được xây dựng với XHTML 1.1 and CSS2, Epub 3 được xây dựng với XHTML5 và CSS3
- Hỗ trợ định dạng Reflowable
- Hỗ trợ DRM
- Hỗ trợ nhúng siêu dữ liệu (metadata)
- Hỗ trợ nội dung âm thanh và video (phụ thuộc vào thiết bị hỗ trợ)
- Phiên bản Epub 3 có hỗ trợ định dạng công thức
II.A.2 Mobipocket
Định dạng Mobipocket dựa trên các tiêu chuẩn Open eBook (OEB) sử dụng XHTML
và có thể bao gồm JavaScript, được sử dụng với bộ đọc riêng Mobi ban đầu được thiết kế dành cho các PDA và sau này là điện thoại thông minh Sau khi mua lại công ty tạo ra định dạng này, Amazon đã phát triển Mobi thành cơ sở cho các định dạng eBook dành riêng cho Kindle Mobi hỗ trợ quản lý đầy đủ các quyền quản lý tài sản kỹ thuật số (DRM), nhưng những tài liệu Mobi chưa được mã hóa vẫn có thể được đọc tốt trên Kindle mà không gặp bất cứ khó khăn nào
Kiểu file: prc; mobi
Đặc điểm chính:
- Dựa trên XHTML
- Hỗ trợ định dạng Reflowable
- Có hỗ trợ DRM
- Hỗ trợ nhúng siêu dữ liệu (metadata)
- Không hỗ trợ nội dung âm thanh và video
II.A.3 Các định dạng Kindle
Kiểu file: azw3; azw; kf8
Trang 4Đây là các định dạng ebook độc quyền của Amazon, dựa trên định dạng MOBI Có 4 định dạng là:
- AZW: Rất gần với định dạng MOBI, đôi khi có, đôi khi không hỗ trợ DRM Công nghệ DRM là duy nhất cho Amazon Kindle
- AZW1: cũng là định dạng TPZ (Topaz), khác định dạng AZW ở chỗ có thể nhúng kèm các font chữ trong chính file ebook Định dạng này luôn có DRM
- AZW4: AZW4 là một định dạng độc quyền của Amazon cho sách giáo khoa Thực chất nó là định dạng PDF trong một “vỏ bọc” PDB (Palm Database File), và thường
sử dụng với DRM “Vỏ bọc” đó cung cấp phương thức DRM tương tự như được
sử dụng trên định dạng Mobipocket của Kindle
- KF8: (còn gọi là AZW3) là định dạng Kindle Fire của Amazon Về cơ bản nó là định dạng ePub đóng gói trong “vỏ bọc” PDB với DRM Amazon Ngoài Kindle Fire, định dạng này hiện tại đã được hỗ trợ bởi hầu hết các bộ đọc khác gần đây của Amazon, trở thành định dạng chủ yếu cho hầu hết các thiết bị Amazon Kindle
II.A.4 PDF (Portable Document Format)
Kiểu file: pdf
PDF là định dạng phát minh bởi Adobe từ 1993 và là một trong những định dạng file được sử dụng rộng rãi nhất PDF không hỗ trợ định dạng Reflowable Do được thiết kế cho mục đích để in nên kích thước của trang mặc định là cỡ A4 hoặc Letter Điều này khiến cho việc hiển thị ebook trên các thiết bị có màn hình nhỏ gặp nhiều bất tiện Người đọc buộc phải sử dụng chức năng zoom kết hợp cuộn trang để có thể đọc hết dòng chữ
Các đặc điểm khác:
- Không xây dựng trên HTML mà dùng dạng code độc quyền
- Hỗ trợ DRM: các file PDF có thể được mã hóa với hệ thống Adobe Content Server của Adobe hoặc người dùng tạo ebook có thể áp dụng mật khẩu bảo vệ vào file (tuy nhiên cũng không khó để phá bỏ)
- Hỗ trợ nội dung âm thanh và video
II.B Một số định dạng Ebook khác
II.B.1 NOOK Kids
Kiểu file: nook
NOOK Kids hay ePib là định dạng dành cho các thiết bị Barnes & Noble Nook Nó được thiết kế đặc biệt dành cho ebook cho trẻ em và được “bọc” dưới định dạng EPUB Định dạng này có một vài tính năng hữu ích như ghi âm thanh thuyết minh (âm thanh không nén), tùy chọn phóng to từng vùng, nhưng không cho phép nhúng video, không hỗ trợ làm nổi bật (highlighting) đoạn văn bản khi phát âm thanh thuyết minh, không hỗ trợ zoom trang Nó sử dụng dạng layout cố định chứ không phải định dạng Reflowable
Trang 5II.B.2 iBooks Author
Là dịnh dạng sử dụng trong công cụ iBook Author dành cho các thiết bị của Apple, xây dựng dựa trên chuẩn EPUB
Kiểu file: ibooks
Đặc điểm chính:
- Dựa trên XHTML 1.1 và CSS3
- Hỗ trợ cả định dạng Reflowable và Unreflowable (fixed layout).
- Hỗ trợ DRM: Các file iBook Author không có sẵn DRM nhưng khi bán ebook trên iBookstore, Apple sử dụng DRM FairPlay của họ
- Hỗ trợ nội dung âm thanh và video
II.B.3 Broadband eBooks (BBeB)
Kiểu file: lrf; lrx
Định dạng ebook này ban đầu được sử dụng bởi Tập đoàn Sony Đó là một định dạng riêng, nhưng một số phần mềm đọc cho máy tính thông thường, đặc biệt là trong Linux, có thể đọc được Các tập tin có phần mở rộng LRX dành cho ebook được mã hóa DRM Gần đây, Sony đã chuyển đổi các ebook của họ từ BBeB sang ePub và phát hành các ebook mới dưới dạng EPUB
II.B.4 Microsoft Compiled HTML Help
Kiểu file: chm
Định dạng CHM là một định dạng riêng của Microsoft dựa trên HTML Theo đó, nhiều trang và đồ họa nhúng được sắp xếp cùng với dữ liệu đặc tả (metadata) trong một file nén duy nhất Ngược lại, trong HTML, một trang web sẽ bao gồm nhiều file (riêng lẻ) HTML và các file hình ảnh đi kèm
II.B.5 DAISY – ANSI/NISO Z39.86
Kiểu file: zip
DAISY là chuẩn mở dựa trên XML đưa ra bởi hiệp hội DAISY (Digital Accessible Information SYstem) dành cho người khuyết tật Định dạng DAISY được hỗ trợ quốc tế rộng
rãi với các tính năng đa phương tiện, điều hướng và đồng bộ hóa Một số các định dạng DAISY đã được pháp luật tại Hoa Kỳ chấp nhận làm chuẩn xây dựng sách giáo khoa và tài liệu giảng dạy để cung cấp cho học sinh khuyết tật
Định dạng DAISY đã được thiết kế theo các tiêu chuẩn mở EPUB, và dự kiến sẽ hội tụ đầy đủ tính năng với phiên bản EPUB3
II.B.6 DjVU
Kiểu file: djvu
Trang 6DjVu là một định dạng chuyên để lưu trữ tài liệu từ máy quét ảnh Nó bao gồm các
bộ nén tiên tiến tối ưu hóa cho hình ảnh màu thấp, chẳng hạn như tài liệu văn bản Những file riêng lẻ có thể chứa một hoặc nhiều trang DjVu không thể hỗ trợ định dạng Reflowable
Các hình ảnh chứa trang tài liệu được chia thành các lớp riêng biệt (ví dụ như ảnh nhiều màu, độ phân giải thấp, lớp nền thì sử dụng nén lỏng (lossy), còn ảnh ít màu sắc, độ
phân giải cao, lớp cảnh thì dùng nén chặt (tighly)), mỗi ảnh nén được thực hiện bằng
phương pháp tốt nhất có thể Định dạng được thiết kế để giải nén rất nhanh chóng, thậm chí còn nhanh hơn so với các định dạng dựa trên vector
Ưu điểm của DjVu là nó có thể dùng bản quét có độ phân giải cao (300-400 DPI), đủ tốt cho cả việc đọc và in ấn trên màn hình, và lưu nó rất hiệu quả Hàng vài chục ảnh quét đen trắng độ phân giải 300 DPI có thể được lưu trữ ít hơn 1MB
II.B.7 FictionBook
Kiểu file: fb2
FictionBook là một định dạng ebook phổ biến dựa trên XML, được hỗ trợ bởi bộ đọc miễn phí như FBReader, Okular, CoolReader, BeBook và STDU Viewer
Khác với các định dạng ebook thường thấy, FictionBook chỉ bao gồm một file XML duy nhất Các ảnh được chuyển thành mã cơ số 64 và đặt bên trong thẻ <binary>, vì vậy kích thước của ảnh được nhúng tăng lên khoảng 37% Thông thường các file FictionBook được lưu trữ dưới dạng nén Zip và hầu hết các phần cứng và phần mềm đọc đều có thể làm việc trực tiếp với các file dạng nén đó Các dữ liệu mô tả và dữ liệu thuần văn bản được lưu ở đầu file, trong khi dữ liệu hình ảnh năng hơn được đặt cuối cùng Điều này cho phép phần mềm đọc có thể bắt đầu xử lý file FictionBook trước khi đọc hết toàn bộ file
Theo định dạng này, tất cả các dữ liệu đặc tả (metadata) ebook, chẳng hạn như tên tác giả, tiêu đề, và nhà xuất bản, cũng có mặt trong file ebook Do đó định dạng này thuận tiện cho việc xử lý tự động, lập chỉ mục và quản lý bộ sưu tập ebook Đây cũng là điểm thuận lợi để lưu trữ sách trong đó cho sau đó tự động chuyển đổi sang định dạng khác
FictionBook hỗ trợ định dạng Reflowable, không hỗ trợ DRM
II.B.8 Newton eBook
Kiểu file: pkg
Một file Newton duy nhất có thể chứa nhiều sách (ví dụ, ba cuốn sách của một bộ ba
có thể được đóng gói cùng nhau) Tất cả các hệ thống chạy hệ điều hành Newton (phổ biến nhất bao gồm Newton MessagePads, eMates, Siemens Secretary Stations, Motorola Marcos, Digital Ocean Seahorses và Tarpons) đã được hỗ trợ sẵn cho việc xem sách định dạng Newton Các định dạng gói Newton đã được phát hành cho công chúng bởi Newton Inc trước khi công ty này sáp nhập vào vào Apple Do đó các định dạng được cho là mở và nhiều người khác nhau đã viết bộ đọc cho nó
Trang 7Định dạng Newton không có hỗ trợ cho DRM hoặc mã hóa Hỗ trợ liên kết nội bộ, cho phép chèn nhiều bảng nội dung và các chỉ mục, cho phép nhúng hình ảnh, và thậm chí
hỗ trợ một số tính năng kịch bản tương tác
Bảng tổng hợp so sánh các định dạng ebook
Định dạng Kiểu file Hỗ trợ DRM Hỗ trợ ảnh Hỗ trợ bảng Hỗ trợ âm
thanh
Hỗ trợ tương tác
Hỗ trợ ngắt dòng
Chuẩn mở
Hỗ trợ nhúng chú giải
Hỗ trợ đánh dấu
Hỗ trợ Video
EPUB epub Yes Yes Yes Yes Yes Yes Yes Yes/No1) ( Yes/No (
Kindle .azw,
Portable
Document
Yes/No (
iBooks
Compiled
Newton
Chú giải:
(1): Tùy thuộc bộ đọc
(2): Phiên bản Epub 3
(3): Nhúng flash
(4): Hỗ trợ bảng trong phiên bản FictionBook 2.1, không hỗ trợ trong phiên bản 2.0
Trang 8III Giới thiệu một số công cụ tạo Ebook tiêu biểu
1 Ultimate eBook Creator
Bản quyền sử dụng: có phí
Website tham khảo: http://ultimateebookcreator.com/
The Ultimate eBook Creator (UEC) là một hệ thống hoàn chỉnh với ba sản phẩm trong một: Trình soạn thảo, trình tạo eBook (các định dạng MOBI, EPUB, PDF, MS Word), trình biên tập
UEC sử dụng bộ soạn thảo chuyên nghiệp WYSIWYG:
- Công cụ soạn thảo trực quan tương tự như MS Word
- Tích hợp trình kiểm tra chính tả (hơn 80 ngôn ngữ)
- Giao diện người dùng bằng tiếng Anh và tiếng Đức
- Tự động tạo ra và định dạng Mục lục (TOC)
- Thay đổi font chữ, màu sắc, định kiểu
- Import các tài liệu Microsoft Word, PDF và UEC
- Chèn văn bản, hình ảnh, tài liệu MS Word
- Chèn liên kết đến các trang web bên ngoài
- Chèn Bookmarks và liên kết đến các bookmark
- Nhúng Audio và Video vào eBook
- Tạo tương tác người dùng
Tích hợp công cụ chuyển đổi MS Word: Cho phép chuyển đổi trực tiếp bản thảo dưới
dạng MS Word thành các định dạng MOBI, EPUB, PDF
Tạo file ebook: Xuất thành file ebook hoàn chỉnh dưới các định dạng sau:
- Amazon MOBI
- EPUB (hợp chuẩn 100%)
- Văn bản dạng MS Word hoặc dạng PDF có bảng mục lục có liên kết
2 Maestro
Bản quyền sử dụng: có phí
Website tham khảo: http://www.ebookmaestro.com/
EBook Maestro Pro được trang toptenreviews.com đánh giá là phần mềm tạo ebook tốt nhất hiện tại Các tính năng nổi bật của Maestro bao gồm:
- Tạo các ebook độc lập dưới dạng file EXE từ các trang web (các trang HTML)
- Tính năng bảo vệ ebook
- Giao diện ebook được tùy biến hoàn toàn Người tạo ebook có thể thay đổi bất
kỳ chi tiết trong giao diện người dùng, bao gồm thanh menu, menu tìm kiếm, biểu tượng chương trình, vv
Trang 9- Ebook được tạo bằng Maestro hỗ trợ tất cả các bộ ký tự và có thể chứa và mở bất cứ file dạng: HTML, file đồ họa, file Flash, Java Script, VB Script, Style Sheets, file âm thanh, file video
3 Calibre
Bản quyền sử dụng: miễn phí, mã nguồn mở
Website tham khảo: http://calibre-ebook.com/
Calibre hỗ trợ rất nhiều định dạng khác nhau, từ định dạng phổ biến như: HTML, LIT, PDF, PRC, PDB, RTF, TXTđến những định dạng kém phổ biến hơn: CBZ, CBR, CBC, EPUB, FB2, MOBI, ODT, PML, RB.
Calibre cũng có khả năng chuyển đổi định dạng ebook rất mạnh mẽ, các định ra mà phần mềm này có thể xuất ra là: EPUB, FB2, OEB, LIT, LRF, MOBI, PDB, PML, RB, PDF, TXT
Nếu những ai dùng thiết bị đọc sách chuyên nghiệp như Sony Reader, Amazon Kindle, Bookeen Cybook hoặc iPhone/iPod Touch, điện thoại Android thì điều này thật sự hữu ích
Ngoài ra, Calibre còn có các tính năng:
- Tính năng quản lý thư viện ebook, hỗ trợ đồng bộ với các thiết bị cầm tay
- Cập nhật tin tức, và chuyển thành ebook
- Cập nhật thông tin ebook qua mạng
- Bản thân Calibre không có tính năng gỡ bỏ DRM của các ebook thương mai nhưng
có thể cài thêm plug-ins để làm việc đó
Calibre có nhiều phiên bản để chạy trên nhiều môi trường khác nhau như: Windows, Linux, Mac
4 Sigil
Bản quyền sử dụng: miễn phí, mã nguồn mở
Website tham khảo: https://code.google.com/p/sigil/
Sigil là công cụ tạo ebook định dạng EPUB, có các đặc tính sau:
- Hỗ trợ đầy đủ chuẩn định dạng EPUB 2
- Chạy được trên nhiều môi trường: Windows, Linux, Mac
- Nhiều chế độ xem: Xem sách, xem code, xem trước
- Tích hợp bộ soạn thảo trực quan WYSIWYG
- Tự động sinh bảng mục lục với nhiều mức
- Hỡ trợ soạn thảo đầy đủ dữ liệu đặc tả (metadata)
5 Mobipocket Creator
Bản quyền sử dụng: miễn phí
Website tham khảo: http://www.mobipocket.com/
Trang 10Mobipocket Creator là phần mềm dùng để tạo các ebook có định dạng PRC, dùng để đọc trên mobipocket hay trên máy tính Chương trình cho phép tạo file ebook PRC từ các file PDF, Word HTML và TXT (Text Document)
Ngoài việc tạo file PRC, chương trình còn hỗ trợ chuyển đổi qua lại giữa các định dạng: PRC, PDF, HTML, TXT
Giao diện chương trình sáng sủa, đẹp, và sử dụng cũng khá tiện
6 Anthemion Software Jutoh
Bản quyền sử dụng: có phí
Website tham khảo: http://www.jutoh.com/
Các đặc tính:
- Hỗ trợ nhiều định dạng ebook: Epub (cả Epub 2 và Epub 3) , Mobipocket, ODT, DOCX, HTML, CHM, text
- Đồng bộ thuyết minh với nội dung (Epub 3)
- Hỗ trợ định dạng đồ họa vector (SVG), định dạng công thức toán MathML (Epub 3)
- Cho phép tạo ebook cả định dạng reflowable và fixed-layout
7 iBooks Author
Bản quyền sử dụng: miễn phí
Website tham khảo: http://www.apple.com/ibooks-author/
iBooks Author miễn phí hoàn toàn, chỉ chạy trên MacOS và sản phẩm của nó chỉ hỗ trợ tốt nhất cho iPad mà thôi (định dạng ibooks) Bạn sẽ không tạo được ebook định dạng epub để cho các thiết bị khác, đơn giản vì nó sẽ mất các hiệu ứng iBooks Author cũng hỗ trợ bạn xuất file dạng pdf, tuy nhiên nó cũng mất hết hiệu ứng và cũng không khác những ebook thường khác
iBooks Author có ưu điểm là đơn giản, tự động hóa các bước, không tốn nhiều công sức Với iBooks Author thì việc bạn cần làm là tập trung vào nội dung ebook mà thôi, tất cả những công việc linh tinh khác như tạo chỉ mục, tạo link liên kết, tạo bảng giải mã đã được tự động làm hết
Với việc phát hành iBooks Author và cho phép người dùng cá nhân phát hành sách trên iTunes Store, Apple đã có một bước đi rất hay Động thái này giúp cho họ có thể kêu gọi được nhiều nguồn hơn để làm phong phú thư việc sách điện tử của mình
8 Kindle Writer
Bản quyền sử dụng: có phí
Website tham khảo: http://kindlewriter.co.uk/
Kindle Writer là công cụ tạo ebook cho các thiết bị Kindle của Amazon Phần mềm này cũng có các phiên bản cho từng môi trường Windows, Linux, Mac Cũng tích hợp bộ