1. Trang chủ
  2. » Luận Văn - Báo Cáo

NGÔN NGỮ XML VÀ CÁC NGUYÊN LÝ TƯ DUY SÁNG TẠO

26 900 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 26
Dung lượng 867 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Ngôn ngữ HTML HyperText Markup Language – Ngôn ngữ đánh dấu siêu văn bản được sử dụng rộng rãi và phát triển đến ngày nay.Tuy nhiên trong quá trình phát triển, người ta nhận thấy rằng SG

Trang 1

MỤC LỤC

Lời Mở Đầu 3

Phần I: Ngôn Ngữ XML 4

1.XML Là Gì? 4

2.Cấu Trúc Văn Bản XML 5

Phần II: Các Nguyên Lý Sáng Tạo Khoa Học Trong Việc Hình Thành Ngôn Ngữ XML 10

1.Nguyên Lý Chia Nhỏ 10

2.Nguyên Lý Tách Khỏi 11

3.Nguyên Lý Phẩm Chất Cục Bộ 12

4.Nguyên Lý Kết Hợp 14

5.Nguyên Lý Vạn Năng 18

6.Nguyên Lý Chứa Trong 21

7.Nguyên Lý Dự Phòng 22

Phụ Lục 25

Tài Liệu Tham Khảo 26

Trang 2

MỤC LỤC HÌNH

Hình 1 : XML không có phần tử gốc 6

Hình 2 : XML có các phần tử đang chéo vào nhau 6

Hình 3 : XML không có thẻ đóng 7

Hình 4: Văn bản XML dưới dạng bình thường 7

Hình 5: Văn bản XML được hiển thị bằng trình duyệt (browser) 8

Hình 6: Sử dụng XML cho nhiều mục đích khác nhau 18

Trang 3

1986 Sau đó đến năm 1991, Ngài Tim Berners-Lee đã cho ra đời một văn bản gọi là “HTML Tags”, dựa theo chuẩn SGML Ngôn ngữ HTML (HyperText Markup Language – Ngôn ngữ đánh dấu siêu văn bản) được sử dụng rộng rãi và phát triển đến ngày nay.

Tuy nhiên trong quá trình phát triển, người ta nhận thấy rằng SGML quá rắc rối và HTML còn nhiều hạn chế nên tổ chức W3C (World Wide Web Consortium: tổ chức độc lập định ra tiêu chuẩn cho trình duyệt Web, máy chủ và ngôn ngữ) thiết kế ra XML (eXtensible Markup Language – Ngôn ngữ đánh dấu mở rông) Và đây cũng là đề tài bài thu hoạch mà em

xin phép được giới thiệu – ngôn ngữ XML , đồng thời nêu bật những nguyên lý sáng tạo khoa học được áp dụng vào việc hình thành và phát triển ngôn ngữ này.

Em xin cảm ơn GS TSKH Hoàng Kiếm đã truyền đạt những kiến thức, những kinh

nghiệm quý báu cho em, để em có cơ sở và nền tảng để có thể tìm hiểu nhiều hơn, sâu hơn,

có cách nhìn một vấn đề dưới nhiều góc độ hơn

Do quá trình nghiên cứu cũng như kiến thức và tài liệu còn nhiều hạn chế nên bài viết còn nhiều thiếu sót, chưa được đầy đủ Em mong nhận được sự góp ý của Thầy để bài viết được thực sự hoàn chỉnh hơn

Trang 4

Phần I: Ngôn Ngữ XML

1 XML Là Gì?

XML (viết tắt từ tiếng Anh eXtensible Markup Language nghĩa là "Ngôn ngữ đánh dấu

mở rộng") là ngôn ngữ đánh dấu với mục đích chung do W3C đề nghị, để tạo ra các ngôn ngữ đánh dấu khác và có khả năng mô tả nhiều loại dữ liệu khác nhau Mục đích chính của XML là đơn giản hóa việc chia sẻ dữ liệu giữa các hệ thống khác nhau, đặc biệt là các hệ thống được kết nối với Internet Bản thân của XML rất là đơn giản, nhưng các công cụ được định ra để làm việc với XML như Document Object Model - DOM, XPath, XSL, v.v thì rất hữu hiệu, và chính các chuẩn này được phát triển không ngừng

XML cũng giống như HTML đều là ngôn ngữ đánh dấu, nhưng điều cần nói ở đây là sự

ra đời của XML để khắc phục cho một số yếu kém của HTML HTML và XML đều sử dụng các tag nhưng các tag của HTML là một bộ dữ liệu tag được xây dựng và định nghĩa trước, tức là người lập trình phải tuân thủ theo các thẻ đã định nghĩa của HTML, hiện HTML có khoảng hơn

400 tag, để nhớ hết 400 tag này cũng không có gì khó khăn đối với người lập trình web chuyên nghiệp nhưng thật khó đối với những người không chuyên Hơn nữa các tag của HTML không nói lên được mô tả dữ liệu trong đó Nhưng đối với XML thì hoàn toàn khác bởi

vì tag trong XML là do người lập trình định nghĩa và mỗi tag là một mô tả dữ liệu mà người lập trình muốn truyền đạt

Trang 5

2 Cấu Trúc Văn Bản XML

Nếu bạn đã xem xét những văn bản HTML, bạn đã quen thuộc với những khái niệm cơ bản khi sử dụng các thẻ để đánh dấu văn bản Phần này bàn về sự khác biệt giữa văn bản HTML và văn bản XML Nó sẽ kiểm tra những nguyên tắc cơ bản của văn bản XML, và bàn về thuật ngữ được dùng để miêu tả chúng

Một điểm quan trọng về văn bản XML: Chi tiết kỹ thuật XML đòi hỏi một trình kiểm ngữ

(parser) để từ chối bất cứ văn bản XML nào không theo những nguyên tắc cơ bản Hầu hết

những bộ kiểm ngữ HTML sẽ chấp nhận mọi sự đánh dấu và đoán biết điều gì mà tác giả văn bản đang đề cập đến Để tránh sự bừa bộn, lỏng lẻo này, những người sáng tạo XML quyết định thực hiện kết cấu văn bản ngay khi bắt đầu

Có ba loại văn bản XML:

Văn bản không hợp lệ không theo nguyên tắc cú pháp được quy định bởi đặc tính kỹ

thuật XML Nếu nhà phát triển đã định nghĩa những nguyên tắc cho những gì tài liệu có thể chứa đựng trong một DTD hoặc lược đồ, và văn bản không theo những nguyên tắc

đó, văn bản đó cũng không hợp lệ

Văn bản hợp lệ tuân theo cả hai nguyên tắc, nguyên tắc cú pháp XML và nguyên tắc

quy định trong DTD hoặc lược đồ

Văn bản chuẩn tuân theo quy tắc cú pháp XML nhưng không có DTD hoặc lược đồ.

Một văn bản XML phải chứa một phần tử gốc (root element) Đây là “phần tử cha” của tất cả các phần tử còn lại Tập hợp toàn bộ phần tử được biểu diễn dưới dạng cây văn bản Cây này bắt đầu từ phần tử gốc và các nhánh từ bậc cao đến thấp

Trang 6

Sau đây là ví dụ về một văn bản XML không hợp lệ:

Trường hợp 1: không có phần tử gốc

Hình 1 : XML không có phần tử gốc

Trường hợp 2:

Các phần tử đan chéo vào nhau

Hình 2 : XML có các phần tử đang chéo vào nhau

Trang 7

Trường hợp 3: có thẻ mở mà không có thẻ đóng

Hình 3 : XML không có thẻ đóng

Sau đây là ví dụ văn bản hợp lệ

Hình 4: Văn bản XML dưới dạng bình thường

Trang 8

Hình 5: Văn bản XML được hiển thị bằng trình duyệt (browser)

Bây giờ ta sẽ phân tích các thành phần của một văn bản XML dựa theo ví dụ trên:

1 Dòng đầu tiên của một văn bản XML:

<?xml version="1.0" encoding="UTF-8"?>

Đây là dòng khai báo một văn bản XML có phiên bản (version) là 1.0 và kiểu mã hóa của văn bản là UTF-8

2 Phần tử gốc (root element)

Một văn bản XML phải được chứa trong một phần tử tố đơn Phần tử đơn đó được gọi

là phần tử gốc, và nó chứa tất cả các từ ngữ và bất cứ phần tử nào trong văn bản

Trong ví dụ dưới đây, văn bản XML được chứa đựng trong một phần tử đơn thu-hoach>

<bai-3 Phần tử con (child element)

4 Thuộc tính (attribute) và nội dung

Một phần tử có thể có chứ nội dung và thuộc tính riêng cho mình

<phan-doan thu-tu=”1”>XML la gi?</phan-doan>

Thuộc tính là thu-tu, và nội dung của phần tử phan-doan là “XML la gi?”

Trang 9

Có thể hiểu ý nghĩa của dòng này là mô tả phân đoạn thứ 1 của phần 1 có tên là “XML

là gì?”

Phần này em đã giới thiệu những khái niệm cơ bản về một văn bản XML Trong phần tiếp theo em sẽ đề cập đến những ưu điểm của ngôn ngữ XML kết hợp với các nguyên lý sáng tạo khoa học để thấy rõ vì sao XML lại trở thành một ngôn ngữ gần như không thể thiếu trong việc truyền tải thông tin từ lúc hình thành đến tận bây giờ

Trang 10

Phần II: Các Nguyên Lý Sáng Tạo Khoa Học Trong

Việc Hình Thành Ngôn Ngữ XML

Một sản phẩm thành công hay thất bại chủ yếu là do cách vận dụng các nguyên lý sáng tạo trong quá trình hình thành và phát triển sản phầm ấy Nếu vận dụng tốt và khéo léo, thì sản phẩm đó sẽ phát triển thành công, được phổ biến rộng rãi Còn nếu vận dụng không đúng, không tốt sẽ dẫn đến sự kết thúc của dòng đời sản phẩm đó Sau đây em xin trình bày những nguyên lý sáng tạo mà theo em đã được áp dụng vào sự hình thành và phát triển ngôn ngữ XML

1 Nguyên Lý Chia Nhỏ

Nội dung:

- Chia đối tượng thành các phần độc lập

- Làm đối tượng trở nên tháo lắp được

- Tăng mức độ phân nhỏ đối tượng

Trang 12

Vấn đề được giải quyết như sau

Bây giờ ta có thể dễ dàng phân biệt được đâu mà tên và mã số học viên, đâu là tên và

mã số nhân viên nhờ tiếp đầu ngữ (prefix) h và n đại diện cho 2 không gian tên học viên và nhân viên

3 Nguyên Lý Phẩm Chất Cục Bộ

Nội dung:

- Chuyển đối tượng (hay môi trường bên ngoài, tác động bên ngoài) có cấu trúc đồng nhất thành không đồng nhất

- Các phần khác nhau của đối tượng phải có các chức năng khác nhau

- Mỗi phần của đối tượng phải ở trong những điều kiện thích hợp nhất đối với công việc

Áp dụng:

Các thành phần khác nhau trong văn bản XML đều có ý nghĩa và mục đích sử dụng

khác nhau Có thể xem thuộc – tính – của – phần – tử (attribute) là một ví dụ

Xem đoạn XML sau

Trang 13

<sinh-vien khoa=”toan tin”>

<ho-ten>Nguyễn Hương Giang</ho-ten>

<ngay-sinh>22/11/1991</ngay-sinh>

</sinh-vien>

</truong-hoc>

Mỗi phần tử sinh viên đều có riêng một thuộc tính khoa Thuộc tính khoa mang tính chất cục

bộ đối với từng sinh viên Tùy từng đối tượng cụ thể ta có thể đặt những thuộc tính tương ứng cho đối tượng đó để có thể dễ chọn lọc, phân tích thông tin sau này.Sau đây là một số ví dụ

về cách sử dụng thuộc tính riêng cho từng phần tử:

<may-tinh loai=”PC”>…</may-tinh>

<may-tinh loai=”laptop”>…</may-tinh>

<ung-dung-web ngon-ngu=”java”>…</ung-dung-web>

<ung-dung-web ngon-ngu=”C#”>…</ung-dung-web>

Trang 14

Sau đây là một văn bản XML chưa kết hợp với tập tin XSL

Khi hiển thị bằng trình duyệt sẽ có dạng cây

Trang 16

Và khi kết hợp với tập tin XSL

Với việc kết hợp với tập tin xsl ta có thể biểu diễn dữ liệu dưới dạng bảng

Trang 17

Hoặc có thể biểu diễn dưới dạng danh sách liệt kê

Hoặc nhiều dạng khác tùy mục đích người dùng Ta chỉ cần chỉnh sửa nội dung của file xsl,

Trang 18

và việc hiển thị bằng trình duyệt hoàn toàn độc lập Do đó 2 quá trình này có thể tiến hành đồng thời, đấy nhanh tiến độ hoàn thành dự án

Hình 6: Sử dụng XML cho nhiều mục đích khác nhau

Trang 19

• XML trong silverlight (silverlight là một công nghệ mới của Microsoft giúp cho việc hiển thị nội dung trên web một cách mượt mà, bóng bấy hơn):

Trang 20

• XML trong database MarkLogic

• XML trong web services

Và còn nhiều ứng dụng khác nữa nhờ ưu điểm vượt trội là có thể tích hợp với các ứng dụng chạy trên các nền tảng (platform) khác nhau (Mobile, Linux, Mac OS X, Window…)

Trang 21

Sau đây là danh sách một số công nghệ ứng dụng XML:

• XHTML (Extensible HTML)

Một văn bản HTML tuân theo các quy tắc và chuẩn mực của ngôn ngữ XML

• XML DOM (XML Document Object Model)

Một tài liệu mô hình chuẩn cho việc truy xuất và xử lý văn bản XML

• XSL (Extensible Style Sheet Language) XSL bao gồm 3 phần:

XSLT (XSL Transform) – chuyển đổi XML sang các định dạng khác, như HTML

XSL-FO (XSL Formatting Objects) – dùng để định dạng XML xuất ra màn hình, giấy in, v.v

XPath – một ngôn ngữ dùng để duyệt các văn bản XML

• XQuery (XML Query Language)

Một ngôn ngữ truy vấn dữ liệu XML

• DTD (Document Type Definition)

Một chuẩn để định nghĩa các phần tử hợp lệ trong một văn bàn XML

• XSD (XML Schema)

Tương tự như DTD nhưng hỗ trợ thêm một số tính năng

• XLink (XML Linking Language)

Ngôn ngữ dùng để tạo siêu liên kết trong văn bản XML

• XPointer (XML Pointer Language)

Cho phép các siêu liên kết trỏ tới từng phần cụ thể trong văn bản XML

• SOAP (Simple Object Access Protocol)

Một giao thức dựa trên XML cho phép các ứng dụng trao đổi thông tin thông qua giao thức HTTP

• WSDL (Web Services Description Language)

Một ngôn ngữ dựa trên XML dùng để mô tả các dịch vụ web (web services)

• SVG (Scalable Vector Graphics)

Định nghĩa dữ liệu đồ họa dưới định dạng XML

6 Nguyên Lý Chứa Trong

Trang 22

- Một đối tượng được đặt bên trong đối tượng khác và bản thân nó lại chứa đối tượng thứ ba…

- Một đối tượng chuyển động xuyên suốt bên trong đối tượng khác

7 Nguyên Lý Dự Phòng

Nội dung:

Bù đắp độ tin cậy không lớn của đối tượng bằng cách chuẩn bị trước các phương tiện báo động, ứng cứu, an toàn

Trang 23

Áp dụng:

Do XML không quy định việc đặt tên các phần tử, cũng như là kiểu dữ liệu của phần tử (ví dụ như số tuổi của một người phải 0 < tuổi < 120, số tiền phải là một số…) Do đó rất dễ dẫn đến các trường hợp dữ liệu không hợp lệ Nên yêu cầu đặt ra là phải có giải pháp kiểm tra, đảm bảo dữ liệu đầu vào là hợp lệ Và cách giải quyết là sử dụng một tập tin lược đồ (schema) để kiểm tra văn bản XML có các dữ liệu hợp lệ hay không

<xs:element name="ho_ten" type="xs:string"/>

<xs:element name="hoc_phi" type="xs:decimal"/>

• Ho_ten: kiểu văn bản thường

• Hoc_phi: kiểu decimal (thường dùng cho các giá trị là tiền)

Trang 24

Nhờ có lược đồ này ta có thể dễ dàng đánh giá một văn bản XML có các dữ liệu hợp lệ so với các tiêu chí đã đề ra ban đầu hay không

Trang 25

Phụ Lục

Danh mục các từ viết tắt:

W3C World Wide Web Consortium: tổ chức độc lập định ra tiêu chuẩn cho

trình duyệt Web

HTML Hyper Text Markup Language: ngôn ngữ đánh dấu siêu văn bản, nền

tảng của mọi trang web ngày nayXSL eXtensible Style Sheet Language: ngôn ngữ dùng để diễn tả file xsl

định nghĩa cách hiển thị một văn bản XML

Trang 26

Tài Liệu Tham Khảo

[1] Giải một bài toán trên máy tính như thế nào của GS.TSKH Hoàng Kiếm Tập 1,2,3 năm 2005

[2] Slide bài giảng của GS.TSKH Hoàng Kiếm năm 2010

[3] Sách XML for Dummies 4th Edition – Lucinda Dykes and Ed Tittel

[4] Bài viết về XML của Doug Tidwell – IBM

Ngày đăng: 05/07/2015, 22:02

HÌNH ẢNH LIÊN QUAN

Hình 1 : XML không có phần tử gốc - NGÔN NGỮ XML VÀ CÁC NGUYÊN LÝ TƯ DUY SÁNG TẠO
Hình 1 XML không có phần tử gốc (Trang 6)
Hình 3 : XML không có thẻ đóng - NGÔN NGỮ XML VÀ CÁC NGUYÊN LÝ TƯ DUY SÁNG TẠO
Hình 3 XML không có thẻ đóng (Trang 7)
Hình 4: Văn bản XML dưới dạng bình thường - NGÔN NGỮ XML VÀ CÁC NGUYÊN LÝ TƯ DUY SÁNG TẠO
Hình 4 Văn bản XML dưới dạng bình thường (Trang 7)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w