Đấy là vì bộ trình này tới với bản viết cấu hình bí quyết được gọi là Cấu hình, cái sẽ móc và chọc vào các danh mục hệ thống để tìm những thứ nó cần, và điều chỉnh việc đưa vào các tệp
Trang 1
Lời giới thiệu
Cuốn sách này nói về gì
Các khái niệm cơ bản
Dạo qua Perl
Bài tập
2:Dữ liệu vô hướng
Dữ liệu vô hướng là gì?
Số
Xâu
Toán tử
Biến vô hướng
Toán tử trên biến vô hướng
<STDIN> như giá trị vô hướng
Đưa ra với print()
Trang 2Đưa vào từ STDIN
Đưa vào từ toán tử hình thoi
Đưa ra STDOUT
Bài tập
7: Biểu thức chính qui
Khái niệm về biểu thức chính qui
Cách dùng đơn giản về biểu thức chính qui Mẫu
Nói thêm về toán tử đối sánh
Bộ sửa đổi biểu thức
&&, || và ?: xem như các cấu trúc điều khiển Bài tập
10: Giải quyết tệp và kiểm thử tệp
Trang 3Giải quyết danh mục
Mở và đóng bộ giải quyết danh mục
Đọc bộ giải quyết danh mục
Sửa đổi quyền dùng
Sửa đổi thời hạn
Trang 4
Bài tập
16: Thâm nhập cơ sở dữ liệu hệ thống
Lấy mật hiệu và thông tin nhóm
Đóng và mở gói dữ liệu nhị phân
Lấy thông tin mạng
Lấy thông tin khác
Cơ sở dữ liệu thâm nhập ngẫu nhiên chiều dài cố định
Cơ sở dữ liệu chiều dài biến thiên (văn bản)
Bài tập
18: Chuyển các ngôn ngữ khác sang Perl
Chuyển Chương trình awk sang Perl
Chuyển Chương trình sed sang Perl
Nhiều, nhiều hàm nữa
Nhiều, nhiều biến đặt sẵn nữa
Xâu ở đây
return (từ chương trình con)
Toán tử eval (và s///e)
Thao tác bảng kí hiệu với *FRED
Trang 6“Pathologically Eclectic Rubbish Lister” - Bộ làm danh sách chiết trung bậy bạ
và bệnh hoạn Chẳng ích gì mà biện minh xem cách gọi nào đúng hơn, vì cả hai đều được Larry Wall, người sáng tạo và kiến trúc sư chính, người cài đặt và bảo trì của Perl chấp nhận Ông ấy đã tạo ra Perl khi cố gắng sản xuất ra một số báo cáo từ một cấp bậc các tệp kiểu như thư người dùng mạng Usenet về hệ thống
báo lỗi, và lệnh awk làm xì hết hơi Larry, một người lập trình lười biếng, quyết
định thanh toán vấn đề này bằng một công cụ vạn năng mà anh có thể dùng ít nhất cũng ở một nơi khác Kết quả là bản đầu tiên của Perl
Say khi chơi với bản đầu này của Perl một chút, thêm chất liệu đây đó, Larry đưa nó cho cộng đồng độc giả Usenet, thường vẫn được gọi là “the Net” Người dùng thuộc toán phù du nghèo khó về hệ thống trên toàn thế giới (quãng độ chục nghìn người) đưa lại cho anh phản hồi, hỏi cách làm thế này thế kia, việc này việc khác, nhiều điểm mà Larry chưa bao giờ mường tượng ra về việc giải quyết cho Perl nhỏ bé của mình cả
Nhưng kết quả là Perl trưởng thành, trưởng thành và trưởng thành thêm nữa,
và cũng cùng tỉ lệ như lõi của UNIX (với bạn là người mới, toàn bộ lõi UNIX được dùng chỉ khít vào trong 32K! Và bây giờ chúng ta may mắn nếu ta có thể
có được nó dưới một vài mega.) Nó đã trưởng thành trong các tính năng Nó đã trưởng thành trong tính khả chuyển Điều mà có thời là một ngôn ngữ tí tẹo bây giờ đã có tài liệu sử dụng 80 trang, một cuốn sách của Nutshell 400 trang, một nhóm tin Usenet với 40 nghìn thuê bao, và bây giờ là đoạn giới thiệu nhẹ nhàng này
Larry vẫn là người bảo trì duy nhất, làm việc trên Perl ngoài giờ khi kết thúc công việc thường ngày của mình Và Perl thì vẫn phát triển
Một cách đại thể thì lúc mà cuốn sách này đạt tới điểm dừng của nó, Larry
sẽ đưa ra bản Perl mới nhất, bản 5.0, hứa hẹn có một số tính năng thường hay được yêu cầu, và được thiết kế lại từ bên trong trở ra (Larry bảo tôi rằng không còn mấy dòng lệnh từ lần đưa ra trước, và số ấy cứ ngày càng ít đi mỗi ngày.) Tuy nhiên, cuốn sách này đã được thử với Perl bản 4.0 (lần đưa ra gần đây nhất
Trong chương này:
Lịch sử Perl
Mục đích của Perl
Có sẵn
Hỗ trợ
Các khái niệm cơ bản
Dạo qua về Perl
Trang 7
khi tôi viết điều này) Mọi thứ ở đây đều sẽ làm việc với bản 5.0 và các bản sau của Perl Trong thực tế, chương trình Perl 1.0 vẫn làm việc tốt với những bản gần đây, ngoại trừ một vài thay đổi lạ cần cho sự tiến bộ
Mục đích của Perl
Perl được thiết kế để trợ giúp cho người dùng UNIX với những nhiệm vụ thông dụng mà có thể rất nặng nề hay quá nhậy cảm với tính khả chuyển đối với trình vỏ, và cũng quá kì lạ hay ngắn ngủi hay phức tạp để lập trình trong C hay một ngôn ngữ công cụ UNIX nào khác
Một khi bạn trở nên quen thuộc với Perl, bạn có thể thấy mình mất ít thời gian để lấy được trích dẫn trình vỏ (hay khai báo C) đúng, và nhiều thời gian hơn để đọc tin trên Usenet và đi trượt tuyết trên đồi; vì Perl là một công cụ lớn tựa như chiếc đòn bẩy Các cấu trúc chặt chẽ của Perl cho phép bạn tạo ra (với tối thiểu sự om sòm nhặng sị) một số giải pháp có ưu thế rất trần lặng hay những công cụ tổng quát Cũng vậy, bạn có thể lôi những công cụ này sang công việc tiếp, vì Perl là khả chuyển cao độ và lại có sẵn, cho nên bạn sẽ có nhiều thời
gian hơn để đọc tin Usenet và trượt tuyết
Giống như mọi ngôn ngữ, Perl có thể “chỉ viết” - tức là có thể viết ra chương trình mà không thể nào đọc được Nhưng với sự chú ý đúng đắn, bạn có thể tránh được sự kết tội thông thường này Quả thế, đôi khi Perl trông như nổi tiếng với những cái không quen thuộc, nhưng với người lập trình đã thạo Perl, nó tựa như những dòng có tổng kiểm tra với một sứ mệnh trong cuộc đời Nếu bạn tuân theo những hướng dẫn của cuốn sách này thì chương trình của bạn sẽ dễ đọc và
dễ bảo trì, và chúng có lẽ sẽ không thắng trong bất kì cuộc tranh luận Perl khó hiểu nào
Tính sẵn có
Nếu bạn nhận được
Perl: not found
khi bạn thử gọi Perl từ lớp vỏ thì người quản trị hệ thống của bạn cũng chẳng lên cơn sốt Nhưng thậm chí nếu nó không có trên hệ thống của bạn, thì bạn vẫn có thể lấy được nó không mất tiền (theo nghĩa “ăn trưa không mất tiền”)
Perl được phân phối theo phép công cộng GNU, nghĩa là thế này, “bạn có thể phân phát chương trình nhị phân Perl chỉ nếu bạn làm ra chương trình gốc có sẵn cho mọi người dùng không phải trả tiền gì cả, và nếu bạn sửa đổi Perl, bạn phải phân phát chương trình gốc của bạn cho nơi sửa đổi của bạn nữa.” Và đó là bản chất của cho không Bạn có thể lấy chương trình gốc của Perl với giá của một băng trắng hay vài mêga byte qua đường dây Và không ai có thể khoá Perl
và bán cho bạn chỉ mã nhị phân với ý tưởng đặc biệt về “cấu hình phần cứng được hỗ trợ”
Trong thực tế, nó không chỉ là cho không, nhưng nó chạy còn gọn hơn trên gần như mọi thứ mà có thể gọi là UNIX hay tựa UNIX và có trình biên dịch C
Trang 8
Đấy là vì bộ trình này tới với bản viết cấu hình bí quyết được gọi là Cấu hình,
cái sẽ móc và chọc vào các danh mục hệ thống để tìm những thứ nó cần, và điều chỉnh việc đưa vào các tệp và các kí hiệu được xác định tương ứng, chuyển cho bạn việc kiểm chứng phát hiện của nó
Bên cạnh các hệ thống UNIX hay tựa UNIX, người đã bị nghiện Perl đem
nó sang Amiga, Atari ST, họ Macintosh, VMS, OS/2, thậm chí MS/DOS - và có
lẽ còn nhiều hơn nữa vào lúc bạn đọc cuốn sách này Vị trí chính xác và sự có sẵn của những bản Perl này thì biến động, cho nên bạn phải hỏi quanh (trên nhóm tin Usenet chẳng hạn) để có được thông tin mới nhất Nếu bạn hoàn toàn
không biết gì, thì một bản cũ của Perl đã có trên đĩa phần mềm CD-ROM UNIX Power Tools, của Jerry Peek, Tim O’Reilly và Mike Loukides (O’Reilly &
Associates/ Random House Co., 1993)
Hỗ trợ
Perl là con đẻ của Larry Wall, và vẫn đang được anh ấy nâng niu Báo cáo lỗi và yêu cầu nâng cao nói chung đều được sửa chữa trong các lần đưa ra sau, nhưng anh ấy cũng chẳng có nghĩa vụ nào để làm bất kì cái gì với chúng cả Tuy thế Larry thực sự thích thú nghe từ tất cả chúng ta, và cũng làm việc thực sự để thấy Perl được dùng trên qui mô thế giới E-mail trực tiếp cho anh ấy nói chung đều nhận được trả lời (cho dù đấy chỉ đơn thuần là máy trả lời email của anh ấy),
và đôi khi là sự đáp ứng con người
Ích lợi hơn việc viết thư trực tiếp cho Larry là nhóm hỗ trợ Perl trực tuyến
toàn thế giới, liên lạc thông qua nhóm tin Usenet comp.lang.perl Nếu bạn có thể
gửi email trên Internet, nhưng chưa vào Usenet, thì bạn có thể tham gia nhóm
này bằng cách gửi một yêu cầu tới perl-users-request@virgina.edu, yêu cầu sẽ
tới một người có thể nối bạn với cửa khẩu email hai chiều trong nhóm, và cho bạn những hứong dẫn về cách làm việc
Khi bạn tham gia một nhóm tin, bạn sẽ thấy đại loại có khoảng 30 đến 60
“thư” mỗi ngày (vào lúc bản viết này được soạn thảo) trên đủ mọi chủ đề từ câu hỏi của người mới bắt đầu cho tới vấn đề chuyển chương trình phức tạp và vấn
đề giao diện, và thậm chí cả một hay hai chương trình khá lớn
Nhóm tin gần như được những chuyên gia Perl điều phối Phần lớn thời gian, câu hỏi của bạn đều có sự trả lời trong vòng vài phút khi bài tin bạn tới tủ nối Usenet chính Bạn hãy thử mức độ hỗ trợ từ nhà sản xuất phần mềm mình ưa chuộng về việc cho không này! Bản thân Larry cũng đọc về nhóm khi thời gian cho phép, và đôi khi đã xen các bài viết có thẩm quyền vào để chấm dứt việc cãi nhau hay làm sáng tỏ một vấn đề Sau rốt, không có Usenet, có lẽ không thể có chỗ để dễ dàng công bố Perl cho cả thế giới
Bên cạnh nhóm tin, bạn cũng nên đọc tạp chí Perl, đi cùng việc phân phối
Perl Một nguồn có thẩm quyền khác là cuốn sách Programming Perl của Larry Wall và Randal L Schwatrz (O’Reilly & Associaté, 1990) Programming Perl
được xem như “Sách con lừa” vì bìa của nó vẽ con vật này (hệt như cuốn sách này có lẽ sẽ được biết tới với tên sách lạc đà không bướu) Sách con lừa chứa
Trang 9
thông tin tham khảo đầy đủ về Perl dưới dạng đóng gọn gàng Sách con lừa cũng bao gồm một bảng tra tham khảo bật ra tài tình mà chính là nguồn ưa chuộng của cá nhân tôi về thông tin Perl
Các khái niệm cơ bản
Một bản viết vỏ không gì khác hơn là một dãy các lệnh vỏ nhồi vào trong một tệp văn bản Tệp này “được làm cho chạy” bằng cách bật một bit thực hiện
(qua chmod +x filename) và rồi gõ tên của tệp đó vào lời nhắc của vỏ Bingo, một chương trình vỏ lớn Chẳng hạn, một bản viết để chạy chỉ lệnh date theo sau bởi chỉ lệnh who có thể được tạo ra và thực hiện như thế này:
$ echo date > somecript
$ echo who > somecript
đó thì khoảng trắng thuộc loại nào đó là bắt buộc (Khoảng trắng bao gồm dấu cách, dấu tab, dòng mới, về đầu dòng hay kéo giấy.) Có một vài cấu trúc đòi hỏi một loại khoảng trắng nào đó ở chỗ nào đó, nhưng chúng sẽ được trỏ ra khi ta nói tới chúng Bạn có thể giả thiết rằng loại và khối lượng khoảng trắng giữa các hiệu bài là tuỳ ý trong các trường hợp khác
Mặc dầu gần như tất cả các chương trình Perl đều có thể được viết tất cả trên một dòng, một cách điển hình chương trình Perl cũng hay được viết tụt lề như chương trình C, với những phần câu lệnh lồng nhau được viết tụt vào hơn so với phần bao quanh Bạn sẽ thấy đầy những thí dụ chỉ ra phong cách viết tụt lề điển hình trong toàn bộ cuốn sách này
Trang 10
Cũng giống như bản viết về vỏ, chương trình Perl bao gồm tất cả các câu lệnh perl về tệp được lấy tổ hợp chung như mọt trình lớn cần thực hiện Không
có khái niệm về trình “chính” main như trong C
Chú thích của Perl giống như chú thích của lớp vỏ (hiện đại) Bất kì cái gì nằm giữa một dấu thăng (#) tới cuối dòng đều là một chú thích Không có khái niệm về chú thích trên nhiều dòng như C
Không giống hầu hết các lớp vỏ (nhưng giống như awk và sed), bộ thông dịch Perl phân tích và biên dịch hoàn toàn chương trình trước khi thực hiện nó Điều này có nghĩa là bạn không bao giờ nhận được lỗi cú pháp từ chương trình một khi chương trình đã bắt đầu chạy, và cũng có nghĩa là khoảng trắng và chú thích biến mất và sẽ không làm chậm chương trình Trong thực tế, giai đoạn biên dịch này bảo đảm việc thực hiện nhanh chóng của các thao tác Perl một khi
nó được bắt đầu, và nó cung cấp động cơ phụ để loại bỏ C như một ngôn ngữ tiện ích hệ thống đơn thuần dựa trên nền tảng là C được biên dịch
Việc biên dịch này không mất thời gian - sẽ là phi hiệu quả nếu một chương trình Perl cực lớn lại chỉ thực hiện một nhiệm vụ nhỏ bé chóng vánh (trong số nhiều nhiệm vụ tiềm năng) và rồi ra, vì thời gian chạy cho chương trình sẽ nhỏ xíu nếu so với thời gian dịch
Cho nên Perl giống như một bộ biên dịch và thông dịch Nó là biên dịch vì chương trình được đọc và phân tích hoàn toàn trước khi câu lệnh đầu tiên được thực hiện Nó là bộ thông dịch vì không có mã đích ngồi đâu đó trút đầy không gian đĩa Theo một cách nào đó, nó là tốt nhất cho cả hai loại này Phải thú thực, việc ẩn đi mã đích đã dịch giữa những lời gọi thì hay, và đó là trong danh sách mong ước cho Perl tương lai của Larry
Dạo qua Perl
Chúng ta bắt đầu cuộc hành trình của mình qua Perl bằng việc đi dạo một chút Việc đi dạo này sẽ giới thiệu một số các tính năng khác nhau bằng cách bổ sung vào một ứng dụng nhỏ Giải thích ở đây là cực kì ngắn gọn - mỗi vùng chủ
đề đều được thảo luận chi tiết hơn rất nhiều về sau trong cuốn sách này Nhưng
cuộc đi dạo nhỏ này sẽ cho bạn kinh nghiệm nhanh chóng về ngôn ngữ, và bạn
có thể quyết định liệu bạn có thực sự muốn kết thúc cuốn sách này hay đọc thêm các tin Usenet hay chạy đi chơi trượt tuyết
Chương trình “Xin chào mọi người”
Ta hãy nhìn vào một chương trình nhỏ mà thực tế có làm điều gì đó Đây là
chương trình “Xin chào mọi người”:
#!/usr/bin/perl
print “Xin chào mọi người\n”;
Dòng đầu tiên là câu thần chú nói rằng đây là chương trình Perl Nó cũng là lời chú thích cho Perl - hãy nhớ rằng lời chú thích là bất kì cái gì nằm sau dấu
thăng cho tới cuối dòng, giống như hầu hết các lớp vỏ hiện đại hay awk
Trang 11
Dòng thứ hai là toàn bộ phần thực hiện được của chương trình này Tại đây chúng ta thấy câu lệnh print Từ khoá print bắt đầu chương trình, và nó có một đối, một xâu văn bản kiểu C Bên trong xâu này, tổ hợp kí tự \n biểu thị cho kí
tự dòng mới; hệt như trong C Câu lệnh print được kết thúc bởi dấu chấm phẩy (;) Giống như C, tất cả các câu lệnh đơn giản đều kết thúc bằng chấm phẩy* Khi bạn gọi chương trình này, phần lõi sẽ gọi bộ thông dịch Perl, phân tích câu toàn bộ chương trình (hai dòng, kể cả dòng chú thích đầu tiên) và rồi thực hiện dạng đã dịch Thao tác đầu tiên và duy nhất là thực hiện toán tử print, điều này gửi đối của nó ra lối ra Sau khi chương trình đã hoàn tất, thì tiến trình Perl
ra, cho lại một mã ra thành công cho lớp vỏ
Hỏi câu hỏi và nhớ kết quả
Ta hãy thêm một chút phức tạp hơn Từ Xin chào mọi người là một sự đụng chạm lạnh nhạt và cứng rắn Ta hãy làm cho chương trình gọi bạn theo tên bạn
Để làm việc này, ta cần một chỗ giữ tên, một cách hỏi tên, và một cách nhận câu trả lời
Một loại đặt chỗ giữ giá trị (tựa như một tên) là biến vô hướng Với chương
trình này, ta sẽ dùng biến vô hướng $name để giữ tên bạn Chúng ta sẽ đi chi
tiết hơn trong Chương 2, Dữ liệu vô hướng, về những gì mà biến này có thể giữ,
và những gì bạn có thể làm với chúng Hiện tại, giả sử rằng bạn có thể giữ một
số hay xâu (dãy các kí tự) trong biến vô hướng
Chương trình này cần hỏi về tên Để làm điều đó, ta cần một cách nhắc và một cách nhận cái vào Chương trình trước đã chỉ ra cho ta cách nhắc - dùng toán tử print Và cách để nhận một dòng từ thiết bị cuối là với toán tử
<STDIN>, mà (như ta sẽ dùng nó ở đây) lấy một dòng cái vào Ta gán cái vào này cho biến $name Điều này cho ta chương trình:
print “Tên bạn là gì? : ”;
$name = <STDIN> ;
Giá trị của $name tại điểm này có một dấu dòng mới kết thúc (Randal có trong Randal\n) Để vứt bỏ điều đó, chúng ta dùng toán tử chop(), toán tử lấy một biến vô hướng làm đối duy nhất và bỏ đi kí tự cuối từ giá trị xâu của biến: chop($name);
Bây giờ tất cả những gì ta cần làm là nói Xin chào, tiếp đó là giá trị của biến
$name, mà ta có thể thực hiện theo kiểu vỏ bằng cách nhúng biến này vào bên trong xâu có ngoặc kép:
print “Xin chào, $name!\n”;
Giống như lớp vỏ, nếu ta muốn một dấu đô la thay vì tham khảo biến vô hướng, thì ta có thể đặt trước dấu đô la với một dấu sổ chéo ngược
Gắn tất cả lại, ta được:
* Dấu chấm phẩy có thể bỏ đi khi câu lệnh này là câu lệnh cuối của một khối hay tệp hay eval
Trang 12hãy bổ sung thêm lệnh rẽ nhánh if-then-else và phép so sánh vào chương trình:
Toán tử eq so sánh hai xâu Nếu chúng bằng nhau (từng kí tự một, và có
cùng chiều dài), thì kết quả là đúng (Không có toán tử này trong C, và awk phải
dùng cùng toán tử cho xâu và số và tạo ra việc đoán có rèn luyện.)
Câu lệnh if chọn xem khối câu lệnh nào (giữa các dấu ngoặc nhọn sánh
đúng) là được thực hiện - nếu biểu thức là đúng, đó là khối thứ nhất, nếu không thì đó là khối thứ hai
Đoán từ bí mật
Nào, vì chúng ta đã có một tên nên ta hãy để cho một người chạy chương trình đoán một từ bí mật Với mọi người ngoại trừ Randal, chúng ta sẽ để cho chương trình cứ hỏi lặp lại để đoán cho đến khi nào người này đoán được đúng Trước hết ta hãy xem chương trình này và rồi xem giải thích:
Trang 13
$guess = <STDIN>;
chop($guess);
while ($guess ne $secrectword) {
print “Sai rồi, thử lại đi Từ bí mật là gì?”;
Tất nhiên, chương trình này không phải là an toàn lắm, vì bất kì ai mệt với việc đoán cũng đều có thể đơn thuần ngắt chương trình và quay trở về lời nhắc, hay thậm chí còn nhìn qua chương trình gốc để xác định ra từ Nhưng, chúng ta hiện tại chưa định viết một hệ thống an toàn, chỉ xem như một thí dụ cho trang hiện tại của cuốn sách này
Nhiều từ bí mật
Ta hãy xem cách thức mình có thể sửa đổi đoạn chương trình này để cho phép có nhiều từ bí mật Bằng việc dùng điều ta đã thấy, chúng ta có thể so sánh lời đoán lặp đi lặp lại theo một chuỗi câu trả lời rõ được cất giữ trong các biến
vô hướng tách biệt Tuy nhiên, một danh sách như vậy sẽ khó mà thay đổi hay đọc vào từ một tệp hay máy tính trên cơ sở ngày làm việc thường lệ
Một giải pháp tốt hơn là cất giữ tất cả các câu trả lời có thể vào trong một
cấu trúc dữ liệu gọi là danh sách hay mảng Mỗi phần tử của mảng đều là một
biến vô hướng tách biệt mà có thể được đặt giá trị hay thâm nhập độc lập Toàn
bộ mảng cũng có thể được trao cho một giá trị trong một cú đột nhập Ta có thể gán một giá trị cho toàn bộ mảng có tên @words sao cho nó chứa ba mật hiệu tốt có thể có:
@words = (“camel”, “llama”, “oyster”);
Tên biến mảng bắt đầu với @, cho nên chúng là khác biệt với các tên biến
vô hướng
Một khi mảng đã được gán thì ta có thể thâm nhập vào từng phần tử bằng việc dùng một tham khảo chỉ số Cho nên $words[0] là camel, $words[1] là llama, $words[2] là oyster Chỉ cố cũng có thể là một biểu thức, cho nên nếu ta đặt $i là 2 thì $words[$i] là oyster (Tham khảo chỉ số bắt đầu với $ thay vì @
vì chúng tham khảo tới một phần tử riêng của mảng thay vì toàn bộ mảng.) Quay trở lại với thí dụ trước đây của ta:
Trang 14$correct = “ có thể”; # từ đoán có đúng hay không?
while ($correct eq $guess) { # cứ kiểm tra đến khi biết
if ($words[$i] eq $guess) { # đúng không
$correct = “có”; # có
} elsif ($i < 2) { # cần phải xét thêm từ nữa?
$i = $i + 1; # nhìn vào từ tiếp lần sau
} # kết thúc của “not Randal”
Bạn sẽ để ý rằng chúng ta đang dùng biến vô hướng $correct để chỉ ra rằng chúng ta vẫn đang tìm ra mật hiệu đúng, hay rằng chúng ta không tìm thấy Chương trình này cũng chỉ ra khối elsif của câu lệnh if-then-else Không có
lệnh nào tương đương như thế trong C hay awk - đó là việc viết tắt của khối
else cùng với một điều kiện if mới, nhưng không lồng bên trong cặp dấu ngoặc nhọn khác Đây chính là cái rất giống Perl để so sánh một tập các điều kiện trong một dây chuyền phân tầng if-elsif-elsif-elsif-else
Cho mỗi người một từ bí mật khác nhau
Trong chương trình trước, bất kì người nào tới cũng đều có thể đoán bất kì
từ nào trong ba từ này và có thể thành công Nếu ta muốn từ bí mật là khác nhau cho mỗi người, thì ta cần một bảng sánh giữa người và từ:
Người Từ bí mật
Fred Camel
Trang 15Chú ý rằng cả Betty và Wilma đều có cùng từ bí mật Điều này là được
Cách dễ nhất để cất giữ một bảng như thế trong Perl là bằng một mảng kết hợp Mỗi phần tử của mảng này giữ một giá trị vô hướng tách biệt (hệt như kiểu mảng khác), nhưng các mảng lại được tham khảo tới theo khoá, mà có thể là bất
kì giá trị vô hướng nào (bất kì xâu hay số, kể cả số không nguyên và giá trị âm)
Để tạo ra một mảng kết hợp được gọi là %words (chú ý % chứ không phải là
@) với khoá và giá trị được cho trong bảng trên, ta gán một giá trị cho %words (như ta đã làm nhiều trước đây với mảng khác):
%words = (“fred”, “camel”, “barney”, “llama”,
“betty”, “oyster”, “wilma”, “oyster”) ; Mỗi cặp giá trị trong danh sách đều biểu thị cho một khoá và giá trị tương ứng của nó trong mảng kết hợp Chú ý rằng ta đã bẻ phép gán này ra hai dòng
mà không có bất kì loại kí tự nối dòng nào, vì khoảng trắng nói chung là vô nghĩa trong chương trình Perl
Để tìm ra từ bí mật cho Betty, ta cần dùng Betty như khoá trong một tham khảo vào mảng kết hợp %words, qua một biểu thức nào đó như
%words{“betty”} Giá trị của tham khảo này là oyster, tương tự như điều ta đã làm trước đây với mảng khác Cũng như trước đây, khoá có thể là bất kì biểu thức nào, cho nên đặt $person với betty và tính $words{$person} cũng cho oyster
Gắn tất cả những điều này lại ta được chương trình như thế này:
#! /usr/bin/perl
%words = (“fred”, “camel”, “barney”, “llama”,
“betty”, “oyster”, “wilma”, “oyster”) ; print “Tên bạn là gì?” ;
print “Xin chào, $name!\n”; # chào thông thường
$secretword = $words{$name}; # lấy từ bí mật
Trang 16Bạn hãy chú ý nhìn vào từ bí mật Nếu không tìm thấy từ này thì giá trị của
$secretword sẽ là một xâu rỗng*, mà ta có thể kiểm tra liệu ta có muốn xác định một từ bí mật mặc định cho ai đó khác không Đây là cách xem nó:
[ phần còn lại của chương trình đã bị xoá ]
$secretword = $words{$name}; # lấy từ bí mật
if ($secretword eq “”) { # ấy, không thấy
$secretword = “đồ cáu kỉnh”; # chắc chắn, sao không là vịt?
}
print “Từ bí mật là gì?” ;
[ phần còn lại của chương trình đã bị xoá ]
Giải quyết định dạng cái vào thay đổi
Nếu tôi đưa vào Randal L Schwartz hay randal thay vì Randal thì tôi sẽ
bị đóng cục lại với phần người dùng còn lại, vì việc so sánh eq thì lại so sánh đúng sự bằng nhau Ta hãy xem một cách giải quyết cho điều đó
Giả sử tôi muốn tìm bất kì xâu nào bắt đầu với Randal, thay vì chỉ là một xâu bằng Randal Tôi có thể làm điều này trong sed hay awk hoặc grep với một biểu thức chính qui: một tiêu bản sẽ xác định ra một tập hợp các xâu sánh
đúng Giống như trong sed hay grep, biểu thức chính qui trong Perl để sánh bất
kì xâu nào bắt đầu với Randal là ^Randal Để sánh xâu này với xâu trong
$name, chúng ta dùng toán tử sánh như sau:
Điều này gần như thế, nhưng nó lại không giải quyết việc lựa ra randal hay
loại bỏ Randall Để chấp nhận randal, chúng ta thêm tuỳ chọn bỏ qua hoa thường, một chữ i nhỏ được thêm vào sau dấu sổ chéo đóng Để loại bỏ Randall, ta thêm một đánh dấu đặc biệt định biên từ (tương tự với vi và một số bản của grep) dưới dạng của \b trong biểu thức chính qui Điều này đảm bảo
rằng kí tự đi sau l đầu tiên trong biểu thức chính qui không phải là một kí tự
* Được, đấy chính là giá trị undef, nhưng nó trông như một xâu rỗng cho toán tử eq
Trang 17
khác Điều này làm thay đổi biểu thức chính qui thành /^randal\b/i, mà có nghĩa
là “randal tại đầu xâu, không có kí tự hay chữ số nào theo sau, và chấp nhận cả hai kiểu chữ hoa thường.”
Khi gắn tất cả lại với phần còn lại của chương trình thì nó sẽ giống như thế này:
#! /usr/bin/perl
%words = (“fred”, “camel”, “barney”, “llama”,
“betty”, “oyster”, “wilma”, “oyster”) ; print “Tên bạn là gì?” ;
print “Xin chào, $name!\n”; # chào thông thường
$secretword = $words{$name}; # lấy từ bí mật
if ($secretword eq “”) { # ấy, không thấy
$secretword = “đồ cáu kỉnh”; # chắc chắn, sao không là vịt?
}
print “Từ bí mật là gì?” ;
$guess = <STDIN>;
chop($guess);
while ($correct ne $secretwords) {
print “Sai rồi, thử lại đi Từ bí mật là gì?”;
$guess = <STDIN>;
chop($guess);
Như bạn có thể thấy, chương trình này khác xa với chương trình đơn giản
làm được tí chút với cái ngắn xíu vậy đây chính là cách thức của Perl
Perl đưa ra tính năng về các biểu thức chính qui có trong mọi trình tiện ích UNIX chuẩn (và thậm chí trong một số không chuẩn) Không chỉ có thế, nhưng cách thức Perl giải quyết cho việc đối sánh xâu là cách nhanh nhất trên hành tin
này, cho nên bạn không bị mất hiệu năng (Một chương trình giống như grep được viết trong Perl thường đánh bại chương trình grep được các nhà cung cấp viết trong C với hầu hết các cái vào Điều này có nghĩa là thậm chí grep không
thực hiện một việc của nó thật tốt.)
Làm cho công bằng với mọi người
Vậy bây giờ tôi có thể đưa vào Randal hay randal hay Randal L Schwartz, nhưng với những người khác thì sao? Barney vẫn phải nói đúng
Trang 18
barney (thậm chí không được có barney với một dấu cách theo sau)
Để công bằng cho Barey, chúng ta cần nắm được từ đầu của bất kì cái gì
được đưa vào, và rồi chuyển nó thành chữ thường trước khi ta tra tên trong bảng Ta làm điều này bằng hai toán tử: toán tử substitute, tìm ra một biểu thức chính qui và thay thế nó bằng một xâu, và toán tử translate, để đặt xâu này thành
chữ thường
Trước hết, toán tử thay thế: chúng ta muốn lấy nội dung của $name, tìm kí tự đầu tiên không là từ, và loại đi mọi thứ từ đây cho đến cuối xâu /\W.*/ là một biểu thức chính qui mà ta đang tìm kiếm - \W viết tắt cho kí tự không phải là từ (một cái gì đó không phải là chữ, chữ số hay gạch thấp) và * có nghĩa là bất kì
kí tự nào từ đấy tới cuối dòng Bây giờ, để loại những kí tự này đi, ta cần lấy bất
kì bộ phận nào của xâu sánh đúng với biểu thức chính qui này và thay nó với cái không có gì:
$name =~ s/\W.*//;
Chúng ta đang dùng cùng toán tử =~ mà ta đã dùng trước đó, nhưng bây giờ bên vế phải ta có toán tử thay thế: chữ s được theo sau bởi một biểu thức chính qui và xâu được định biên bởi dấu sổ chéo (Xâu trong thí dụ này là xâu rỗng giữa dấu sổ chéo thứ hai và thứ ba.) Toán tử này trông giống và hành động rất giống như phép thay thế của các trình soạn thảo khác nhau
Bây giờ để có được bất kì cái gì còn lại trở thành chữ thường thì ta phải dịch xâu này dùng toán tử tr Nó trông rất giống chỉ lệnh tr của UNIX, nhận một danh sách các kí tự để tìm và một danh sách các kí tự để thay thế chúng Với thí dụ của ta, để đặt nội dung của $name thành chữ thường, ta dùng:
a, và cứ như thế*
Gắn tất cả lại với mọi thứ khác sẽ cho kết quả trong:
#! /usr/bin/perl
%words = (“fred”, “camel”, “barney”, “llama”,
“betty”, “oyster”, “wilma”, “oyster”) ; print “Tên bạn là gì?” ;
$name = <STDIN> ;
chop($name);
$original_name = $name; # cất giữ để chào mừng
$name =~ s/\W.*//; # bỏ mọi thứ sau từ đầu
* Các chuyên gia sẽ lưu ý rằng tôi cũng đã xây dựng một cái gì đó tựa như s/(\S*).*/\L$1/ để làm tất cả điều này trong một cú đột kích, nhưng các chuyên gia có lẽ sẽ không đọc mục này
Trang 19print “Xin chào, $original_name!\n”; # chào thông thường
$secretword = $words{$name}; # lấy từ bí mật
if ($secretword eq “”) { # ấy, không thấy
$secretword = “đồ cáu kỉnh”; # chắc chắn, sao không là vịt?
}
print “Từ bí mật là gì?” ;
$guess = <STDIN>;
chop($guess);
while ($correct ne $secretwords) {
print “Sai rồi, thử lại đi Từ bí mật là gì?”;
$guess = <STDIN>;
chop($guess);
} # kết thúc của “not Randal”
Bạn hãy để ý đến cách thức biểu thức chính qui sánh đúng với tên tôi Randal đã lại trở thành việc so sánh đơn giản Sau rốt, cả Randal L Schwartz
và Randal đều trở thành randal sau khi việc thay thế và dịch Và mọi người khác cũng có được sự công bằng, vì Fred và Fred Flinstone cả hai đều trở thành fred, Barney Rubble và Barney, the little guy sẽ trở thành barney, vân vân
Với chỉ vài câu lệnh, chúng ta đã tạo ra một chương trình thân thiện người dùng hơn nhiều Bạn sẽ thấy rằng việc diễn tả thao tác xâu phức tạp với vài nét
là một trong nhiều điểm mạnh của Perl
Tuy nhiên, chém vào tên để cho ta có thể so sánh nó và tra cứu nó trong bảng thì sẽ phá huỷ mất tên ta vừa đưa vào Cho nên, trước khi chém vào tên, cần phải cất giữ nó vào trong @original_name (Giống như các kí hiệu C, biến Perl bao gồm các chữ, chữ số và dấu gạch thấp và có thể có chiều dài gần như không giới hạn.) Vậy ta có thể làm tham khảo tới $original_name về sau
Perl có nhiều cách để giám sát và chặt cắt xâu bạn sẽ thấy phần lớn chúng
trong Chương 7, Biểu thức chính qui và Chương 15, Việc chuyển đổi dữ liệu khác
Làm cho nó mô đun hơn một chút
Bởi vì chúng ta đã thêm quá nhiều mã nên ta phải duyệt qua nhiều dòng chi tiết trước khi ta có thể thu được toàn bộ luồng chương trình Điều ta cần là tách bạch logic mức cao (hỏi tên, chu trình dựa trên từ bí mật đưa vào) với các chi tiết (so sánh một từ bí mật với từ đã biết) Chúng ta có thể làm điều này cho rõ ràng, hoặc có thể bởi vì một người đang viết phần cao cấp còn người khác thì
Trang 20
viết (hay đã viết) phần chi tiết
Perl cung cấp các chương trình con có tham biến và giá trị cho lại Một
chương trình con được xác định một khi nào đó trong chương trình, và rồi có thể được dùng lặp đi lặp lại bằng việc gọi từ bên trong bất kì biểu thức nào
Với chương trình nhỏ nhưng tăng trưởng nhanh của chúng ta, ta hãy tạo ra một chương trình con tên là &good_word (tất cả các tên chương trình con đều bắt đầu với một dấu và &) mà nhận một tên đã sạch và một từ đoán, rồi cho lại
true nếu từ đó là đúng, và cho lại false nếu không đúng Việc xác định chương
trình con đó tựa như thế này:
sub good_word {
local($somename, $someguess) = @_; # tên tham biến
$somename =~ s/\W.*//; # bỏ mọi thứ sau từ đầu
$somename =~ tr/A-Z/a-z/; # mọi thứ thành chữ thường
if ($somename eq “randal”) { # không nên đoán
} elsif (($words{$somename} || “đồ cáu kỉnh”) eq $someguess) { 1; # giá trị cho lại là true
để vào bất kì đâu trong tệp chương trình, nhưng phần lớn mọi người thích để chúng vào cuối
Dòng đầu tiên trong định nghĩa đặc biệt này là một phép gán làm việc sao các giá trị của hai tham biến của chương trình này vào hai biến cục bộ có tên
$somename và $someguess (local() xác định hai biến là cục bộ cho chương trình con này, và các tham biến ban đầu trong một mảng cục bộ đặc biệt gọi là
@_.)
Hai dòng tiếp làm sạch tên, cũng giống như bản trước của chương trình Câu lệnh if-elsif-else quyết định xem từ được đoán ($someguess) là có đúng cho tên ($somename) hay không Randal không nên làm nó thành chương trình con này, nhưng ngay cả nếu nó có, thì dù từ nào được đoán cũng đều OK cả
Biểu thức cuối cùng được tính trong chương trình con là cho lại giá trị Chúng ta sẽ thấy cách cho lại giá trị được dùng sau khi tôi kết thúc việc mô tả định nghĩa về chương trình con
Phép kiểm tra cho phần elsif trông có phức tạp hơn một chút - ta hãy chia nó ra:
Trang 21
($words{$somename} || “đồ cáu kỉnh”) eq $someguess
Vật thứ nhất bên trong dấu ngoặc là mảng kết hợp quen thuộc của ta, cho một giá trị nào đó từ %words dựa trên khoá $somename Toán tử đứng giữa giá trị đó và xâu đồ cáu kỉnh là toán tử || (phép hoặc logic) như được dùng
trong C và awk và các vỏ khác Nếu việc tra cứu từ mảng kết hợp có một giá trị
(nghĩa là khoá $somename là trong mảng), thì giá trị của biểu thức là giá trị
đó Nếu khoá không tìm được, thì xâu đồ cáu kỉnh sẽ được dùng thay Đây chính là một vật kiểu Perl thường làm - xác định một biểu thức nào đó, và rồi đưa ra một giá trị mặc định bằng cách dùng || nếu biểu thức này có thể trở thành sai
Trong mọi trường hợp, dù đó là một giá trị từ mảng kết hợp, hay giá trị mặc định đồ cáu kỉnh, chúng ta đều so sánh nó với bất kì cái gì được đoán Nếu việc
so sánh là đúng thì ta cho lại 1, nếu không ta cho lại 0
Bây giờ ta hãy tích hợp tất cả những điều này với phần còn lại của chương trình:
#! /usr/bin/perl
%words = (“fred”, “camel”, “barney”, “llama”,
“betty”, “oyster”, “wilma”, “oyster”) ; print “Tên bạn là gì?” ;
$name = <STDIN> ;
chop($name);
if ($name =~ /^randal\b/i ) { # trở lại cách khác
print “Xin chào, Randal! May quá anh ở đây!\n”;
while ( ! &good_word($name, $guess)) {
print “Sai rồi, thử lại đi Từ bí mật là gì?”;
$guess = <STDIN>;
chop($guess);
}
}
[ thêm vào định nghĩa của &good_word ở đây ]
Chú ý rằng chúng ta đã quay trở lại với biểu thức chính qui để kiểm tra Randal, vì bây giờ không cần kéo một phần tên thứ nhất và chuyển nó thành chữ thường, chừng nào còn liên quan tới chương trình chính
Sự khác biệt lớn là chu trình while có chứa &good_word Tại đây, chúng ta thấy một lời gọi tới chương trình con, truyền cho nó hai đối, $name và $guess Bên trong chương trình con này, giá trị của $somename được đặt từ tham biến thứ nhất, trong trường hợp này là $name Giống thế, $someguess được đặt từ
Trang 22
tham biến thứ hai, $guess
Giá trị do chương trình con cho lại (hoặc 1 hoặc 0, nhớ lại định nghĩa đã nêu trước đây) là âm với toán tử tiền tố ! (phép phủ định logic) Như trong C, toán tử này cho lại đúng nếu biểu thức đi sau là sai, và ngược lại Kết quả của phép phủ định này sẽ kiểm soát chu trình while Bạn có thể đọc điều này là “trong khi không phải là từ đúng ” Nhiều chương trình Perl viết tốt đọc rất giống tiếng Anh, đưa lại cho bạn một chút tự do với Perl hay tiếng Anh (Nhưng bạn chắc chắn không đoạt giải Pulitzer theo cách đó.)
Chú ý rằng chương trình con này giả thiết rằng giá trị của mảng %words được chương trình chính đặt Điều này không đặc biệt là hay, nhưng chẳng có gì
so sánh được với static của C đối với chương trình con - nói chung, tất cả các biến nếu không nói khác đi mà được tạo ra với toán tử local() thì đều là toàn cục đối với toàn bộ chương trình Trong thực tế, đây chỉ là vấn đề nhỏ, và người ta thì có được tính sáng tạo về cách đặt tên biến dài hạn
Chuyển danh sách từ bí mật vào tệp riêng biệt
Giả sử ta muốn dùng chung danh sách từ bí mật cho ba chương trình Nếu ta cất giữ danh sách từ như ta đã làm thì ta sẽ cần phải thay đổi tất cả ba chương trình này khi Betty quyết định rằng từ bí mật của cô sẽ là swine thay vì oyster Điều này có thể thành phiền phức, đặc biệt khi xem xét tới việc Betty lại thường xuyên thích thay đổi ý định
Cho nên, ta hãy đặt danh sách từ vào một tệp, và rồi đọc tệp này để thu được danh sách từ vào trong chương trình Để làm điều này, ta cần tạo ra một kênh
vào/ra được gọi là tước hiệu tệp Chương trình Perl của bạn sẽ tự động lấy ba
tước hiệu tệp gọi là STDIN, STDOUT và STDERR, tương ứng với ba kênh vào
ra chuẩn cho chương trình UNIX Chúng ta cũng đã dùng tước hiệu STDIN để đọc dữ liệu từ người chạy chương trình Bây giờ, đấy chỉ là việc lấy một tước hiệu khác để gắn với một tệp do ta tạo ra
Sau đây là một đoạn mã nhỏ để làm điều đó:
sub init_words {
open (WORDSLIST, “wordslist”);
while ($name = <WORDSLIST>) {
Trang 23Chu trình while đọc các dòng từ tệp wordslist (qua tước hiệu tệp WORDSLIST) mỗi lần một dòng Mỗi dòng đều được cất giữ trong biến
$name Khi đạt đến cuối tệp thì giá trị cho lại bởi toán tử <WORDSLIST> là xâu rỗng* , mà sẽ sai cho cho trình while, và kết thúc nó Đó là cách chúng ta đi
ra ở cuối
Mặt khác, trường hợp thông thường là ở chỗ chúng ta đã đọc một dòng (kể
cả dấu dòng mới) vào trong $name Trước hết, ta bỏ dấu dòng mới bằng việc dùng toán tử chop() Rồi, ta phải đọc dòng tiếp để lấy từ bí mật, giữ nó trong biến $word Nó nữa cũng phải bỏ dấu dòng mới đi
Dòng cuối cùng của chu trình while đặt $word vào trong %words với khoá
$name, cho nên phần còn lại của chương trình có thể thâm nhập vào nó về sau Một khi tệp đã được đọc xong thì có thể bỏ tước hiệu tệp bằng toán tử close() (Tước hiệu tệp dẫu sao cũng được tự động đóng lại khi chương trình thoát ra, nhưng tôi đang định làm cho gọn.)
Định nghĩa chương trình con này có thể đi sau hay trước chương trình con khác Và chúng ta gọi tới chương trình con thay vì đặt %words vào chỗ bắt đầu của chương trình, cho nên một cách để bao bọc tất cả những điều này có thể giống thế này:
Trang 24
chop($name);
if ($name =~ /^randal\b/i ) { # trở lại cách khác
print “Xin chào, Randal! May quá anh ở đây!\n”;
while ( ! &good_word($name, $guess)) {
print “Sai rồi, thử lại đi Từ bí mật là gì?”;
open (WORDSLIST, “wordslist”);
while ($name = <WORDSLIST>) {
local($somename, $someguess) = @_; # tên tham biến
$somename =~ s/\W.*//; # bỏ mọi thứ sau từ đầu
$somename =~ tr/A-Z/a-z/; # mọi thứ thành chữ thường
if ($somename eq “randal”) { # không nên đoán
1; #giá trị cho lại là true
} elsif (($words{$somename} || “đồ cáu kỉnh”) eq $someguess) { 1; # giá trị cho lại là true
Trang 25
Toán tử open() cũng được dùng để mở các tệp đưa ra, hay mở chương trình như tệp (đã được biểu diễn ngắn gọn) Tuy thế, việc vét hết về open() sẽ được
nêu về sau trong cuốn sách này, trong Chương 10, Tước hiệu tệp và kiểm tra tệp
Đảm bảo một lượng an toàn giản dị
“Danh sách các từ bí mật phải thay đổi ít nhất một lần mỗi tuần!” ông Trưởng ban danh sách từ bí mật kêu lên Thôi được, chúng ta không thể buộc danh sách này khác đi, nhưng chúng ta có thể ít nhất cũng đưa ra một cảnh báo nếu danh sách từ bí mật còn chưa được thay đổi trong hơn một tuần
Cách tốt nhất để làm điều này là trong chương trình con &init_words - chúng ta đã nhìn vào tệp ở đó Toán tử Perl -M cho lại tuổi tính theo ngày từ một tệp hay tước hiệu tệp đã được thay đổi từ lần trước, cho nên ta chỉ cần xem liệu giá trị này có lớn hơn bẩy hay không đối với tước hiệu tệp WORDSLIST:
sub init_words {
open (WORDSLIST, “wordslist”);
if (-M WORDSLIST > 7) { # tuân thủ theo đường lối quan liêu
Giá trị của -M WORDSLIST được so sánh với bẩy, và nếu lớn hơn, thế thì ta
vi phạm vào đường lối rồi Tại đây, ta thấy một toán tử mới, toán tử die, mà cho
in ra một thông báo trên thiết bị cuối* , và bỏ chương trình trong một cú bổ nhào rơi xuống
Phần còn lại của chương trình vẫn không đổi, cho nên trong mối quan tâm tới việc tiết kiệm cây cối, tôi sẽ không lặp lại nó ở đây
Bên cạnh việc lấy tuổi của tệp, ta cũng có thể tìm ra người chủ của nó, kích
cỡ, thời gian thâm nhập, và mọi thứ khác mà UNIX duy trì về tệp Nhiều điều hơn được trình bầy trong Chương 10
Cảnh báo ai đó khi mọi việc đi sai
Ta hãy xem ta có thể làm cho hệ thống bị sa lầy thế nào khi ta gửi một mẩu thư điện tử mỗi lần cho một ai đó đoán từ bí mật của họ không đúng Ta cần sửa đổi mỗi chương trình con &good_word (nhờ có tính mô đun) vì ta có tất cả thông tin ngay đây
* Thực tại là STDERR, nhưng đấy thông thường là màn hình
Trang 26
Thư sẽ được gửi cho bạn nếu bạn gõ địa chỉ thư của riêng mình vào chỗ mà chương trình nói “Địa chỉ bạn ở đây.” Đây là điều ta phải làm - ngay trước khi trả 0 về từ chương trình con, ta tạo ra một tước hiệu tệp mà thực tại là một tiến
trình (mail), giống như:
sub good_word {
local($somename, $someguess) = @_; # tên tham biến
$somename =~ s/\W.*//; # bỏ mọi thứ sau từ đầu
$somename =~ tr/A-Z/a-z/; # mọi thứ thành chữ thường
if ($somename eq “randal”) { # không nên đoán
1; #giá trị cho lại là true
} elsif (($words{$somename} || “đồ cáu kỉnh”) eq $someguess) { 1; # giá trị cho lại là true
} else {
open(MAIL, “|mail Địa_chỉ_bạn_ở_đây”);
print MAIL “tin xấu: $somename đã đoán $someguess\n”; 0; # cho lại giá trị false
}
}
Câu lệnh mới thứ nhất ở đây là open(), mà có một kí hiệu đường ống (|) trong tên tệp Đây là một chỉ dẫn đặc biệt rằng ta đang mở một chỉ lệnh thay vì một tệp Vì đường ống là tại chỗ bắt đầu của chỉ lệnh nên ta đang mở một chỉ lệnh để ta có thể ghi lên nó (nếu bạn đặt đường ống tại cuối thay vì đầu thì bạn
có thể đọc cái ra của chỉ lệnh.)
Câu lệnh tiếp, print, chỉ ra rằng một tước hiệu tệp giữa từ khoá print và giá trị được in ra chọn tước hiệu tệp đó làm cái ra, thay vì STDOUT* Điều này có
nghĩa là thông báo sẽ kết thúc như cái vào cho chỉ lệnh mail
Cuối cùng, ta đóng tước hiệu tệp, mà sẽ bắt đầu để mail gửi dữ liệu của nó
theo cách của nó
Để cho đúng, chúng ta có thể gửi câu trả lời đúng cũng như câu trả lời sai, nhưng rồi ai đó đọc qua vai tôi (hay núp trong hệ thống thư) trong khi tôi đang đọc thư mà có thể lấy quá nhiều thông tin có ích
Perl có thể cũng gọi cả các lệnh với việc kiểm soát chính xác trên danh sách đối, mở các tước hiệu tệp, hay thậm chí lôi ra cả bản sao của chương trình hiện tại, và thực hiện hai (hay nhiều) bản sao song song Backquotes (giống như backquotes của vỏ) cho một cách dễ dàng nắm được cái ra của một chỉ lệnh như
dữ liệu Tất cả những điều này sẽ được mô tả trong Chương 14, Quản lí tiến trình, cho nên bạn nhớ đọc
Nhiều tệp từ bí mật trong danh mục hiện tại
Ta hãy thay đổi định nghĩa của tên tệp từ bí mật một chút Thay vì tệp được
* Về mặt kĩ thuật thì tước hiệu tệp này hiện được chọn Điều đó sẽ được nói nhiều tới về sau
Trang 27while ($filename = <*.secret>) {
open (WORDSLIST, $filename);
vỏ, trong trường hợp này là *.secret Khi không có tên tệp thêm nữa được cho lại thì núm tên tệp cho xâu rỗng*
Cho nên nếu danh mục hiện tại có chứa fred.secret và barney.secret, thì
$filename là barney.secret ở bước đầu qua chu trình while (tên tới theo trật tự sắp của bảng chữ) Ở bước thứ hai, $filename là fred.secret Và không có tình huống thứ ba vì núm cho lại xâu rỗng khi lần thứ ba được gọi tới, làm cho chu trình while thành sai, gây ra việc ra khỏi chương trình con
Bên trong chu trình while, chúng ta mở tệp và kiểm chứng rằng nó đủ gần đây (ít hơn bẩy ngày từ lần sửa đổi trước) Với những tệp đủ gần, chúng ta duyệt qua như trước
Chú ý rằng nếu không có tệp nào sánh với *.secret và lại ít hơn bẩy ngày thì chương trình con sẽ ra mà không đặt bất kì từ bí mật nào vào mảng %words Điều đó có nghĩa là mọi người sẽ phải dùng từ đồ cáu kỉnh Thế cũng được
(Với mã thật, tôi sẽ thêm một kiểm tra nào đó về số các ô trong %words trước
khi cho lại, và die nếu nó không tốt Bạn hãy xem toán tử keys() khi ta lấy
mảng kết hợp trong Chương 5, Mảng kết hợp.)
* Lại undef lần nữa
Trang 28
Nhưng chúng ta biết họ là ai!
Được rồi, chúng ta đã hỏi tên người dùng khi trong thực tế chúng ta có thể lấy tên của người dùng hiện tại từ hệ thống, bằng việc dùng một vài dòng như:
@password = getpwuid($<); # lấy dữ liệu mật hiệu
$name = $password[6]; # lấy trường GCOS
$name =~ s/,.*//; # vứt đi mọi thứ sau dấu phẩy đầu tiên
Dòng đầu tiên dùng số hiệu người dùng ID của UNIX (thường được gọi là UID), tự động hiện diện trong biến Perl $< Toán tử getpwuid() (được đặt tên
giống như trình thư viện chuẩn) lấy số hiệu UID và cho lại thông tin từ tệp mật hiệu (hay có thể một số cơ sở dữ liệu khác) như một danh sách Chúng ta đánh dấu thông tin này trong mảng @password
Khoản mục thứ bẩy của mảng @password (chỉ số 6) là trường GCOS, mà thường là một xâu có chứa danh sách các giá trị các nhau bởi dấu phẩy Giá trị đầu tiên của xâu đó thường là tên đầy đủ của người
Một khi hai câu lệnh đầu này đã hoàn tất thì chúng ta có toàn bộ trường GCOS trong $name Tên đầy đủ chỉ là phần thứ nhất của xâu trước dấu phẩy đầu tiên, cho nên câu lệnh thứ ba vứt đi mọi thứ sau dấu phẩy thứ nhất
Gắn tất cả những điều đó với phần còn lại của chương trình (như đã được sửa bởi hai thay đổi chương trình con khác)
#! /usr/bin/perl
&init_words;
@password = getpwuid($<); # lấy dữ liệu mật hiệu
$name = $password[6]; # lấy trường GCOS
$name =~ s/,.*//; # vứt đi mọi thứ sau dấu phẩy đầu tiên
if ($name =~ /^randal\b/i ) { # trở lại cách khác
print “Xin chào, Randal! May quá anh ở đây!\n”;
while ( ! &good_word($name, $guess)) {
print “Sai rồi, thử lại đi Từ bí mật là gì?”;
while ($filename = <*.secret>) {
open (WORDSLIST, $filename);
Trang 29local($somename, $someguess) = @_; # tên tham biến
$somename =~ s/\W.*//; # bỏ mọi thứ sau từ đầu
$somename =~ tr/A-Z/a-z/; # mọi thứ thành chữ thường
if ($somename eq “randal”) { # không nên đoán
1; #giá trị cho lại là true
} elsif (($words{$somename} || “đồ cáu kỉnh”) eq $someguess) { 1; # giá trị cho lại là true
} else {
open(MAIL, “|mail Địa_chỉ_bạn_ở_đây”);
print MAIL “tin xấu: $somename đã đoán $someguess\n”; 0; # cho lại giá trị false
Liệt kê các từ bí mật
Rồi ông phụ trách danh sách từ bí mật lại muốn có một báo cáo về tất cả những từ bí mật hiện đang dùng, và chúng cũ đến đâu Nếu ta gạt sang bên chương trình từ bí mật một lúc, thì ta sẽ có thời gian để viết một chương trình báo cáo cho ông phụ trách
Trước hết, ta hãy lấy ra tất cả các từ bí mật, bằng việc ăn cắp một đoạn mã trong chương trình con &init_words:
while ($filename = <*.secret>) {
open (WORDSLIST, $filename);
if (-M WORDSLIST > 7) {
Trang 30là dòng định nghĩa trường vốn xác định số lượng, chiều dài và kiểu của trường
Với định dạng này, chúng ta có ba trường Dòng đi sau dòng định nghĩa trường
bao giờ cũng là dòng giá trị trường Dòng giá trị cho một danh sách các biểu
thức mà sẽ được tính khi định dạng này được dùng, và kết quả của những biểu thức đó sẽ được gắn vào trong các trường đã được xác định trên dòng trước đó
Ta gọi định dạng này với toán tử write, như thế này:
#!/usr/bin/perl
while ($filename = <*.secret>) {
open (WORDSLIST, $filename);
Trang 31
Khi định dạng này được gọi tới, thì Perl sẽ tính các biểu thức trường và sinh
ra một dòng mà nó gửi ra tước hiệu tệp STDOUT Vì write là được gọi một lần mỗi khi đi qua chu trình nên ta sẽ thu được một loạt các dòng với văn bản theo cột, mỗi dòng cho một từ bí mật
Hừm Chúng ta còn chưa có nhãn cho các cột Mà điều đó thì cũng dễ thôi
Ta chỉ cần thêm vào định dạng trên đầu trang, như:
Dòng đầu tiên trong định dạng này chỉ ra một văn bản hằng nào đó (Page) cùng với việc định nghĩa trường ba kí tự Dòng sau là dòng giá trị trường, ở đây với một biểu thức Biểu thức này là biến $%, giữ số trang được in ra - một giá trị rất có ích trong định dạng đầu trang
Dòng thứ ba của định dạng này để trống Vì dòng này không chứa bất kì trường nào nên dòng sau nó không phải là dòng giá trị trường Dòng trống này được sao trực tiếp lên cái ra, tạo ra một dòng trống giữa số trang và tiêu đề cột dưới
Hai dòng cuối của định dạng này cũng không chứa trường nào, cho nên chúng được sao trực tiếp ra cái ra Do vậy định dạng này sinh ra bốn dòng, một trong đó có một phần bị thay đổi qua mỗi trang
Chỉ cần thêm định nghĩa này vào chương trình trước là nó làm việc Perl để
ý đến định dạng đầu trang tự động
Perl cũng có các trường được định tâm hay căn lề phải, và hỗ trợ cho miền đoạn được rót kín Sẽ có nhiều vấn đề về điều này hơn khi ta đi vào các định dạng trong Chương 11, Định dạng
Làm cho danh sách từ cũ đó đáng lưu ý hơn
Khi ta đọc qua các tệp *.secret trong danh mục hiện tại, ta có thể tìm thấy các tệp quá cũ Cho tới nay, ta đơn thuần nhẩy qua những tệp này Ta hãy đi thêm một bước nữa - ta sẽ đổi tên chúng thành *.secret.old để cho ls của danh mục sẽ nhanh chóng cho ta những tệp nào quá cũ, đơn thuần theo tên
Sau đây là cách thức thể hiện cho chương trình con &init_words với sửa đổi
Trang 32
này:
sub init_words {
while ($filename = <*.secret>) {
open (WORDSLIST, $filename);
Duy trì một cơ sở dữ liệu đoán đúng cuối cùng
Ta hãy giữ lại dấu vết khi nào việc đoán đúng gần nhất đã được thực hiện cho mỗi người dùng Một cấu trúc dữ liệu mà dường như mới thoáng nhìn thì có
vẻ được là mảng kết hợp Chẳng hạn, câu lệnh:
$last_good{$name} = time ;
gán thời gian UNIX hiện tại (một số nguyên lớn quãng 700 triệu, chỉ ra số giây) cho một phần tử của %last_good mà có tên với khoá đó Qua thời gian, điều này sẽ dường chư cho ta một cơ sở dữ liệu chỉ ra thời điểm gần nhất mà từ
bí mật đã được đoán đúng cho từng người dùng đã gọi tới chương trình này Nhưng, mảng lại không tồn tại giữa những lần gọi chương trình Mỗi lần chương trình này được gọi thì một mảng mới lại được hình thành, cho nên nhiều nhất thì ta tạo ra được mảng một phần tử và rồi lập tức lại quên mất nó khi chương trình ra
Toán tử dbmopen() ánh xạ một mảng kết hợp vào một tệp đĩa (thực tế là một cặp tệp đĩa) được xem như một DBM Nó được dùng như thế này:
dbmopen(%last_good, “lastdb”, 066);
Trang 33manpage chmod(2).)
Câu lệnh thứ hai chỉ ra rằng chúng ta dùng mảng kết hợp đã được ánh xạ này hệt như mảng kết hợp thông thường Tuy nhiên, việc tạo ra hay cập nhật một phần tử của mảng sẽ tự động cập nhật tệp đĩa tạo nên DBM Và, khi mảng được thâm nhập tới lần cuối thì giá trị bên trong mảng sẽ tới trực tiếp từ hình ảnh đĩa Điều này cho mảng kết hợp một cuộc sống trải bên ngoài lời gọi hiện thời của chương trình - một sự bền lâu của riêng nó
Câu lệnh thứ ba ngắt mảng kết hợp ra khỏi DBM, giống hệt thao tác đóng tệp close()
Bạn có thể chèn thêm ba câu lệnh này vào ngay đầu các định nghĩa chương trình con
Mặc dầu các câu lệnh được chèn thêm này duy trì cơ sở dữ liệu là tốt (và thậm chí còn tạo ra nó trong lần đầu), chúng ta vẫn không có cách nào để xem xét thông tin trong đó Để làm điều đó, ta có thể tạo ra một chương trình nhơ tách biệt trông đại thể như thế này:
đó (Điều này hệt như toán tử keys trong awk.) Với mảng %words được xác
định trước đây, kết quả là một cái gì đó tựa như fred, barney, betty, wilma, theo một thứ tự không xác định Với mảng %last_good, kết quả sẽ là một danh sách của tất cả người dùng đã đoán thành công từ bí mật của riêng mình
Trang 34
Toán tử sort sẵp xếp theo thứ tự bảng chữ (hệt như việc truyền một tệp văn
bản qua chỉ lệnh sort) Điều này bảo đảm rằng danh sách được xử lí bởi câu lệnh
foreach bao giờ cũng theo thứ tự bảng chữ
Thân của chu trình foreach nạp vào hai biến được dùng trong định dạng STDOUT, và rồi gọi tới định dạng đó Chú ý rằng chúng ta đoán ra tuổi của một phần tử bằng cách trừ thời gian UNIX đã cất giữ (trong mảng) từ thời gian hiện tại (như kết quả của time) và rồi chia cho 3600 (để chuyển từ giây sang giờ) Perl cũng cung cấp những cách thức dễ dàng để tạo ra và duy trì các cơ sở
dữ liệu hướng văn bản (như tệp mật hiệu) và cơ sở dữ liệu bản ghi chiều dài cố
định (như cơ sở dữ liệu “đăng nhập lần cuối” do chương trình login duy trì) Những cơ sở dữ liệu này sẽ được mô tả trong Chương 17, Thao tác cơ sở dữ liệu người dùng
@password = getpwuid($<); # lấy dữ liệu mật hiệu
$name = $password[6]; # lấy trường GCOS
$name =~ s/,.*//; # vứt đi mọi thứ sau dấu phẩy đầu tiên
if ($name =~ /^randal\b/i ) { # trở lại cách khác
print “Xin chào, Randal! May quá anh ở đây!\n”;
while ( ! &good_word($name, $guess)) {
print “Sai rồi, thử lại đi Từ bí mật là gì?”;
while ($filename = <*.secret>) {
open (WORDSLIST, $filename);
Trang 35local($somename, $someguess) = @_; # tên tham biến
$somename =~ s/\W.*//; # bỏ mọi thứ sau từ đầu
$somename =~ tr/A-Z/a-z/; # mọi thứ thành chữ thường
if ($somename eq “randal”) { # không nên đoán
1; #giá trị cho lại là true
} elsif (($words{$somename} || “đồ cáu kỉnh”) eq $someguess) { 1; # giá trị cho lại là true
} else {
open(MAIL, “|mail Địa_chỉ_bạn_ở_đây”);
print MAIL “tin xấu: $somename đã đoán $someguess\n”; 0; # cho lại giá trị false
}
}
Tiếp đó, ta có bộ in từ bí mật:
#! /usr/bin/perl
while ($filename = <*.secret>) {
open (WORDSLIST, $filename);
Trang 36Thông thường, mỗi chương sẽ kết thúc với một số bài tập, lời giải cho chúng
sẽ có trong Phụ lục A, Trả lời bài tập Với chuyến đi dạo này, lời giải đã được
cho ở trên
1 Hãy gõ trong chương trình thí dụ trên vào máy rồi cho nó chạy (Bạn cần tạo
ra danh sách từ bí mật nữa.) Hãy hỏi thầy Perl của mình nếu bạn cần trợ giúp
Trang 37
2
Dữ liệu
vô hướng
Dữ liệu vô hướng là gì?
Vô hướng là loại dữ liệu đơn giản nhất mà Perl thao tác Một vô hướng thì
hoặc là một số (giống 4 hay 3.25e20) hay một xâu các kí tự (giống Xin chào
hay Gettysburg Address) Mặc dầu bạn có thể nghĩ về số và xâu như những vật rất khác nhau, Perl dùng chúng gần như đổi lẫn cho nhau, cho nên tôi sẽ mô tả chúng với nhau
Một giá trị vô hướng có thể được tác động tới qua các toán tử (giống như phép cộng hay ghép tiếp), nói chung cho lại một kết quả vô hướng Một giá trị
vô hướng có thể được cất giữ vào trong một biến vô hướng Các vô hướng có thể được đọc từ tệp và thiết bị, và được ghi ra nữa
Số
Mặc dầu vô hướng thì hoặc là một số hay một xâu, điều cũng có ích là nhìn vào các số và xâu tách biệt nhau trong một chốc ta sẽ xét số trước rồi đến xâu
Tất cả các số đều có cùng định dạng bên trong
Như bạn sẽ thấy trong vài đoạn tiếp đây, bạn có thể xác định cả số nguyên (toàn bộ số, giống như 14 hay 342) và số dấu phẩy động (số thực với dấuchấm thập phân, như 3.14, hay 1.35 lần 1025) Nhưng bên trong, Perl chỉ tính với các giá trị dấu phẩy động độ chính xác gấp đôi Điều này có nghĩa là không có giá
trị nguyên bên trong Perl - một hằng nguyên trong chương trình được xử lí như
giá trị dấu phẩy động tương đương Bạn có lẽ không để ý đến việc chuyển đổi (hay quan tâm nhiều), nhưng bạn nên dừng tìm kiếm phép toán nguyên (xem
như ngược với các phép toán dấu phẩy động), vì không có tẹo nào
Hằng kí hiệu động
Hằng kí hiệu là một cách để biểu diễn một giá trị trong văn bản chương trình Perl - bạn cũng có thể gọi điều này là một hằng trong chương trình mình, nhưng tôi sẽ dùng thuật ngữ hằng kí hiệu Hằng kí hiệu là cách thức biểu diễn dữ liệu trong mã chương trình gốc của chương trình bạn như cái vào cho trình biên dịch
Perl (Dữ liệu được đọc từ hay ghi lên các tệp đều được xử lí tương tự, nhưng không đồng nhất.)
Trong chương này:
liệu vô hướng là gì?
Số
Xâu
Toán tử
Biến vô hướng
Toán tử trên biến vô hướng
<STDIN> xem như giá trị
vô hướng
In ra với print()
Giá trị undef
Trang 38
Perl chấp nhận tập hợp đầyđủ các hằng kí hiệu dấu phẩy động có sẵn cho người lập trình C Số có hay không có dấu chấm thập phân đều được phép (kể cả tiền tố cộng hay trừ tuỳ chọn), cũng như phần chỉ số mũ phụ thêm (kí pháp luỹ thừa) với cách viết E Chẳng hạn:
1.25 # một phần tư
7.25e45 # 7.25 lần 10 mũ 45 (một số lớn)
-6.5e24 # âm 6.5 lần 10 mũ 24 (một số âm lớn)
-12e-24 # âm 12 lần 10 mũ -24 (một số âm rất nhỏ)
-1.2E-23 # một cách khác để nói điều đó.
Bạn đừng bắt đầu một số bằng 0, vì Perl hỗ trợ cho hằng kí hiệu hệ tám và
hệ mười sáu (hệt như kiểu C) Số hệ tám bắt đầu bằng số 0 đứng đầu, còn số hệ mười sáu thì bắt đầu bằng 0x hay 0X* Các chữ số hệ mười sáu A đến F (trong
cả hai kiểu chữ hoa thường) đều biểu thị cho các giá trị số qui ước từ 10 đến 15 Chẳng hạn:
0377 # 377 hệ tám, giống như 255 thập phân
-0xff # FF hệ mười sáu âm, hệt như -255 thập phân
Giống như số, xâu có biểu diễn hằng kí hiệu (cách thức bạn biểu diễn xâu
trong chương trình Perl) Các xâu hằng kí hiệu có theo hai hương vị: xâu dấu nháy đơn và xâu dấu nháy kép
Trang 39
Xâu dấu nháy đơn
Xâu dấu nháy đơn là một dẫy các kí tự được bao trong dấu nháy đơn Dấu
nháy đơn không phải là một phần của bản thân xâu - chúng chỉ có đó để Perl xác định chỗ bắt đầu và kết thúc của xâu Bất kì kí tự nào nằm giữa các dấu nháy (kể
cả dấu dòng mới, nếu xâu vẫn còn tiếp tục sang dòng sau) đều là hợp pháp bên trong xâu Hai biệt lệ: để lấy được một dấu nháy đơn trong một xâu có nháy đơn, bạn hãy đặt trước nó một dấu sổ chéo ngược Và để lấy được dấu sổ chéo ngược trong một xâu có nháy đơn, bạn hãy đặt trước dấu sổ chéo ngược nột dấu
sổ chéo ngược nữa Dưới dạng hình ảnh:
‘hello’ # năm kí tự: h, e, l, l, o
‘dont\’t’ # năm kí tự: d, o, n, nháy đơn, t
‘silly\\me’ # silly, theo sau là một sổ chéo ngược, sau là me
‘hello\n’ # hello theo sau là sổ chéo ngược và n
‘hello
there’ # hello, dòng mới, there (toàn bộ 11 kí tự)
Chú ý rằng \n bên trong môt jxâu có nháy đơn thì không được hiểu là dòng mới, nhưng là hai kí tự sổ chéo ngược và n (Chỉ khi sổ chéo ngược đi theo sau bởi một sổ chéo ngược khác hay một dấu nháy đơn thì mới mang nghĩa đặc biệt.)
Xâu dấu nháy kép
Xâu dấu nháy kép hành động hệt như xâu trong C Một lần nữa, nó lại là dãy các kí tự, mặc dầu lần này được bao bởi dấu ngoặc kép Nhưng bây giờ dấu sổ chéo ngược lấy toàn bộ sức mạnh của nó để xác định các kí tự điều khiển nào
đó, hay thậm chí bất kì kí tự nào qua các biểu diễn hệ tám hay hệ mười sáu Đây
là một số xâu dấu nháy kép:
“hello world\n” # hello world, và dòng mới
“new \177” # new, dấu cách và kí tự xoá (177 hệ tám)
“coke\tsprite” # coke, dấu tab, và sprite
Dấu sổ chéo có thể đứng trước nhiều kí tự khác nhau để hàm ý những điều
khác nhau (về điển hình nó được gọi là lối thoát sổ chéo) Danh sách đầy đủ của
các lối thoát xâu nháy kép được cho trong Bảng 2-1
Bảng 2-1 Lối thoát sổ chéo ngược xâu nháy kép
Trang 40Toán tử
Một toán tử tạo ra một giá trị mới (kết quả) từ một hay nhiều giá trị khác (các toán hạng) Chẳng hạn, + là một toán tử vì nó nhận hai số (toán hạng, như 5
và 6), và tạo ra một giá trị mới (11, kết quả)
Các toán tử và biểu thức của Perl nsoi chung đều là siêu tập của các toán tử
đã có trong hầu hết các ngôn ngữ lập trình tựa ALGOL/Pascal, như C Một toán
tử bao giờ cũng trông đợi các toán hạng số hay xâu (hay có thể là tổ hợp của cả hai) Nếu bạn cung cấp một toán hạng xâu ở chỗ đang cần tới một số, hay ngược lại, thì Perl sẽ tự động chuyển toán hạng đó bằng việc dùng các qui tắc khá trực giác, mà sẽ được nêu chi tiết trong mục “Chuyển đổi giữa số và xâu,” dưới đây