Ngày 18/10/1987 Larry Wall tác giả của ngôn ngữ này lần đầu tiên đưa Perl vào sử dụng tại nhóm usenet comp.sources . Ngôn ngữ này phát sinh từ C và chịu ảnh hưởng bởi các ngôn ngưx khác như BASIC, awk, sed và UNIX Shell. Perl là viết tắt của Practical-Extraction and Report- Language. Mục đích ban đầu là tạo ra các bản báo cáo nhanh chóng và dẽ dàng.
Trang 12 Các đặc trưng của Perl
Các ngôn ngữ và công cụ lập trình hiện nay rất nhiều, vì thế rất nên biết rõ điểm mạnh và điểm yếu riêng của từng ngôn ngữ để
có thể tùy chọn với những ứng dụng cụ thể Ngoài ra một trong những mục đích củabản báo cáo này là viết về Perl cho cả các đối tượng đã có nền tảng là C hay Shell Cho nên cần phải phân tích các đặc trưng của Perl
Trang 22.1 Perl là một trình thông dịch
Chương trình Perl được dịch đọc trọn vẹn và lưu trữ ở hình thứctrung gian trước khi chương trình này được thực hiện Tuy nhiêntốc độ xử lý sê không bằng các ngôn ngữ biên dịch như C hay C++
2.2 Xử lý text rất mạnh
Do có nhiều toán tử cũng như hàm để hỗ trợ riêng cho xử lý textnên Perl khác biệt với các ngôn ngữ khác là có tính chất xử lý text rất mạnh, có thể xử lý dễ dàng những tác vụ giống như C hoặc UNIX shell thường làm trong việc viết một Script nhưng
có thể ngắn gọn và đơn giản hơn
2.3 Perl có cú pháp giống C và Shell và có thể tích hợp với C
Perl và C đều là những ngôn ngữ lập trình phổ biến Mỗi ngôn ngữ có những điểm mạnh và điểm yếu riêng C là một ngôn ngữlập trình vạn năng, có tính thích nghi khả chuyển cao, cho phép can thiệp sâu vào hệ thống Hơn nữa tốc độ biên dịch cũng như tốc độ chạy của các ứng dụng viết bằng C khá nhanh và ổn định
Trang 3lý văn bản, điều mà ngôn ngữ C không hỗ trợ nhiều Hơn nữa 80% người bắt đầu học Perl đã từng làm quen với C hoặc C++ Cho nên càng dễ học Perl Perl có thể tận dụng tới các thư viện của C và ngược lại(trong một số điều kiện nhất định)Perl từ version 5.0 có thể tích hợp khá dễ dàng với các ứng dụng viết bằng C hoặc C++
Đối với Shell, ngôn ngũ script cơ bản nhất trong UNIX, Perl rất giống ngôn ngữ này cả trong cú pháp lẫn hàm Tuy nhiên có 1 vài điểm khác biệt đáng quan tâm Một trong những điểm khác biệt lớn nhất giữa cách hoạt động của Perl và Shell là Perl khôngchỉ là ngôn ngữ phiên dịch Chương trình Perl được dịch đọc trọn vẹn và lưu trữ ở hình thức trung gian trước khi chương trìnhnày được thực hiện Chương trình Shell được đọc và thi hành mỗi lần 1 lệnh Điều này mang lại 2 lợi ích cho chương trình viết bằng Perl so với chương trình viết bằng Shell:
+ Đầu tiên là chương trình Perl chạy nhanh hơn nhiều so với chương trình Shell Đó là do bộ biên dịch Perl kiểm tra cú pháp gỡ chú giải trước khi bắt đầu thực hiện mã
Trang 4+ Thứ hai, bạn không phải lo lắng về chương trình Shell lớn làm ngưng nửa chừng việc thực thi do lỗi cú pháp, vì tất cả
mã được phân tích trước khi bắt đầu làm việc
Perl còn có tính năng cho phép bạn lập trình trên một máy rồi dời nó đến 1 nền khác mà không cần phải thay đổi nào
2.4 Perl phát huy sức mạnh tối đa trên nền UNIX
Các nhà quản trị hệ thống và phát triển ứng dụng UNIX thường phải dùng tới một số ngôn ngữu lập trình khác nhau để hoàn tất các tác vụ cần thực hiện Ví dụ như để xử lý một file trong UNIX ta phải viết 1 đoạn Shell script sử dụng sh hoặc awk hay grep, và để biên tập file đó cần dùng đến shed Để can thiệp sâu vào hệ thống UNIX, ta lại phải dùng nhiều đến C Chính vì thế nảy sinh nhu cầu cần sử dụng một ngôn ngữ vừa dễ viết, dễ pháttriển, lại vừa xử lý một cách có hiệu quả nhiều tác vụ
rong khi đó Perl lại là một trong những ngôn ngữ mạnh nhất trên UNIX Nó chứa toán tử cung cấp hầu hết các hàm mà ngườilập trình muốn thực hiện trong môi trường UNIX Chính vì thế, bên cạnh C, Perl là một ngôn ngữ được cộng đồng Phần mềm
Trang 5mã nguồn mở sử dụng rộng rãi trên thế giới.
Những người biết rõ ngôn ngữ lập trình awk sẽ không ngạc nhiên là Perl mượn nhiều đặc sắc của awk Perl cũng bao gồm 1 vài đặc tính hay nhất của C, sed, và ngôn ngữ Shell trong UNIX như là bash và tcsh
2.5 Perl có thể chạy trên các môi trường khác nhau
- UNIX PERL chạy trên môi trường Unix
- PERL FOR WINDOWS NT chạy trên môi trường Windows
NT
-WIN PERL chạy trên môi trường Windows 95/ Windows 98
2.6 Perl cũng là một ngôn ngữ đa nhiệm
Perl được tối ưu hóa cho xử lý văn bản Trong những phiên bảnhiện thời, Perl cũng bao gồm nhiều tính năng bổ sung như lập trình socket, tích hợp với C Từ phiên bản 5.0, có thêm hướng đối tượng Mặc dù, ta hay nghe nói Perl là để lập trình cho web, nhưng trên thực tế không phải như vậy Perl còn là một ngôn ngữ lập trình hệ thống khá mạnh trong Unix
Trang 62.6 Perl là một ngôn ngữ rất thích hợp với CGI và Socket
2.6.1 Các CGI script
Perl là một trong những ngôn ngữ thông dụng nhất để tạo ra những ứng dụng CGI(Common Gateway Interface) Có hàng nghìn ví dụ lập trình CGI động trong Perl Perl có thể được sử dụng để tạo ra những trang Web động
Một trong những ứng dụng phổ biến nhất của Perl trên
Internet là xử lý mẫu nhập vào, bởi vì hầu hết đó là văn bản 2.6.2 Lập trình Socket
Perl có khả năng tới đọc/ghi các TCP/IP socket Chẳng hạn, Perl có thể dùng để viết một chương trình tự động kiểm tra địa chỉ IP để xác minh tính hợp lệ của 1 trang Web Điều này đặc biệt hữu ích trong việc cập nhật các trang Web
2.6.3 Xử lý email
Các chương trình Perl được sử dụng để lọc email dựa vào địa chỉ hoặc nội dung, tự động sắp xếp danh sách email(mailling lists) Một trong số web mail nổi tiếng nhất là
Trang 72.7 Perl có những tiện ích hỗ trợ việc gỡ lỗi
Trình thông dịch Perl có sẵn một trình gỡ rối, có thể giúp giảm bớt thời gian dùng đến gỡ lỗi những ứng dụng Trình gỡ rối đ-ược kích hoạt thường xuyên nhờ sử dụng tùy chọn - d khi biên dịch Ngoài ra, - w cung cấp một tập hợp đầy đủ những cảnh báo
2.8 Perl là một ngôn ngữ lập trình mã nguồn mở
Perl được phân phối theo phép công cộng GNU
Vì thế ta sẽ được nhiều sự hỗ trợ Chẳng hạn có thể liên hệ trựctiếp với Larry hoặc nhóm hỗ trợ Perl trực tuyến toàn thế giới, liên lạc thông qua nhóm tin Usenet comp.lang.perl hoặc gửi yêucầu tới perl-users-request@virgina.edu
3 Cấu trúc cơ bản của 1 chương trình Perl
Ta hãy nhìn vào một chương trình rất đơn giản nhưng thể hiện được những yếu tố căn bản nhất của Perl Đó là chương trình
“Hello.pl”:
Trang 8Dòng đầu tiên là giống như một câu nói rằng đây là chương trình Perl Nó cũng là lời chú thích cho Perl Bởi vì chú thích của Perl giống như chú thích của Shell Bất kì cái gì nằm giữa một dấu thăng (#) tới cuối dòng đều là một chú thích Không có khái niệm về chú thích trên nhiều dòng như C.
Dòng thứ hai là toàn bộ phần thực hiện được của chương trình này Tại đây chúng ta thấy câu lệnh print Từ khoá print bắt đầu chương trình, và nó có một đối, một xâu văn bản kiểu như C Bên trong xâu này, tổ hợp kí tự \n biểu thị cho kí tự dòng mới; hệt như trong C Câu lệnh print được kết thúc bởi dấu chấm phẩy (;) Giống như C, tất cả các câu lệnh đơn giản đều kết thúc bằng chấm phẩy* Nhưng chương trình Perl bao gồm tất cả các câu lệnh perl về tệp được lấy tổ hợp chung như một trình lớn cần thực hiện Không có khái niệm về trình “chính” main như trong C.(điều này giống như trong Shell)
Khi gọi chương trình này, phần lõi sẽ gọi bộ thông dịch Perl, phân tích câu toàn bộ chương trình (hai dòng, kể cả dòng chú
Trang 9thích đầu tiên) và rồi thực hiện dạng đã dịch Thao tác đầu tiên
và duy nhất là thực hiện toán tử print, điều này gửi đối của nó ralối ra Sau khi chương trình đã hoàn tất, thì tiến trình Perl ra, cholại một mã ra thành công cho lớp vỏ
CHƯƠNG 1: CÚ PHÁP, TẬP LỆNH, CÁC KIỂU DỮ LIỆU
Phần 1: Các phần tử cơ bản của ngôn ngữ Perl
Trang 10 các dấu ngăn cách , : ; dấu cách
các kí tự khác _ ? < > [ ] { } ~ ! @ # $ % ^ & * ( )
Các kí hiệu khác có thể dùng tong xâu hoặc trong chú thích
2 Từ khoá
Dưới đây liệt kê một số từ khoá thông dụng của Perl :
if else elsif while next sub print printfdo select
whileuntil for foreach unless diesort my binmode
3 Tên (định danh – identifier)
Tên là một khái niệm rất quan trọng, nó dùng để xác định
các đại lượng khác nhau trong một chương trình Chúng ta có tên hằng, tên biến, tên mảng, tên hàm, tên tệp, tên cấu trúc, tên nhãn,
Tên trong Perl được đặt theo quy tắc sau : là một dãy các
Trang 11dưới _, tên không được bắt đầu bằng chứ số hay dấugạch dưới, không được chứa các kí tự đặc biệt
hai tu sai vì sử dụng dấu cách
if sai vì trùng với từ khoá
Tuy nhiên có hai kiểu tên đặc biệt trong Perl gắn liên với hai kiểu dữ liệu là biến vô hướng và mảng
Tên biến vô hướng được bắt đầu bằng $
Tên mảng được bắt đầu bằng @
Chú ý :Tên trong Perl có độ dài tuỳ ý và có phân biệt chữ hoa
với chữ thường Vì vậy tên
là Pi sẽ khác tên là PI và pI
Trang 124.Cách ghi lời giải thích
Khi lập trình cần có thêm lời giải thích ghi chú để làm chochương trình dễ đọc, dễ hiểu hơn mà không gây ảnh hưởngđến sự làm việc của chương trình Các lời giải thích trongPerl được bắt đầu bằng kí tự # và tất cả những gì nằm sau
# cho đến cuối dòng đều là lời giải thích.Mọi thứ đằng sau
# khi dịch chương trình sẽ bị bỏ qua:
ví dụ:
$a=<STDIN>; #Nhap vao gia tri a
print "So cua nhap va la : $a\n"; # In so vua nhap ra
man hinh
5.Câu lệnh và dấu chấm câu
Một chương trình gồm nhiều câu lệnh, mỗi câu lệnh thựchiện một công việc nào đó Các câu lệnh phải được ngăncách nhau bởi dấu ;
6.Một số chương trình đơn giản viết bằng Perl
Trang 13Ví dụ 1: In ra màn hình dòng chữ Learning Perl is very good #!/usr/bin/perl
print “Learning Perl is very good”;
Ví dụ 2:In ra lời chào
#!/usr/bin/perl
print “Ban ten la gi ?”;
$a=<STDIN>;
chomp($a);
print “\nChao ban $a”;
Phần II: Các kiểu dữ liệu cơ sở
1 Các kiểu dữ liệu
1.1 Biến và hằng
Dữ liệu chứa trong máy tính có thể là biến hoặc hằng :
Trang 14Biến là đại lượng có thể thay đổi được giá trị Hằng là đại lượng có giá trị không thay đổi 1.1.1 Hằng kí hiệu
Hằng kí hiệu là cách thức biểu diễn dữ liệu trong mãchương gốc của chương trình như cái vào cho trình biêndịch Perl
Hằng kí hiệu động :giống như hằng dấu phẩy động trong C
Trang 15Ví dụ :
0377 # 377 hệ tỏm = 255 trong hệ thập phõn
-0xff # õm FF hệ mười = -255 trong hệ thập phõn
1.2 Kiểu số nguyên
Kiểu nguyên trong Perl được lưu trữ trong máy dưới dạng
số thực dấu chấm động Do đó kiểu nguyên trong Perl códải giá trị rất lớn, bằng với dải giá trị thực dấu chấm động
mà máy có thể xử lý được
Trang 16Các hằng kí hiệu nguyên được viết ra bằng dãy các chữ số
0, 1, 9 và kí tự đầu có thể là dấu + hoặc dấu – hay không códấu
Trang 17nên khi thao tác với số qua lớn có thể chúng ta sẽ không nhận được giá trị như mong muốn.
Xâu là một dãy các kí tự.Mỗi kí tự đều là một giá trị 8 bit
Có hai loại xâu trong Perl :
1.4.1 Xâu nháy kép
Trang 18 Là một dãy các kí tự bất kì được đặt trong hai dấu nháy kép.
Ví dụ :
“Day la mot xau”
“Day cung_la xau?”
Trong xâu nháy kép có thể có dấu sổ chéo ( \ ) là kí tự
để xác định kí tự điều khiển nào đó Bảng sau đây sẽ liệt kê một số kí tự điều khiển
Trang 19chữ thường
\n Chuyển sang dòng mới
\r Về đầu dòng
\t Tab
\u Chuyển kí tự tiếp theo thành chữ hoa
\U Tất cả các kí tự tiếp theo chuyên thành
“ dau \” ngoac kep\” ”
“ chu \U hoa ” -> chuyển xâu thành “ chu HOA ”
Trang 20 Ngoài ra bạn cũng có thể sử dụng cách viết sau để biểu diễn một kí tự nào đó trong bảng mã ASCII :
\xnn với nn là giá trị số viết dưới dang hệ 16 của
1.4.2 Xâu nháy đơn
Perl cũng cho phép bạn sử dụng xâu trong hai dấu nháy đơn
Trang 21 Khác với xâu nháy kép, xâu nháy đơn có thể được đặttrên nhiều dòng và các kí tự điều khiển sẽ không có tácdụng ngoại trừ hai trường hợp dấu ‘ và dấu \
“so cheo : \\’ “so cheo : \”
Một sự khác biệt nữa giữa xâu nháy đơn và xâu nháykép là các biến nếu được đặt trong xâu nháy kép thì sẽcho giá trị của biến, càon xâu nháy đơn thì không
1.4.3 Một số phép toán dối với xâu
Trang 22 index (s1, s2) trong đó s1, s2 là biểu thức xâu kí tự Hàm này
cho ta vị trí đầu tiên của xâu s2 gặp trong xâu s1
rindex (s1, s2) hàm này tương tự như hàm index, nhưng nơi
bắt đầu tìm kiếm là cuối xâu s1
length(st) hàm này cho ta độ dài của xâu kí tự st.
pos(st) chỉ ra vị trí của khuôn mẫu được đối sánh trong xâu
Trang 23 substr(st, pos, len) trả lại giá trị là một xâu gồm len kí
tựđược tách ra từ xâu st, bắt đầu từ vị trí pos trong xâu
lc(st) chuyển đổi tất cả các kí tự trong xâu st ra chữ thường
uc(st) chuyển đổi tất cả các kí tự trong xâu st ra chữ hoa
lcfirst(st) chuyển đổi kí tự đầu tiên của xâu st ra chữ thường
ucfirst(st) chuyển đổi kí tự đầu tiên của xâu st ra chữ hoa
quotemeta(st) trả lại giá trị là xâu kí tự được thêm dấu \ vào
trước những kí tự không phải là từ trong xâu st
join(joinstr, list) trả lại giá trị là một xâu được ghép nối bởi
các phần tử trong danh sách list và giữa hai phần tử trong xâu ghép nối là xâu joinstr
@list = ("Day", "la", "vi", "du.");
$str = join (" ", @list); #Lệnh gán này cho $str = “Day la vidu.”
II Biến, biểu thức và lệnh gán
1 Biến
Trang 24 Biến là đại lượng có thể thay đổi được giá trị
Khái niệm biến trong Perl gắn liền với khái niện biến vôhướng Một biến vô hướng thì giữ một giá trị vô hướngriêng : có thể là một dòng dữ liệu, một đoạn văn bản,hay một số Giá trị được lưu giữ trong biến vô hướngđược gọi là giá trị vô hướng
Quy tắc đặt tên biến vô hướng : Gồm kí tự $ ở đầu tên,tiếp sau là chữ, chữ số hay dấu _ (phần sau kí tự $ tuântheo quy tắc đặt tên đã giới thiệu trong phần trước)
Trang 25 Toán hạng là một đại lượng nào đó, có thể là hằng, biến hay hàm.
Các phép toán được dùng trong ngôn ngữ Perl
Trang 29biểu thức cũng có thể là biểu thức gán:
$a = $b = ($c =10) * 5cũng như C , Perl cho phép thu gọn biểu thức gán :
<biến> = <biến> <phép toán>
<toán hạng>
<biến> <phép toán>= <toán hạng>
$x = $x + 5 có thể viết thành $x += 5
các phép gán thường dùng là += -= *= /= %= **=
&= |= ^=
Biểu thức theo điều kiện :
Trang 30<biểu thức 1> ? <biểu thức 2> : <biểu thức 3>
Gán theo điều kiện
<biến> = <biểu thức 1> ? <biểu thức 2> : <biểu thức 3>
Nếu <biểu thức 1> đúng(=1) thì <biến> sẽ lấy giá trị của
<biểu thức 2>, trường hợp ngược lại <biến> sẽ lấy giá trị của <biểu thức 3>
Biểu thức theo điều kiên trong Perl có thể nằm ở bên trái phép gán
<biểu thức 1> ? <biến 1> : <biến 2> = <biểu thức 2>
Nếu <biểu thức 1> đúng(=1) thì <biến 1> sẽ lấy giá trị của
<biểu thức 2>, trường hợp ngược lại <biến 2> sẽ lấy giá trịcủa <biểu thức 2>
ví dụ :
$a=2>3 ? 6 : 9 ;
Trang 31 Sự khác nhau giữa dạng tiền tố và hậu tố là trong dạng tiền
tố giá trị biến sẽ được tăng trước khi gán, còn dạng hậu tốthì biến được tăng sau khi gán
Trong Perl phép tăng (chỉ có phép tăng) một đơn vị cònđược áp dụng cho cả xâu nếu xâu chỉ gồm các chữ cái vàchữ số
Ví dụ $xau = “abc”;
$xau++; # Cho ta $xau = “abd”
Trang 32$xau = “abz”;
$xau++; #Cho ta $xau = “aca”
5 Thứ tự ưu tiên các phép toán
Bảng 1.3 Thứ tự ưu tiên các phép toán
Phép toán Chiều tính toán
L → R
Trang 341 Lệnh đơn, lệnh ghép
2 Lệnh rẽ nhánh: if, if…else, if…elsif
3 Lệnh lặp: while, for, foreach…
print “Hello, World!\n”;
Lệnh ghép: dãy các lệnh được đặt trong 1 khối bắt đầu bởi{ và kết thúc bởi } Lệnh ghép được dùng trong cấu trúclệnh mà cú pháp đòi hỏi như một lệnh độc lập (trong if,
Trang 35(Tương tự như trong C)
2 Lệnh lựa chọn theo điều kiện if :
Trang 36 <Lệnh 1>, <lệnh 2> có thể là lệnh ghép
else đi theo if gần nhất
Điều kiện là biểu thức số; kiểm tra với 0
Ví dụ:
Trang 37Kết quả chạy chươngtrình:
- Nếu chỉ quan tâm đến các trường hợp khi biểu thức xác
định là sai, có thể sử dụng lệnh điều khiển unless để tránh
có một câu lệnh if…else
Cú pháp câu lệnh unless:
Trang 38unless (<biểu thức điều kiện>)
Trang 39Ví dụ:
Kết quả chạy chươngtrình:
Khi biểu thức điều kiện là sai, lệnh 1 sẽ được thực hiện Trái lại,khi biểu thức điều kiện là đúng, lệnh 2 sẽ được thực hiện
- Câu lệnh elsif:
Cú pháp:
if (<biểu thức điều kiện 1>)
{