Lưu đệm web web caching
Trang 1HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
NHÓM 2 - D10VT3
LƯU ĐỆM WEB
Web caching
Bộ môn : Phương pháp luận Nghiện cứu khoa học Giảng viên: Dương Văn Thành
Trang 2Nhóm 2
LƯU ĐỆM WEB
Web caching
Trang 3Nội dung chính
1. Giới thiệu chung về web caching
2. Phân loại web cache
1 Browser cache
2 Proxy cache
3 Gateway cache
3. Hoạt động của cache
1 Các phương thức cache thông dụng
Last-Modified
Expires
4. Ưu điểm của web caching
Trang 41 Giới thiệu chung
Web caching là việc lưu trữ bản sao của những tài liệu web
sao cho gần với người dùng
Mục đích: Đáp ứng yêu cầu của client mà không cần sự tham gia của server ban đầu
• Web cache được đặt
giữa các Web Servers
(hoặc các servers
chính) và clients.
cach e
Trang 5Người sử dụng thiết lập trình duyệt: truy nhập web qua cache (máy chủ đệm là nơi lưu trữ)
• Trình duyệt sẽ gửi toàn
bộ yêu cầu HTTP tới
cache
• Đối tượng có trong cache:
cache sẽ trả về các đối
tượng
• Nếu không có thì cache sẽ
yêu cầu đối tượng từ server
ban đầu, sau đó trả đối
tượng cho client
Cache hoạt động như
client và sever
1 Giới thiệu chung
Trang 62.1 Browser cache
2 Phân loại web cache
• Web browser hiện đại (như
IE, Chrome, UC Browser hay
Mozilla v.v.) cho phép bạn
đặt riêng một phần ổ đĩa
cứng trên máy tính, điện
thoại của bạn để lưu trữ
những gì mà bạn đã xem.
Nó sẽ kiểm tra những
gì bạn đã xem được
cập nhật hay chưa,
thường là một phiên
thông tin.
Trang 72.1 Browser cache
Cache này đặc biệt có ích khi người dùng nhấn vào nút Back hoặc nhấn
vào một liên kết đến 1 trang mà họ vừa mới xem Ngoài ra, nếu bạn sử dụng cùng các hình ảnh liên kết trong suốt một site, gần như ngay lập tức người dùng sẽ được đáp ứng từ cache của browser.
Trang 8Proxies đáp ứng hàng trăm hoặc hàng ngàn
users cùng một cách thức; những tập đoàn lớn và IPS thường thiết lập chúng trên các firewalls, hoặc như một thiết bị độc lập (thường hiểu như là những phương tiện trung gian)
2.2 Proxy cache
Những proxy cache là một dạng
của shared cache và nó rất tốt
cho việc giảm những nguy cơ
tiềm ẩn và đường truyền mạng
Đó là lý do các thông tin lướt
trên web tiết kiệm được nhiều
thời gian.
Trang 92.2 Proxy cache
Giả sử 1 trường đại học có tốc độ yêu cầu trung bình vào internet là 1,6 Mbps Liên kết hiện tại tối đa chỉ 1,5 Mbps gây trễ rất lớn (minutes).
Nhưng trường đại học này không muốn thay liên kết này do tốn chi phí
mà chọn lắp thêm cache.
Giả sử tỷ lệ truy vấn vào cache ( được đáp ứng gần như lập tức) là 40% Vậy dữ liệu cần sử dụng liên kết truy nhập 60% x 1.6 = 0,96 Mbps, thấp hơn nhiều khả năng truy nhập tối đa nên trễ rất nhỏ.
Trang 10Được biết đến như là “reverse proxy cache”, thay vì được triển khai bởi nhà quản trị mạng để tiết kiệm băng thông, nó còn được triển khai bởi các Webmasters (nhà thiết kế, quản trị), để cho
web site của họ có khả năng mở rộng, đáng tin cậy và tối ưu
nhất
2.3 Gateway cache
Trang 11Web cache theo dõi các yêu cầu của các trang HTML, các hình ảnh và các tập tin (có thể hiểu là các object – đối tượng) đưa ra bằng cách sao lưu lại một bản sao cho chính những đối tượng đó
Sau đó, nếu một yêu cầu khác cho cùng một đối tượng, nó sẽ sử dụng bản sao đang có, thay vì phải hỏi lại server chính cho yêu cầu đó
3 Hoạt động của web cache
Trang 12Ví dụ về cách mà trình duyệt lấy 1 trang từ server (máy chủ)
1. Browser: Gửi yêu cầu
lấy index.html
2. Server: Tìm file…
3. Ok File đã sẵn sàng
4. Tải xuống và hiển thị
Trang 131 Browser gửi yêu câu lấy file
logo.png, với điều kiện nó đã được sửa đổi từ < date >
2 Server: Tìm file và kiểm tra
ngày sửa đổi…
3 Nó chưa bị sửa đổi Bạn đang
có bản cập nhật mới nhất.
4 Lấy file trong cache và hiển
thị cho người dùng.
Hoạt động của web cache
Các phương thức cache thông dụng
3.1 Phương thức Last-Modified
HTTP có cơ chế cho phép tra cứu việc đối tượng trong cache đã được cập nhật hay chưa Nó sẽ không gửi đối tượng nếu cache đã cập nhật phiên bản mới.
Trang 14Nếu file cần lấy đã bị sửa đổi, server sẽ gửi file được yêu cầu ở bản cập nhật mới nhất
Thông lượng trao đổi giữa browser (client) và server là nhỏ nếu file yêu cầu chưa bị sửa đổi (quá trình yêu cầu kiểm tra file)
3.1 Phương thức Last-Modified
Trang 153.2 Phương thức Expires
Với phương thức Last-modified, chúng ta vẫn phải gửi yêu cầu
kiểm tra lên server
Với các tài nguyên ít bị sửa đổi (như ảnh chẳng hạn), server có thể gửi file được yêu cầu kèm với 1 thông điệp (hay đúng hơn
là 1 parameter-tham số ở phần header) Expires (ngày hết hạn).
Trang 16Phương thức Expires
1 Browser: Kiểm tra xem
file mà người sử dụng yêu
cầu đã bị hết hạn trong
cache chưa…
2 Chưa! Browser lấy file từ
cache và hiển thị.
Giả sử client gửi yêu cầu vào ngày 18/3/2007
Server chẳng cần phải làm gì mà user vẫn có thứ mà họ cần.
Nếu file yêu cầu đã bị hết hạn, Web Server sẽ gửi file và kèm theo Expires mới.
Trang 17Nhược điểm:
1. Để phương thức này có thể hoạt động thì ở lần request đầu
tiên server phải gửi kèm thông điệp Expires
2. Chuyện gì sẽ xảy ra nếu file chưa hết hạn nhưng đã bị sửa
đổi ở server ? Câu trả lời là browser vẫn lấy file chưa hết hạn
đã lưu trong cache để sử dụng
Phương thức Expires
Trang 18Để giảm thời gian đáp ứng yêu cầu của client
Để làm giảm lưu lượng trên liên kết truy nhập của tổ chức
Internet dầy đặc cache: cho phép các nhà cung cấp nội dung
“nghèo nàn” có thể truyền nội dung hiệu quả (cũng giống chia
sẻ file P2P)
ISPs – Những nhà cung cấp dịch vụ - thường thiết lập sẵn hệ thống kết nối ngang hàng với các ISPs khác trong cùng quốc gia hoặc ở các nước khác Web caching ảnh hưởng mạnh đến băng thông trên mạng Các ISPs có thể tiết kiệm chi phí từ việc đưa ra những thỏa thuận với các ISP khác trên web caching.
3 Ưu điểm của web caching
Lý do cần phải sử dụng web caching
Trang 19Tài liệu tham khảo
1. http://vi.wikipedia.org
2. http://en.wikipedia.org
3. https://www.google.com.vn
4. Tài liệu khác
Trang 20Cảm ơn thầy giáo và các bạn đã chú ý lắng nghe