Trình duyệt Web được sử dụng rất rộng rãi trong Internet ngày nay. Hơn 23 lượng lưu lượng trên mạng được tạo ra bởi Web. Khi xem xét làm thế nào để nâng cao chất lượng dịch vụ cung cấp bởi mạng Internet thì việc đầu tiên là kiểm tra việc thực hiện các giao dịch web. Chính ở đây, bộ nhớ đệm Web có thể đóng một vai trò quan trọng trong việc cải thiện chất lượng dịch vụ cho một phạm vi rộng lớn của người sử dụng Internet. Có hai loại bộ nhớ đệm Web là bộ nhớ đệm là browser cache và proxy cache. Browser cache là một phần của tất cả các trình duyệt Web. Nó lưu giữ một bản copy của tất cả các trang vừa mới truy cập và khi người sử dụng quay lại một trong các trang đó thì bản copy này sẽ được dùng lại. Ngược lại, proxy cache là một thiết bị mạng chia sẻ, nó có thể thực hiện các giao dịch Web thay mặt cho client và giống như browser cache, nó lưu trữ thông tin. Lúc này, proxy cache hoặc các bộ nhớ cache khác sẽ được kích hoạt để cung cấp các bản sao lưu trữ nội dung, tránh việc tải về từ các nguồn nội dung gốc. Trong bài báo này, chúng ta xem xét proxy cache một cách chi tiết hơn, đặc biệt là ở khía cạnh triển khai proxy cache trong mạng ISP.
Trang 1MỤC LỤC
DANH MỤC HÌNH VẼ
MỤC LỤC
1
Trang 2I GIỚI THIỆU CHUNG
Trình duyệt Web được sử dụng rất rộng rãi trong Internet ngày nay Hơn 2/3 lượng lưu lượng trên mạng được tạo ra bởi Web Khi xem xét làm thế nào để nâng cao chất lượng dịch vụ cung cấp bởi mạng Internet thì việc đầu tiên là kiểm tra việc thực hiện các giao dịch web Chính ở đây, bộ nhớ đệm Web có thể đóng một vai trò quan trọng trong việc cải thiện chất lượng dịch vụ cho một phạm vi rộng lớn của người sử dụng Internet
Có hai loại bộ nhớ đệm Web là bộ nhớ đệm là browser cache và proxy cache Browser cache là một phần của tất cả các trình duyệt Web Nó lưu giữ một bản copy của tất cả các trang vừa mới truy cập và khi người sử dụng quay lại một trong các trang đó thì bản copy này sẽ được dùng lại Ngược lại, proxy cache là một thiết bị mạng chia sẻ, nó
có thể thực hiện các giao dịch Web thay mặt cho client và giống như browser cache, nó lưu trữ thông tin Lúc này, proxy cache hoặc các bộ nhớ cache khác sẽ được kích hoạt để cung cấp các bản sao lưu trữ nội dung, tránh việc tải về từ các nguồn nội dung gốc Trong bài báo này, chúng ta xem xét proxy cache một cách chi tiết hơn, đặc biệt là ở khía cạnh triển khai proxy cache trong mạng ISP
II PROXY WEB CACHING
1 Ý tưởng
Khi một trình duyệt muốn tìm kiếm một URL, nó lấy hostname và dịch sang địa chỉ IP Một phiên HTTP được mở ra và client yêu cầu URL từ server
Khi sử dụng proxy cache, việc trao đổi cũng không có gì khác biệt Client mở một phiên HTTP với proxy cache và lập tức yêu cầu URL gửi đến proxy cache (Hình )
Hình : Một giao dịch Web Proxy
Trang 3Nếu bộ nhớ cache chứa URL tương ứng, nó sẽ kiểm tra đây có phải là bản mới nhất không bằng cách so sánh với “Expires” (trường ngày của nội dung) nếu có hoặc bằng một số cách khác được xác định tại cục bộ Sau đó thì các thành phần cũ được làm mới lại và nếu server làm mới lại nội dung thì thành phần đó được đánh dấu lại là mới nhất Các đối tượng mới nhất được gửi cho client Nếu như cache không có bất kỳ bản copy local của URL hoặc thành phần đã hết hạn thì lúc này ta gọi là cache miss Trong trường hợp này, hoạt động của cache giống như agent cho client, mở phiên làm việc riêng với máy chủ có tên trong URL và có gắng truyền trực tiếp vào bộ nhớ cache
2 Đặc điểm truy cập web dựa trên mô hình end-to-end
Nguyên tắc thiết kế ban đầu của kiến trúc Internet là mô hình end-to-end Trong
mô hình đó thì mạng là một công cụ thụ động trong việc thực hiện một nỗ lực tốt nhất để truyển tiếp các gói tin đến đích Giả sử rằng các gói tin gửi đi sẽ được truyền đến đúng đích và các đáp ứng được gửi bởi đúng đích (tránh trướng hợp một bên thứ 3 đứng giữa đóng giả để trao đổi thông tin với client)
Giao thức giao dịch World Wide Web (WWW), HTTP được xây dựng trên mô hình này Nó là nơi một phiên TCP được mở ra với máy chủ Cuộc trao đổi HTTP tiếp theo xác định các yêu cầu dữ liệu trên các host đích và các dữ liệu này sau đó được truyền lại cho client Mô hình chuyển giao này được thể hiện tốt nhất như một mô hình chuyển giao tránh lãng phí tài nguyên khi chỉ xét trong khoảng thời gian dữ liệu được truyền trực tiếp đến khách hàng theo yêu cầu
Mô hình chuyển giao này có nhiều lợi thế đáng kể Máy chủ dữ liệu có thể chỉnh sửa nội dung và toàn bộ yêu cầu của client phía sau để được cung cấp với các thông tin cập nhật và các cập nhật ngay lập tức được thể hiện trong các dữ liệu gửi Máy chủ dữ liệu cũng có thể theo dõi tất cả các yêu cầu nội dung, cho phép các nhà cung cấp nội dung theo dõi những nội dung cụ thể được yêu cầu, nhận dạng yêu cầu của mỗi người và mức
độ thường xuyên của mỗi mục nội dung được tham chiếu Các nhà cung cấp nội dung cũng có thể phân biệt giữa các khách hàng khác nhau, và sử dụng một số hình thức của
mô hình bảo mật, các nhà cung cấp nội dung có thể xác thực khách hàng và cung cấp thông tin đặc quyền cho các khách hàng nhất định Trong mô hình này các nhà cung cấp nội dung cũng có thể phân biệt giữa các khách hàng nhằm cung cấp thông tin nhất định đển một số khách hàng đặc biệt và các thông tin khác cho các khách hàng khác của máy chủ nội dung
Nhiều hệ thống web được xây dựng dựa trên khả năng của mô hình chuyển giao end-to-end này Liên tục cập nhật các trang web theo kiểu hoặc là server đẩy hoặc là client kéo để cập nhật thông tin nội dung trên màn hình client một cách đều đặn đặc biệt
Trang 4được sử dụng để hiển thị giá cổ phiếu trên thị trường, bản đồ thời tiết, hoặc màn hình quản lý mạng
Nhận dạng client có thể được sử dụng để tạo ra các máy chủ thông tin cá nhân công khai và ảo kết hợp Trong đó, một số nhóm người sử dụng xác định có thể được hướng đến môi trường nội dung nội bộ trong khi các client khác được hướng đến môi trường có nội dung công khai Hệ thống như vậy là cơ sở của môi trường mạng diện rộng
và có thể cũng được sử dụng làm một phần cơ sở của mạng ảo nội bộ Nếu thông tin được xác định cục bộ, thì công cụ này rất có ích Bảo mật và xác thực cũng được sử dụng để cung cấp dịch vụ đối với những trường hợp yêu cầu trao đổi ở mức độ riêng tư cao hơn ví
dụ như hệ thống giao dịch điện tử, giao dịch thẻ tín dụng, và hệ thống liên quan đến tài chính trên web Các giao dịch cá nhân có thể được mã hóa bằng cách sử dụng mã hóa socket-level, hoặc toàn bộ phiên TCP được mã hóa sử dụng công cụ mã hóa IP session-level ví dụ như IPSec (IP security)
Trong mô hình end-to-end có một số điểm hạn chế Một server mà cung cấp các thông tin phổ biến thì sẽ phải chịu áp lực nặng nề, cả về số lượng người truy cập cùng lúc tại nhiều thời điểm và cả về số lượng dữ liệu được gửi từ máy chủ cho các mạng xung quanh Lưu lượng lúc này giống như là tải của hệ thống máy chủ hoặc tải của mạng xung quanh máy chủ Để cải thiện hiệu năng của hệ thống như vậy có thể cải thiện máy chủ bằng cách tăng số lượng máy chủ thông qua việc sử dụng các cụm server kết hợp với máy chủ quản lý traffic và giúp cải thiện dung lượng của mạng cục bộ Tuy nhiên, tất cả các biện pháp này có thể không giải quyết tất cả các vấn đề trong việc duy trì chất lượng của việc cung cấp nội dung Hệ thống khách hàng dùng modem và hệ thống khách hàng dùng wireless băng thông thấp đều bị hạn chế bởi băng thông và trễ trong quá trình giao tiếp end-to-end với server Cải thiện dung lượng của các máy chủ có thể không nhất thiết phải giảm số lượng các kết nối của khách hàng mà cùng hoạt động đồng thời Trong khi giảm trễ giữa khách hàng và các điểm phân phối nội dung sẽ giúp cải thiện hiệu suất của việc phân phối nội dung
Thêm vào đó, bản thân mạng không được sử dụng hiệu quả, lưu lượng web tại cùng một thời điểm có khá nhiều nhân bản và mạng phải mang các bản sao của cùng một
dữ liệu đến mỗi khách hàng gây ra lãng phí đường truyền Đối với một nhà cung cấp thì dung lượng truyền tải là một chi phí kinh doanh nên việc xuất nhập nội dung chỉ xảy ra lần đầu, sau đó thì thông qua bản copy cục bộ của nội dung sẽ được gửi đến cho khách hàng Đây là một phương pháp giúp cải thiện hiệu năng của mạng
Xét về khả năng cải thiện hiệu suất của dịch vụ cung cấp nội dung cho một mạng lưới toàn cầu của các khách hàng, và về khả năng nâng cao hiệu quả vận chuyển mạng,
Trang 5bộ nhớ đệm đem lại nhiều ý nghĩa với các nhà cung cấp nội dung, các ISP, và cuối cùng
là cho khách hàng
3 Đặc điểm của proxy web caching
Các lợi ích tương tự của cải thiện hiệu suất và giảm traffic đi ra ngoài có thể được thực hiện cho lưu lượng WWW thông qua việc triển khai web cache Web cache về cơ bản không khác với bất kỳ hình thức của bộ nhớ đệm nào khác Các yêu cầu của client được truyền thông qua cache agent sau đó từ đây mới tạo yêu cầu gửi đến nguồn giống như một đại diện cho client Đáp ứng của máy chủ được giữ lại trong bộ nhớ cache cục
bộ, và một bản sao được chuyển cho client Nếu cùng một yêu cầu được chuyển đến cache agent ngay sau khi yêu cầu ban đầu được phục vụ thì đáp ứng có thể được tạo ra từ
bộ nhớ cache mà không cần tham khảo thêm với nguồn gốc
Hình : Mô hình web cache
Dựa vào dữ liệu đo đạt về lưu lượng dữ liệu của ISP, có thể thấy rằng khoảng 70% lưu lượng truy cập là lưu lượng trên nền Web Phân tích các yêu cầu về Web cho thấy rằng mức độ giống nhau của các yêu cầu có thể xấp xỉ 50%
Có hai tỷ lệ hit là tỷ lệ hit trang và tỉ lệ hit byte Tỷ lệ hit trang là tỷ lệ các yêu cầu HTTP có thể được phục vụ nhờ vào cache mà không cần quan tâm đến kích thước của trang Tỷ lệ hit byte là tỷ lệ số lượng byte được truyển từ cache với số lượng byte không hit Kinh nghiệm cho đến nay đã chỉ ra rằng tỷ lệ hit trang của một nơi nào đó từ 40 đến
55 phần trăm là có thể đạt được đối với một bộ nhớ cache cấu hình tốt Trong trường hợp
Trang 6như vậy tỷ lệ hit byte là từ 20 đến 35 phần trăm Một phần lớn trong tỷ lệ hit là do các tập tin hình ảnh
Với nhiều ISP, đặc biệt là những ISP hoạt động bên ngoài Bắc Mỹ, chi phí truyền tải chiếm vị trí chi phối trong cấu thành chi phí hoạt động Nếu bộ nhớ cache chỉ cần thực hiện được 60% của hiệu suất cache lý thuyết tối đa thì các ISP có thể giảm được các yêu cầu lưu lượng ra bên ngoài khoảng 13% Khi chi phí của cache so sánh được với chi phí truyền tải, sự khác biệt có thể chiếm một phần quan trọng trong chi phí hoạt động cơ bản của ISP
Ví dụ, nếu chi phí truyền tải trung bình là $150 cho mỗi gigabyte và ISP mua lưu lượng 1.000 gigabyte mỗi tháng từ một ISP nguồn với 70% lưu lượng là truy cập web; khi đó nếu một bộ nhớ cache hoạt động với tỉ lệ hit byte là 25% có thể tiết kiệm cho ISP
$26.250 chi phí thường xuyên mỗi tháng Nếu bộ nhớ cache có giá vốn $100,000 và chi phí hoạt động $2000 mỗi tháng cho các dịch vụ, thực hiện các phân tích kinh doanh sẽ thấy hoạt động của bộ nhớ cache đem lại $18.000 mỗi tháng cho các doanh nghiệp
Khách hàng cũng có lợi ích là tốc độ tải trang web tăng lên (với các nội dung đã được lưu đệm) do độ trễ của mạng giữa khách hàng và bộ nhớ cache cục bộ giảm
Kích thước trung bình của một giao dịch web là khoảng 16 gói dữ liệu trên luồng TCP Trong một quá trình điều khiển lưu lượng TCP theo kiểu tăng chậm (slow-start), chu kỳ đầu tiên sẽ truyền tải một gói tin và chờ đợi ACK Việc nhận được ACK sẽ kích hoạt truyền hai gói RTT (round-trip-time) thứ hai, và sau đó người gửi sẽ chờ đợi hai ACK Tiếp nhận hai ACK này sẽ kích hoạt thêm bốn gói trong chu kỳ thứ ba và tám trong chu kỳ tiếp theo, và các gói tin còn lại trong chu kỳ thứ năm Do đó, giao dịch web cần trung bình 5 RTT để đạt trạng thái tối ưu của thuật toán TCP tăng chậm Nếu một người dùng ở khá xa trang web, và RTT tới nguồn là 300 ms, trễ tải trang sẽ là 1,5 giây Trong khi đó, nếu thời gian truy cập Web cache cục bộ là 2 mili giây, thì trễ tải trang chỉ là 10
ms Những con số này thu được với giả sử mạng không nghẽn trong cả hai trường hợp Trong trường hợp này, miễn là tìm kiếm Web cache có thể hoàn thành trong vòng 1 giây, cache sẽ cho tốc độ tải trang nhanh hơn nhiều so với khi không có cache
Có thể có một phân tích hơi khác là khi so sánh hiệu suất của một bộ nhớ cache được cấu hình tại điểm cuối (Headend) của một hệ thống cáp-IP (cable-IP) so với việc thực hiện truy cập trực tiếp Sự khác biệt về độ trễ trong trường hợp này là do vị trí bộ nhớ cache tới người sử dụng gần hơn và băng thông hiệu quả từ bộ nhớ cache tới người dùng tăng lên rất nhiều Một tác vụ tải có bộ nhớ cache có thể hoạt động ở tốc độ hàng megabit/s, so với vài kilobit hoặc hàng chục kilobits mỗi giây khi sử dụng modem quay
số hoặc các dịch vụ ISDN Khi tải về một hình ảnh nặng 100K, người sử dụng modem
Trang 7quay số có thể gặp trễ 60 giây, và cùng hình ảnh đó tải về một bộ nhớ cache cục bộ thông qua cáp - IP có thể chỉ mất ít hơn một nửa giây
Sự đánh đổi của lưu đệm cache là cân đối các chi phí về dung lượng vận chuyển,
cả về chi phí của việc vận chuyển và chi phí hiệu năng của thời gian giao dịch ứng dụng,
so với chi phí của việc sử dụng cache Với các ISP ngoài Bắc Mỹ, thường có tỉ lệ hit lớn của cache đối với máy chủ đặt tại Bắc Mỹ, những lợi ích của việc sử dụng rộng rãi cache
là khá đáng kể Đối với các nhà khai thác cáp-IP, lợi ích của bộ nhớ cache cục bộ nằm ở khả năng khai thác được lợi ích của bước nhảy (hop) cuối tốc độ rất cao từ Headend tới người dùng cuối Với các ISP khác, những lợi ích của cache có thể là ít hơn đáng kể, tuy nhiên, có những kết quả tích cực của cache về hiệu suất và chi phí có thể khai thác được
Cũng như các mô hình truy cập trực tiếp, phương pháp này cũng có nhược điểm Chúng tôi đã lưu ý những cách khác nhau, trong đó mô hình phân phối nội dung Web từ đầu đến cuối (end-to-end) được khai thác để cung cấp nội dung theo thời gian, nội dung dựa trên khách hàng, và đảm bảo an toàn nội dung Cache chèn vào trong ngữ cảnh end-to-end của mô hình giao dịch ban đầu, và ngăn chặn các giao dịch bằng cách đưa ra một đại diện (proxy) của điểm cuối gốc Nội dung chuyển giao từ bộ nhớ cache là nội dung dựa trên thời gian cache thực hiện yêu cầu của nó đến máy chủ, và nội dung cung cấp từ các máy chủ dựa trên cái nhìn về máy chủ trên định danh của bộ nhớ cache, chứ không phải là định danh của khách hàng cuối
Khi hoạt động với các dữ liệu cache, server có cache không có được bức tranh chính xác về thời gian truy cập các nội dung, và người truy cập Server không thể xác thực máy khách, server cũng không thể phân phối các thông tin dựa trên thông tin nhận thực được cấp cho máy khách Tại máy khách cũng có các vấn đề tiềm tàng, do máy khách không nhận ra là nội dung được phân phối từ một cache đại diện Nội dung đó có thể không phản ánh đúng định danh của máy khách, và thông tin đó có thể là dựa trên mô hình bảo mật từ server tới cache, hơn là từ server tới máy khách ở đầu cuối, và máy khách có thể không nhận ra các thay đổi đó trong tên miền bảo mật Nếu nội dung là phụ thuộc thời gian thì nó sẽ phản ánh thời gian cache lấy nội dung hơn là khi máy khách thực hiện yêu cầu
Những điều vừa chỉ ra cho thấy cache không phải là một công cụ có thể áp dụng trong mọi trường hợp Một phần thách thức của việc triển khai các cache server là hiểu được các mô hình triển khai cache và phân phối nội dung Web, và đảm bảo cache không gây nhầm lẫn theo cách làm thay đổi tính thống nhất của nội dung phân phối tới người sử dụng đầu cuối
Trang 84 Web cache hits - Web server hits
Một trong những vấn đề lớn nhất là cân bằng giữa hoạt động của cache để tối đa tỉ
lệ cache hits và mong muốn của người phát hành nội dung web là đảm bảo đếm chính xác số lượt truy cập trang và xuất phát của truy cập Trong hầu hết các trường hợp, đây là yêu cầu cần được xem xét hơn là điều khiển việc phân phối nội dung Nhà cung cấp nội dung web không nhất thiết phải quan tâm tới tỉ lệ hit của nội dung web Hơn nữa, nhiều nhà cung cấp nội dung web thấy được giá trị từ việc phân phối các nội dung tĩnh tới máy khách hơn là họ phải chịu nhiều chi phí phân phối nội dung từ trang cục bộ
Các trang tĩnh, gồm các nội dung ảnh và chữ đơn giản đã được lưu cache sẵn, do vậy, các nhà phân phối nội dung gốc có thể không biết chính xác số lần trang được hiển thị khi khảo sát bản ghi trên server Một số nhà thiết kế web đặt các thông tin trong đường dẫn web, thông tin này làm cho server web cache không thể tái sử dụng trang đã lưu cache, Cách thông dụng nhất để làm việc này là đặt header mang thông tin "hết hạn" (expire) theo thời gian, do vậy trang sẽ được tải lại vào lần kế tiếp khi nó được truy cập
Và một trong những thủ thuật của cache server để tăng tỉ lệ hit là bỏ qua phần đó trong đường dẫn
Vấn đề đếm truy cập của server đã ngăn cản sự triển khai cache nhiều năm nay
Dù có những yêu cầu thực tế về xác thực, bảo mật, nội dung thời gian thực, và dữ liệu theo máy khách dẫn tới chắc chắn có các dạng dữ liệu được gắn cờ không lưu cache được, nhưng nhiều dữ liệu được gắn cờ đó đơn giản chỉ để server theo dõi định danh của máy khách Những dạng tránh cache này là không cần thiết và tiêu tốn tài nguyên mạng,
có thể gây quá tải cho server nội dung Có một Chuẩn internet mở rộng cho HTTP nhằm cung cấp một header đo lường ("Meter" header), để cache có thể truy cập các.thông tin liên quan và gửi lượng truy cập về cho server nội dung gốc, mở rộng này đưa ra các giới hạn sử dụng, nêu ra một cache server có thể cung cấp nội dung một số giới hạn lần trước khi phải xác nhận lại với server nội dung
III CÁC MÔ HÌNH WEB-CACHING
1 Explicit Caching
Một vài hệ thống cache ủy quyền được triển khai theo dạng tùy chọn được thiết lập bởi người dùng Người dùng chỉ định một cache server cho browser như một proxy agent, sau đó browser sẽ chuyển tất cả các request đến proxy cache Người dùng có thể bật hoặc tắt tùy chọn này tại mọi thời điểm, đảm bảo client được truyền thông trực tiếp với server gốc Khi gặp phải lỗi, một số trình duyệt hiện đại cũng có cơ chế tự động tắt proxy cache để truy cập trực tiếp Trong chế độ proxy cache, địa chỉ đích nằm dưới tầng transport là địa chỉ của server cache, trong khi nội dung HTTP không đổi Kiểu mô hình
Trang 9cache như trên có thể được triển khai bên trong một mạng cục bộ của client, với mục đích giảm thiểu lưu lượng (traffic) đến ISP Thêm vào đó, ISP có thể hoạt động như cache tự nguyện(voluntary cache) phục vụ các client của nó Nếu ISP hoạt động ở chế độ này, giữa người dùng (client) và ISP phải có sự ngầm định cũng như client phải nhận biết được vị trí của cache khi cấu hình local browser
2 Forced Explicit Caching
Một vài ISP đặc biệt là các ISP dạng dialup hoạt động trong môi trường cạnh tranh
về giá rất cao Hiệu năng và giá dịch vụ là một nhân tố kinh tế rất quan trọng, và rất có thể các ISP lựa chọn chế độ hoạt động caching hiện hữu cho mạng của mình mà không cần đến quyết định của người dùng, vì thế chế độ này là chế độ caching hiện hữu ép buộc Ví dụ: ISP sẽ khóa tất cả các luồng lưu lượng mạng đi qua cổng TCP 80 (cổng được sử dụng bởi giao thức vận tải HTTP Web), chuyển hướng chúng vào các proxy cache khi client truy cập Web ngoài vùng mạng
3 Transparent Caching
Việc sử dụng cache đối với toàn bộ lưu lượng Web có thể được chỉ định bởi ISP
mà không cần cấu hình hiện hữu để nhận dạng các proxy cache trong các browser của người dùng (client) Nguyên tắc đã chỉ ra rất rõ ràng, tuy nhiên có rất nhiều cách khác nhau để triển khai Kĩ thuật caching này được gọi là Transparent caching Với việc caching này, người dùng, browser của người dùng không cần nhận thức chính xác rằng việc ISP đang sử dụng caching khi xử lý các request của họ Ở đây mạng sẽ phải cắt đi các bản tin HTTP có đích đến các Web server từ xa (remote Web server), thay vào đó sẽ gửi trả lại các bản tin có trong proxy cache Một khi page đã được xác định, tùy theo các
sự kiện “hit” hay “miss” mà cache sẽ trả lại yêu cầu ban đầu của client bằng cách giả định là đích đến ban đầu của bản tin request (Hình )
Cần lưu ý là các cơ chế trên không phải hoàn toàn trong suốt đối với Web client và Web Server Nếu Web server sử dụng mô hình truy cập bảo mật đầu cuối, việc Transparent caching có thể không thực hiện được vì cache sẽ đưa ra địa chỉ của nó chứ không phải địa chỉ của client Việc này dẫn đến các page bị từ chối khi yêu cầu cache, trong khi client có thể hoàn toàn giao dịch trực tiếp với server Những tình huống sử dụng cache được ủy quyền do các chức năng lọc và ép buộc, qua hệ thống chuyển hướng Transparent, người dùng sẽ không thể nhìn thấy cách khắc phục, làm cho sự thất vọng về toàn bộ dịch vụ cache tăng lên nhanh chóng
Trang 10Hình : Transparent Caching
Một vài trường hợp ta vẫn có thể giải quyết vấn đề này Một cách tiếp cận là khi
có lỗi lấy dữ liệu cache (cache fetch error) thì ta sẽ kích khởi hệ thống con cache, thiết lập ra một phiên HTTP với nội dung gửi đến server có địa chỉ nguồn là của client, sau đó truyền đi bản tin yêu cầu HTTP GET đến server Phản hồi (respone) của server sau đó sẽ được truyền đến client thông qua một cầu TCP (một cầu TCP là nơi thiết bị kết nối được yêu cầu để dịch ra các chuỗi sequence number của các TCP header giữa hai phiên TCP) Các hệ thống con cache chặn bắt các packet của server gửi đến client đòi hỏi sự phối hợp chặt chẽ với cả cache router, nên hoạt động của TCP bridge khá phức tạp, vì vậy mà phương pháp này thiếu đi sự ổn định Một cách tiếp cận nữa là chỉ định cache server truyền ngược trở lại client một bản tin TCP RST, chỉ dẫn cho cache router thêm một đầu vào tạm thời trong bộ lọc chuyển hướng để tất cả các kết nối TCP cổng 80 từ client sẽ được đến server gốc mà không bị chuyển hướng đến cache nữa
Nếu cách thiết lập cache chỉ có một lợi ích duy nhất là tăng cường tốc độ truy nhập mạng của khách hàng thì ISP phải biết rõ hiệu năng của hệ thống cache phải được duy trì để đáp ứng được tất cả các Web request, nằm trong khả năng của ISP Sự kiện cache “hit” duy trì ở mức ổn định sẽ cho phép client truy cập nhanh hơn khi truy cập đến server gốc Sự kiện cache “miss” phải ở mức độ nhất định để tốc độ truy cập không thấp hơn quá nhiều khi so sánh với phương pháp truy cập trực tiếp đến trang web gốc Nếu hiệu năng của cache không được đảm bảo cho người dùng, thì lợi ích hướng đến người dùng sẽ mất Trong trường hợp đã lựa chọn kĩ thuật caching, thì người dùng sẽ tắt tùy chọn cache trong browser của họ và quay lại cách thức truy cập trực tiếp
Mô hình kinh doanh của cache là giá thành hoạt động và vốn bỏ ra đi cùng với lưu lượng cục bộ tại các vùng để giảm thiểu chi phí cho ISP, khi so sánh với mạng không cache Việc cắt giảm chi phí có thể được chuyển cho tất cả người dùng thông qua hoạt động của toàn bộ dịch vụ với một mức giá thấp hơn hoặc chuyển chọn lọc cho những