Hướng dẫn cài đặt và sử dụng Nnewagrabber V1.4 cho CMS Joomla 1.5
Trang 11
Hướng dẫn cài đặt và sử dụng “NNewsGrabber V1.4” cho
CMS Joomla 1.5
1 Cài đặt Component:
Đầu tiên, bạn tải phiên bản com_ngrabnews.zip mới nhất về máy tính của bạn, sau đó
vào phần quản trị của web chọn menu Extension → Install/Uninstall, Chọn file
com_ngrabnews.zip trên máy tính của bạn và nhấn nút Upload File & Install
Khi cài đặt xong hệ thống sẽ tự tạo thư mục grabnews trong
thu_muc_web_cua_ban/images/stories/ nhằm mục đích lưu trữ các file ảnh lấy về
được Bạn hãy kiểm tra thư mục đó có quyền write chưa, hay đã được tạo chưa, nếu
chưa có thư mục đó bạn phải tự tạo thủ công bằng chương trình FTP
Trang 22
2 Đăng ký sử dụng chương trình:
Sau khi cài đặt component hoàn tất ban cần đăng ký quyền sử dụng Chọn menu
Component → NNewsGrabber → License, điền các thông tin đăng ký vào phần
Register a new license, và nhấn Register License Để đăng ký được license, hosting
của trang web phải kết nối trực tiếp vào Internet và không bị firewall chặn các kết nối
vào ra Lưu ý: bạn phải đọc kỹ điều khoản bằng cách nhấn vào link “the terms of use”
trước khi đăng ký để tránh trường hợp license của bạn bị khóa trong quá trình sử dụng
Nếu đăng ký License hoàn tất, hệ thống sẽ thông báo tình trạng màu xanh cho bạn, nếu
không đăng ký được license, bạn vui lòng liên hệ add nick YM nhutcorp để được hỗ
trợ License đăng ký mặc định ban đầu là miễn phí (có quảng cáo trong nội dung lấy về), bạn có thể nâng cấp thành phiên bản có phí (không có quảng cáo, số lượng filter nhiều hơn, có hỗ trợ bản phân tích bất kỳ nguồn tin theo yêu cầu) bằng cách nhấn vào link
Upgrade License
Trang 33
3 Tạo Filter:
Giải nén file Filter mà bạn download về được, bạn sẽ thấy các file có tên như “filter…
list.txt” và “filter… detail.txt” File có dạng “…list.txt” là file chứa nội dung bộ lọc đọc bề
mặt trang web để phân tích các tin ngắn theo từng mũi tên màu đỏ
Trang 44 File có dạng “…detail.txt” là file chứa nội dung bộ lọc phân tích thông tin chi tiết
Trang 55
Chọn menu Component → NNewsGrabber → Filter, nhấn nút Browse để chọn file
“filer list.txt”, sau đó nhấn Start Upload để import filter này vào Tương tự, bạn thực
hiện import file “filter …detail.txt” vào hệ thống
Sau khi hoàn tất bạn sẽ thấy 2 filter của mình hiện thị trong hệ thống, nhấn link View của
mỗi filter để kiểm tra thử, nội dung tin mẫu của filter sẽ hiện ra nếu nó hoạt động tốt
Ngoài ra bạn còn có thể tự tạo filter riêng cho mình bằng cách nhấn nút New bên trên,
để có được nội dung filter đọc được một trang tin bạn cần có một số kiến thức căn bản
về mã HTML và hiểu được qui định viết filter của hệ thống Chúng tôi sẽ cung cấp tài
liệu cho bạn về các qui định viết filter nếu bạn có yêu cầu (chỉ hỗ trợ đối với thành viên
có phí)
Trang 66
4 Tạo Autorun:
Vào menu Component → NNewsGrabber → Auto Run nhấn nút New để tạo mới Với
2 filter trên bạn có thể lấy nhiều mục tin của trang một trang tin bằng cách tạo ra nhiều autorun giống filter khác nhau Run Url
Một vài thông số chính bạn cần thiết lập:
• Autorun Name: Đặt tên cho phần tự động này, bạn có thể đặt bất kỳ tên gì để dễ phân biệt và quản lý
• Run Url: Liên kết cần lấy tin Do filer chỉ đọc tin theo chuyên mục nên bạn hãy
nhập link phù hợp với filter đó, không nhập link trang chủ web hoặc link Rss
• Group Check: Kiểm tra tin đã lấy rồi theo nhóm, ngoài tính năng kiểm tra đơn lẻ của từng Autorun, nhằm tránh trường hợp trùng tin, hệ thống còn hỗ trợ theo nhóm để tránh lấy tin trùng với các Autorun khác
• Filter List: Chọn bộ lọc dạng list, dùng để lấy tiêu đề, hình ảnh, tin ngắn Bạn có thể nhấn vào biểu tượng tam giác ngược màu xanh ( ) bên cạnh để xem thử
• Filter Detail: Bảng phân tích chi tiết trang tin, dùng để lấy thông tin đầy đủ, hãy nhấn thử vào mũi tên xanh để kiểm tra
• Section, Category: Chọn khu vực lưu tin lấy về Đây là section và category của
hệ thống Joomla, tin sẽ tự lưu trữ vào khu vực đó
(Mẹo: Thực hiện 3 bước như hướng dẫn trong ảnh để kiểm tra Filter list bạn đang chọn
có phân tích được liên kết trang tin bạn điền vào Run Url không)
Trang 77
Các thông số tham khảo thêm:
• Extract Intro Image from Detail: Chỉ sử dụng chức năng này trong trường hợp tin ngắn ở nguồn tin không có hình Chức năng này lấy một ảnh lớn nhất trong tin chi tiết đưa ra ngoài tin ngắn, trang tin bạn sẽ đẹp hơn nếu có hình ảnh đầy đủ
• Store Image in MonthYear Folder: Lưu trữ các ảnh lấy về vào các thư mục phân loại theo từng tháng
• Image Intro: Nếu bạn chọn Store Image Intro là Yes, ảnh sẽ được lấy về và
được xử lý cho tin ngắn Hãy điền lại các thông số Thumb Width và Thumb Height cho phù hợp với kích thước trang web của bạn
• Image Detail: Nếu bạn chọn Store Image Detail là Yes, ảnh sẽ được lấy về và được xử lý cho nội dung chi tiết Tương tự, hãy điền lại các thông số Thumb Width và Thumb Height cho phù hợp với kích thước trang web của bạn
• Article Ordering: Thứ tự sắp xếp của bài viết mới lấy về, mặc định là trên cùng
• Content Source: Ghi lại địa chỉ của nguồn tin vào cuối nội dung tin chi tiết
• Auto Fix HTML: Tự động định dạng lại thẻ HTML trong nội dung lấy về, tránh trường hợp site của bạn “bể” định dạng
• Remove Style: Tự động gỡ bỏ các style của site nguồn, nội dung sẽ hiển thị chuẩn với style của site bạn
• Remove Internal Link: Tự động gỡ bỏ các link liên quan đến site nguồn
• Auto Keyword: tự động trích xuất từ khóa và mô tả trang web trên site nguồn vào nội dung bài viết giúp SEO tốt hơn
• Auto Run Setting: Thiết lập giờ tự động kiểm tra và lấy tin về, tùy mức độ cập nhật của site nguồn mà bạn điều chỉnh cho phù hợp, tránh thiết lập thời gian
ngắn quá làm nghẽn hệ thống của bạn Trong trường hợp này Minute(s): 19, Hour(s): Every Four Hours, các thông số khác mặc định (nghĩa là cứ 4 tiếng
tính từ lúc bạn lưu Autorun này, hệ thống sẽ đọc tin 1 lần vào phút thứ 19)
Trang 88
5 Chạy thử Auto Run:
Sau khi khai báo các thông số xong thì nhấn Save để lưu lại, bạn sẽ thấy danh sách các
Autorun đã tạo, hãy nhấn link Run Now của một Autorun để chạy thử nó Cửa sổ làm
việc sẽ hiện ra báo cho bạn biết quá trình xử lý, bạn không nên tắt cửa sổ này và hãy
chờ nó xử lý xong sẽ tự đóng lại
Sau khi chạy thử thành công hệ thống sẽ hiển thị con số tin lấy về được ở cột Logs,
bạn có thể xóa logs này bằng cách nhấn vào Clear Log, hoặc nhấn vào Clear Log &
Article để xóa logs cùng các bài viết và hình ảnh liên quan
Sau khi chạy xong hệ thống sẽ thông báo kết quả và thời gian thành công gần đây nhất
cho bạn biết Trong trường hợp thời gian thành công gần đây quá dài khoản 1 tháng,
nghĩa là trang nguồn của bạn không cập nhật thông tin, hoặc trang nguồn thay đổi cấu
trúc tin (thay đổi mã HTML), hãy kiểm tra lại trang nguồn hoặc liên hệ YM nhutcorp để
được hỗ trợ cập nhật bảng filter
Lưu ý: tính năng chạy thử chỉ lấy tin khi bạn nhấn vào link Run now, để hệ thống tự
động chạy theo giờ đã chọn thì bạn nên thiết lập cron trên hosting của bạn Xin vui lòng
xem menu Support hoặc liên hệ nhutcorp@yahoo.com để được hướng dẫn thêm
Trang 99
Kết thúc công đoạn chạy thử, hãy vào mục article của joomla để xem tin của bạn, nhớ
chọn section và category mà bạn chọn lúc tạo Autorun
Nếu bạn đã thiết lập menu link đến category này thì hãy ra ngoài trang chủ xem thành
quả mình đạt được
Kết thúc hướng dẫn, cám ơn bạn đã đọc tài liệu này
Thiên Nhựt – info@nhutcorp.com