Xây dựng bộ lập lịch tải xuống với kỹ năng lập trình nhỏ

Aug 12, 2025
Bảo trì và Tối ưu hóa
NỘI DUNG KHÔNG ĐƯỢC CHỨNG MINH

Tất cả chúng ta đều thích tải xuống nội dung từ internet và có rất nhiều công cụ quản lý tải xuống tuyệt vời mà chúng ta có thể sử dụng để lên lịch tải xuống của mình. Có thể dễ dàng hơn khi sử dụng trình quản lý tải xuống, nhưng không có hại gì khi khám phá các công cụ đã đi kèm với Ubuntu của chúng tôi và sử dụng nó đầy đủ.

Trong bài viết này, chúng tôi sẽ giới thiệu cho bạn một phần mềm được tích hợp sẵn trong Ubuntu mà chúng tôi có thể sử dụng để tải xuống nội dung từ internet bằng wget . Trên hết, chúng tôi sẽ hướng dẫn bạn cách lên lịch tải xuống bằng Cron.

Tải xuống bằng Wget

Wget là một gói phần mềm miễn phí để truy xuất tệp bằng HTTP, HTTPS và FTP, các giao thức Internet được sử dụng rộng rãi nhất. Nó là một công cụ dòng lệnh không tương tác, vì vậy nó có thể dễ dàng được gọi từ script, cron job, terminal mà không cần hỗ trợ X-Windows, v.v.

Mở thiết bị đầu cuối của bạn và khám phá cách chúng tôi có thể sử dụng wget để tải xuống nội dung từ mạng. Cú pháp cơ bản để tải xuống bằng wget như sau:

wget [option]… [URL]…

Lệnh này sẽ tải hướng dẫn sử dụng wget vào ổ đĩa cục bộ của bạn

wget http://www.gnu.org/software/wget/manual/wget.pdf

Ληνύχ Κρών

Ubuntu đi kèm với một daemon cron được sử dụng để lên lịch các tác vụ được thực thi tại một thời điểm nhất định. Crontab cho phép bạn chỉ định các hành động và thời gian mà chúng sẽ được thực thi. Đây là cách bạn thường lên lịch một tác vụ bằng công cụ dòng lệnh.

Mở cửa sổ dòng lệnh và nhập crontab -e.

Mỗi phần trong crontab được phân tách bằng một khoảng trắng, với phần cuối cùng có một hoặc nhiều khoảng trắng trong đó. Một mục cron bao gồm phút (0-59), giờ (0-23, 0 = nửa đêm), ngày (1-31), tháng (1-12), ngày trong tuần (0-6, 0 = Chủ nhật), lệnh. Mục thứ ba trong crontab trên tải xuống wget.pdf lúc 2 giờ sáng. Mục nhập đầu tiên (0) và mục nhập thứ hai (2) có nghĩa là 2:00. Mục từ thứ ba đến thứ năm (*) có nghĩa là bất kỳ thời điểm nào trong ngày, tháng hoặc tuần. Mục cuối cùng là lệnh wget để tải xuống wget.pdf từ URL đã chỉ định.

Đó là điều cơ bản về wget và cách hoạt động của Cron. Hãy xem một ví dụ thực tế về cách lên lịch tải xuống.

Lên lịch tải xuống

Chúng tôi sẽ tải xuống Firefox 3.6 lúc 2 giờ sáng. Vì ISP của chúng tôi chỉ cung cấp một lượng dữ liệu hạn chế nên chúng tôi cần dừng tải xuống lúc 8 giờ sáng. Đây là những gì thiết lập trông như thế này.

Bỏ qua 2 mục đầu tiên trong crontab trên. Lệnh thứ ba và thứ tư là 2 lệnh duy nhất mà bạn cần. Lệnh thứ ba thiết lập một tác vụ sẽ tải xuống Firefox lúc 2 giờ sáng:

[code]
0 2 * * * wget -c http://download.mozilla.org/?product=firefox-3.6.6&os=win&lang=vi-GB
[/code]

Các tùy chọn -c biểu thị rằng wget sẽ tiếp tục quá trình tải xuống hiện tại nếu nó chưa được hoàn tất.

Lệnh thứ tư sẽ dừng hoạt động lúc 8 giờ sáng. ‘Killall’ là một lệnh unix giết các tiến trình theo tên.

[code]
0 8 * * * tiện ích killall
[/code]

Tiện ích killall thông báo cho Ubuntu ngừng tải tệp xuống lúc 8 giờ sáng.

Các lệnh wget hữu ích khác

1. Chỉ định thư mục để tải xuống tệp

[code]
wget –output-document = / home / zainul / Downloads / wget manual.pdf http://www.gnu.org/software/wget/manual/wget.pdf
[/code]

tùy chọn –output-document cho phép bạn chỉ định thư mục và tên của tệp bạn tải xuống

2. Tải xuống một trang web

wget cũng có thể tải xuống một trang web.

[code]
wget -m http://www.google.com/profiles/zainul.franciscus
[/code]

Lệnh trên sẽ tải xuống toàn bộ trang web hồ sơ google của tôi. Tùy chọn ‘-m’ yêu cầu wget tải xuống hình ảnh ‘phản chiếu’ của URL được chỉ định.

Một tùy chọn quan trọng khác là cho wget biết nó sẽ đi theo bao nhiêu liên kết khi tải một trang web.

[code]
wget -r -l1 http://www.google.com/profiles/zainul.franciscus
[/code]

Lệnh wget ở trên sử dụng hai tùy chọn. Tùy chọn đầu tiên ‘-r’ yêu cầu wget tải xuống trang web được chỉ định một cách đệ quy. Tùy chọn thứ hai ‘-l1’ yêu cầu wget chỉ nhận cấp liên kết đầu tiên từ trang web được chỉ định đó. Chúng tôi có thể thiết lập tối đa ba cấp ‘-l2’ và ‘-l3’.

3. Bỏ qua mục nhập của rô bốt

Web master duy trì một tệp văn bản có tên là Robot.txt. ‘Robot.txt’ duy trì danh sách URL mà trình thu thập thông tin trang web chẳng hạn như wget không nên thu thập dữ liệu. Chúng tôi có thể yêu cầu wget bỏ qua tùy chọn ‘Robot.txt’ với tùy chọn ‘-erobots = off’. Lệnh sau yêu cầu wget tải xuống trang đầu tiên trong tiểu sử trên google của tôi và bỏ qua ‘Robot.txt.

[code]
wget -erobots = off http://www.google.com/profiles/zainul.franciscus
[/code]

Một tùy chọn hữu ích khác là -U. Tùy chọn này sẽ ẩn wget dưới dạng trình duyệt. Lưu ý rằng việc che một ứng dụng thành một ứng dụng khác có thể vi phạm điều khoản và dịch vụ của nhà cung cấp dịch vụ web.

[code]
wget -erobots = off -U Mozilla http://www.google.com/profiles/zainul.franciscus
[/code]

Phần kết luận

Wget là một gói phần mềm GNU cũ nhưng có thể hack được mà chúng ta có thể sử dụng để tải xuống các tệp. Wget là một công cụ dòng lệnh tương tác có nghĩa là chúng ta có thể cho phép nó chạy trên máy tính của mình ở chế độ nền mà không cần phải khởi động bất kỳ ứng dụng nào. Kiểm tra trang wget man

[code]
$ man wget
[/code]

để hiểu các tùy chọn khác mà chúng tôi có thể sử dụng với wget.

Liên kết

Hướng dẫn sử dụng Wget
Cách kết hợp hai tệp đã tải xuống khi bỏ dở giữa chừng
Mẹo nhanh dành cho Linux: Tải xuống và giải nén trong một bước

Build A Configurable Cron Scheduler With Node.js


Bảo trì và Tối ưu hóa - Các bài báo phổ biến nhất

Cách ngăn bàn phím cảm ứng của Windows 10 xuất hiện khi đăng nhập

Bảo trì và Tối ưu hóa Sep 14, 2025

Gần đây, máy tính xách tay của tôi đã giới thiệu cho tôi Bàn phím cảm ứng của Windows mỗi khi tôi mở màn hình khóa… mặc dù máy tính xách tay..


Bốn cải tiến xuất sắc của Android Nougat mà bạn có thể chưa biết

Bảo trì và Tối ưu hóa Aug 23, 2025

NỘI DUNG KHÔNG ĐƯỢC CHỨNG MINH Android 7.0 Nougat là một bản xây dựng tinh chỉnh tính năng khác cho hệ điều hành, với rất nhiều chỉnh sửa nh�..


Cách đảo ngược màu sắc trong tệp PDF trong Adobe Acrobat Reader để đọc ban đêm dễ dàng hơn

Bảo trì và Tối ưu hóa Jun 10, 2025

Định dạng PDF nhằm đảm bảo định dạng của tài liệu được giữ nguyên khi xem trên các hệ điều hành và thiết bị khác nhau. Nếu đang xem tà..


Tăng tốc mọi PC, điện thoại thông minh hoặc máy tính bảng bằng cách tắt hoạt ảnh

Bảo trì và Tối ưu hóa Jul 8, 2025

NỘI DUNG KHÔNG ĐƯỢC CHỨNG MINH Hoạt ảnh trên máy tính để bàn, điện thoại thông minh hoặc máy tính bảng rất đẹp - vài lần đầu tiên. Cu�..


Từ Hộp thủ thuật: Dễ dàng chuyển đổi giao diện Windows 8, Windows 8 God Mode và tinh chỉnh Trình quản lý tác vụ trong Windows 7

Bảo trì và Tối ưu hóa Oct 11, 2025

NỘI DUNG KHÔNG ĐƯỢC CHỨNG MINH Trong phần tổng hợp các mẹo của tuần này, chúng ta sẽ xem xét một cách dễ dàng để chuyển đổi giữa màn h�..


Quản lý tệp dễ dàng hơn với Aero Snap trong Windows 7

Bảo trì và Tối ưu hóa Apr 12, 2025

NỘI DUNG KHÔNG ĐƯỢC CHỨNG MINH Trước những ngày của Aero Snap, bạn cần phải sắp xếp Windows của mình theo một cách kỳ lạ nào đó để xem tất cả ..


Mã màu Outlook để quản lý dễ dàng hơn

Bảo trì và Tối ưu hóa Oct 7, 2025

NỘI DUNG KHÔNG ĐƯỢC CHỨNG MINH Sắp xếp và theo dõi nhiều email tại văn phòng hàng ngày có thể là một công việc đối với chính nó. Hôm nay chúng ta c�..


Bản xem trước cửa sổ bật lên kiểu Vista dành cho tab Firefox

Bảo trì và Tối ưu hóa Dec 27, 2024

NỘI DUNG KHÔNG ĐƯỢC CHỨNG MINH Một trong những tính năng yêu thích của tôi trong Windows Vista là xem trước hình thu nhỏ của thanh tác vụ, đặc biệt là ..


Thể loại