Vi älskar alla att ladda ner saker från internet, och det finns massor av fantastiska verktyg för nedladdningshanterare som vi kan använda för att schemalägga våra nedladdningar. Det kan bara vara lättare att använda en nedladdningshanterare, men det finns ingen skada att utforska de verktyg som redan följer med vår Ubuntu och utnyttja den till fullo.
I den här artikeln visar vi dig en inbyggd programvara i Ubuntu som vi kan använda för att ladda ner saker från internet med wget . Dessutom visar vi dig hur du planerar nedladdningen med Cron.
Ladda ner med Wget
Wget är ett gratis mjukvarupaket för att hämta filer med HTTP, HTTPS och FTP, de mest använda Internetprotokollen. Det är ett icke-interaktivt kommandoradsverktyg, så det kan lätt anropas från skript, cron-jobb, terminaler utan X-Windows-support etc.
Öppna din terminal och låt oss utforska hur vi kan använda wget för att ladda ner saker från nätet. Den grundläggande syntaxen för nedladdning med wget är följande:
wget [option]… [URL]…
Detta kommando laddar ner wget-handboken till din lokala enhet
wget http://www.gnu.org/software/wget/manual/wget.pdf
Ληνύχ Κρών
Ubuntu kommer med en cron-demon som används för schemaläggning av uppgifter som ska utföras vid en viss tidpunkt. Med Crontab kan du ange åtgärder och tider som de ska utföras. Så här planerar du normalt en uppgift med kommandoradsverktyget.
Öppna ett terminalfönster och ange crontab -e.
Var och en av sektionerna i en crontab är åtskild av ett mellanslag, med det sista avsnittet som har ett eller flera mellanslag. En cron-post består av minut (0-59), timme (0-23, 0 = midnatt), dag (1-31), månad (1-12), vardag (0-6, 0 = söndag), kommando. Den tredje posten i ovanstående crontab laddar ner wget.pdf klockan 2. Den första posten (0) och den andra posten (2) betyder 2:00. Den tredje till den femte posten (*) betyder vilken tid på dagen, månaden eller veckan som helst. Den sista posten är wget-kommandot för att ladda ner wget.pdf från den angivna URL: n.
Det är grundläggande på wget och hur Cron fungerar. Låt oss ta en plundring på ett verkligt exempel på hur man planerar en nedladdning.
Schemaläggning Ladda ner
Vi kommer att ladda ner Firefox 3.6 klockan 02.00. Eftersom vår ISP bara ger en begränsad mängd data måste vi stoppa nedladdningen klockan 08.00. Så här ser installationen ut.
Ignorera de två första posterna i ovanstående crontab. Det tredje och fjärde kommandot är de enda två kommandona som du behöver. Det tredje kommandot ställer in en uppgift som hämtar Firefox klockan 2:
[code]
0 2 * * * wget -c http://download.mozilla.org/?product=firefox-3.6.6&os=win&lang=en-GB
[/code]
Alternativen -c anger att wget ska återuppta den befintliga nedladdningen om den inte har slutförts.
Det fjärde kommandot stoppar wget klockan 8. 'Killall' är ett unix-kommando som dödar processer med namn.
[code]
0 8 * * * killall wget
[/code]
Killall-wget säger till Ubuntu att stoppa wget från att ladda ner filen klockan 8.
Andra användbara wget-kommandon
1. Ange katalogen för att ladda ner en fil
[code]
wget –output-document = / home / zainul / Downloads / wget manual.pdf http://www.gnu.org/software/wget/manual/wget.pdf
[/code]
med alternativet - utdata-dokument kan du ange katalogen och namnet på filen som du laddar ner
2. Nedladdning av en webbplats
wget kan också ladda ner en webbplats.
[code]
wget -m http://www.google.com/profiles/zainul.franciscus
[/code]
Ovanstående kommando laddar ner hela min webbsida för google-profilen. Alternativet '-m' berättar för wget att ladda ner en 'spegelbild' av den angivna webbadressen.
Ett annat viktigt alternativ är att berätta för wget hur många länkar den ska följa när den laddar ner en webbplats.
[code]
wget -r -l1 http://www.google.com/profiles/zainul.franciscus
[/code]
Ovanstående wget-kommando använder två alternativ. Det första alternativet '-r' berättar för wget att ladda ner den angivna webbplatsen rekursivt. Det andra alternativet '-l1' säger till wget att endast hämta den första nivån på länkar från den angivna webbplatsen. Vi kan ställa in upp till tre nivåer '-l2' och '-l3'.
3. Ignorerar robotinmatning
Webbmästaren underhåller en textfil som heter Robot.txt. ”Robot.txt” upprätthåller en lista över webbadresser som en webbsökare som wget inte ska genomsöka. Vi kan säga till wget att ignorera alternativet 'Robot.txt' med '-erobots = av'. Följande kommando säger till wget att ladda ner den första sidan i min google-profil och ignorera ”Robot.txt.
[code]
wget -erobots = av http://www.google.com/profiles/zainul.franciscus
[/code]
Ett annat användbart alternativ är -U. Detta alternativ maskerar wget som en webbläsare. Observera att maskering av en applikation som en annan applikation kan bryta mot en webbtjänstleverantörs villkor och tjänst.
[code]
wget -erobots = av -U Mozilla http://www.google.com/profiles/zainul.franciscus
[/code]
Slutsats
Wget är ett mycket gammalt men ändå hackbart GNU-programvarupaket som vi kan använda för att ladda ner filer. Wget är ett interaktivt kommandoradsverktyg vilket innebär att vi kan låta det köras på vår dator i bakgrunden utan att behöva starta något program. Kolla in wget-mansidan
[code]
$ man wget
[/code]
för att förstå andra alternativ som vi kan använda med wget.
Länkar
Wget Manual
Hur man kombinerar två nedladdade filer när wget misslyckas halvvägs
Linux QuickTip: Nedladdning och tar bort tarering i ett steg