Vi elsker alle at downloade ting fra internettet, og der er masser af fantastiske downloadmanagerværktøjer, som vi kan bruge til at planlægge vores downloads. Det kan bare være lettere at bruge en downloadmanager, men der er ingen skade i at udforske de værktøjer, der allerede følger med vores Ubuntu og udnytte den fuldt ud.
I denne artikel viser vi dig en indbygget software i Ubuntu, som vi kan bruge til at downloade ting fra internettet ved hjælp af wget . Oven i det viser vi dig, hvordan du planlægger download ved hjælp af Cron.
Download ved hjælp af Wget
Wget er en gratis softwarepakke til hentning af filer ved hjælp af HTTP, HTTPS og FTP, de mest udbredte internetprotokoller. Det er et ikke-interaktivt kommandolinjeværktøj, så det kan let kaldes fra scripts, cron-job, terminaler uden X-Windows-support osv.
Åbn din terminal, og lad os undersøge, hvordan vi kan bruge wget til at downloade ting fra nettet. Den grundlæggende syntaks ved download med wget er følgende:
wget [option]… [URL]…
Denne kommando downloader wget-manualen til dit lokale drev
wget http://www.gnu.org/software/wget/manual/wget.pdf
Ληνύχ Κρών
Ubuntu leveres med en cron-dæmon, der bruges til planlægning af opgaver, der skal udføres på et bestemt tidspunkt. Crontab giver dig mulighed for at specificere handlinger og tidspunkter, som de skal udføres. Sådan planlægger du normalt en opgave ved hjælp af kommandolinjeværktøjet.
Åbn et terminalvindue, og indtast crontab -e.
Hver af sektionerne i en crontab er adskilt af et mellemrum, hvor den sidste sektion har et eller flere mellemrum i sig. En cron-indgang består af minut (0-59), time (0-23, 0 = midnat), dag (1-31), måned (1-12), hverdag (0-6, 0 = søndag), kommando. Den tredje post i ovenstående crontab downloader wget.pdf kl. Den første post (0) og den anden post (2) betyder 2:00. Den tredje til den femte post (*) betyder ethvert tidspunkt på dagen, måneden eller ugen. Den sidste post er wget-kommandoen for at downloade wget.pdf fra den angivne URL.
Det er grundlæggende på wget, og hvordan Cron fungerer. Lad os tage en plyndring på et eksempel på det virkelige liv om, hvordan man planlægger en download.
Planlægning Download
Vi downloader Firefox 3.6 kl. 02.00. Da vores internetudbyder kun giver en begrænset mængde data, skal vi stoppe downloadet kl. Sådan ser opsætningen ud.
Ignorer de to første poster i ovenstående crontab. Den tredje og fjerde kommando er de eneste 2 kommandoer, du har brug for. Den tredje kommando opsætter en opgave, der downloader Firefox kl. 2:
[code]
0 2 * * * wget -c http://download.mozilla.org/?product=firefox-3.6.6&os=win&lang=da-DK
[/code]
Indstillingerne -c angiver, at wget skal genoptage den eksisterende download, hvis den ikke er afsluttet.
Den fjerde kommando stopper wget kl. 8 om morgenen. 'Killall' er en unix-kommando, der dræber processer ved navn.
[code]
0 8 * * * killall wget
[/code]
Killall-wget fortæller Ubuntu at stoppe wget i at downloade filen kl. 8 om morgenen.
Andre nyttige wget-kommandoer
1. Angivelse af det bibliotek, der skal downloade en fil
[code]
wget –output-document = / home / zainul / Downloads / wget manual.pdf http://www.gnu.org/software/wget/manual/wget.pdf
[/code]
indstillingen –output-dokument giver dig mulighed for at angive biblioteket og navnet på den fil, du downloader
2. Download af et websted
wget er også i stand til at downloade et websted.
[code]
wget -m http://www.google.com/profiles/zainul.franciscus
[/code]
Ovenstående kommando downloader hele min google-profilwebside. Indstillingen '-m' fortæller wget at downloade et 'spejlbillede' af den angivne URL.
En anden vigtig mulighed er at fortælle wget, hvor mange links der skal følges, når den downloader et websted.
[code]
wget -r -l1 http://www.google.com/profiles/zainul.franciscus
[/code]
Ovenstående wget-kommando bruger to muligheder. Den første mulighed '-r' fortæller wget at downloade det angivne websted rekursivt. Den anden mulighed '-l1' fortæller wget at kun hente det første niveau af links fra det angivne websted. Vi kan indstille op til tre niveauer '-l2' og '-l3'.
3. Ignorerer adgang til robot
Webmaster vedligeholder en tekstfil kaldet Robot.txt. 'Robot.txt' opretholder en liste over URL, som en webside-webcrawler, såsom wget, ikke bør gennemgå. Vi kan fortælle wget at ignorere 'Robot.txt' med '-erobots = off'. Den følgende kommando fortæller wget at downloade den første side af min google-profil og ignorere 'Robot.txt.
[code]
wget -erobots = fra http://www.google.com/profiles/zainul.franciscus
[/code]
En anden nyttig mulighed er -U. Denne mulighed maskerer wget som en browser. Bemærk, at maskering af en applikation som en anden applikation kan krænke en webserviceleverandørs vilkår og service.
[code]
wget -erobots = fra -U Mozilla http://www.google.com/profiles/zainul.franciscus
[/code]
Konklusion
Wget er en meget gammel skole, men alligevel hackbar GNU-softwarepakke, som vi kan bruge til at downloade filer. Wget er et interaktivt kommandolinjeværktøj, som betyder, at vi kan lade det køre på vores computer i baggrunden uden at skulle starte nogen applikation. Tjek wget-mandsiden
[code]
$ mand wget
[/code]
for at forstå andre muligheder, som vi kan bruge med wget.
Links
Wget Manual
Sådan kombineres to downloadede filer, når wget mislykkes halvvejs
Linux QuickTip: Download og fjern tarring i et trin