Mindannyian szeretünk letölteni cuccokat az internetről, és rengeteg remek letöltéskezelő eszköz található, amelyek segítségével ütemezhetjük a letöltéseket. Lehet, hogy egyszerűbb a letöltéskezelő használata, de nem árt feltárni azokat az eszközöket, amelyek már az Ubuntunak vannak, és teljes mértékben kihasználni.
Ebben a cikkben egy beépített szoftvert mutatunk be az Ubuntuban, amellyel az internetről tölthetünk le tartalmakat wget . Ezen felül megmutatjuk, hogyan kell ütemezni a letöltést a Cron segítségével.
Letöltés a Wget használatával
A Wget egy ingyenes szoftvercsomag fájlok letöltésére HTTP, HTTPS és FTP, a legszélesebb körben használt internetes protokollok használatával. Ez egy nem interaktív parancssori eszköz, így könnyen meghívható parancsfájlokból, cron-feladatokból, X-Windows támogatás nélküli terminálokból stb.
Nyissa meg a terminált, és vizsgáljuk meg, hogyan használhatjuk a wget-et a netről a cuccok letöltésére. A wget segítségével történő letöltés alapvető szintaxisa a következő:
wget [option]… [URL]…
Ez a parancs letölti a wget kézikönyvet a helyi meghajtóra
wget http://www.gnu.org/software/wget/manual/wget.pdf
Ληνύχ Κρών
Az Ubuntu egy cron démonhoz tartozik, amelyet egy bizonyos időpontban végrehajtandó feladatok ütemezéséhez használnak. A Crontab lehetővé teszi a végrehajtandó műveletek és idők megadását. Így rendesen ütemezne egy feladatot a parancssori eszközzel.
Nyisson meg egy terminálablakot, és írja be a crontab -e parancsot.
A crontab egyes szakaszait szóköz választja el, az utolsó szakaszban pedig egy vagy több szóköz van. A cron bejegyzés perc (0-59), óra (0-23, 0 = éjfél), nap (1-31), hónap (1-12), hétköznap (0-6, 0 = vasárnap), parancsból áll. A fenti crontab harmadik bejegyzése hajnali 2 órakor tölti le a wget.pdf fájlt. Az első bejegyzés (0) és a második bejegyzés (2) 2:00 órát jelent. A harmadik-ötödik bejegyzés (*) a nap bármely napját, hónapját vagy hetét jelenti. Az utolsó bejegyzés a wget parancs a wget.pdf letöltésére a megadott URL-ről.
Ez az alap a wget-en és a Cron működése. Vegyünk egy zsákmányt a való életben, hogy hogyan ütemezhetjük a letöltést.
Letöltés ütemezése
Hajnali 2 órakor le fogjuk tölteni a Firefox 3.6 verziót. Mivel az internetszolgáltatónk csak korlátozott mennyiségű adatot ad meg, 8 órakor le kell állítanunk a letöltést. Így néz ki a beállítás.
Hagyja figyelmen kívül a fenti crontab első 2 bejegyzését. A harmadik és a negyedik parancs az egyetlen 2 parancs, amire szüksége van. A harmadik parancs beállít egy feladatot, amely 2 órakor tölti le a Firefoxot:
[code]
0 2 * * * wget -c http://download.mozilla.org/?product=firefox-3.6.6&os=win&lang=en-HU
[/code]
A -c opciók azt jelzik, hogy a wget-nek folytatnia kell a meglévő letöltést, ha az még nem fejeződött be.
A negyedik parancs reggel 8-kor leállítja a wget-et. A „Killall” egy unix parancs, amely név szerint megöli a folyamatokat.
[code]
0 8 * * * killall wget
[/code]
A killall wget utasítja az Ubuntut, hogy reggel 8-kor állítsa le a wget-t a fájl letöltésétől.
Egyéb hasznos wget parancsok
1. Adja meg a könyvtárat egy fájl letöltéséhez
[code]
wget –output-document = / home / zainul / Letöltések / wget manual.pdf http://www.gnu.org/software/wget/manual/wget.pdf
[/code]
az –output-document opcióval megadhatja a letöltött fájl könyvtárát és nevét
2. Weboldal letöltése
A wget képes weboldalak letöltésére is.
[code]
wget -m http://www.google.com/profiles/zainul.franciscus
[/code]
A fenti parancs letölti a teljes Google-profilom weboldalát. Az ‘-m’ opció azt mondja a wget-nek, hogy töltse le a megadott URL-ből a „tükör” képet.
Egy másik fontos lehetőség az, hogy megmondja a wget-nek, hogy hány linket kell követnie egy weboldal letöltésekor.
[code]
wget -r -l1 http://www.google.com/profiles/zainul.franciscus
[/code]
A fenti wget parancs két lehetőséget használ. Az első „-r” opció arra utasítja a wget, hogy töltse le a megadott weboldalt rekurzív módon. A második „-l1” opció azt mondja a wget-nek, hogy csak az első szintű linkeket szerezze be az adott webhelyről. Legfeljebb három „-l2” és „-l3” szintet állíthatunk be.
3. A robot belépésének figyelmen kívül hagyása
A webmester a Robot.txt nevű szövegfájlt tartja karban. A „Robot.txt” az URL-ek listáját tartja fenn, amelyeket egy weblap-robotnak, például a wget-nek nem szabad feltérképeznie. Azt mondhatjuk a wget-nek, hogy hagyja figyelmen kívül a „Robot.txt” -t az „-erobots = off” opcióval. A következő parancs arra utasítja a wget-t, hogy töltse le a Google-profilom első oldalát, és hagyja figyelmen kívül a ‘Robot.txt fájlt.
[code]
wget -erobots = ki http://www.google.com/profiles/zainul.franciscus
[/code]
Egy másik hasznos lehetőség az -U. Ez az opció böngészőként maszkolja a wget-et. Vegye figyelembe, hogy egy alkalmazás más alkalmazásként való maszkolása megsértheti a webszolgáltató feltételeit és szolgáltatásait.
[code]
wget -erobots = off -U Mozilla http://www.google.com/profiles/zainul.franciscus
[/code]
Következtetés
A Wget egy nagyon régi iskola, mégis feltörhető GNU szoftvercsomag, amellyel fájlokat tölthetünk le. A Wget egy interaktív parancssori eszköz, ami azt jelenti, hogy hagyhatjuk azt a számítógépünkön a háttérben futtatni anélkül, hogy bármilyen alkalmazást el kellene indítanunk. Nézze meg a wget man oldalt
[code]
$ man wget
[/code]
hogy megértsük a wget-lel használható egyéb lehetőségeket.
Linkek
Wget Manual
Hogyan lehet két letöltött fájlt kombinálni, amikor a wget félúton nem működik
Linux gyorstipp: Letöltés és a tárolás megszüntetése egy lépésben