Me kaikki rakastamme ladata tavaraa Internetistä, ja on olemassa kasa upeita lataustenhallintatyökaluja, joita voimme käyttää latausten ajoitukseen. Latauksenhallinnan käyttäminen voi olla vain helpompaa, mutta ei ole haittaa tutkia Ubuntun mukana jo olevia työkaluja ja käyttää sitä täysimääräisesti.
Tässä artikkelissa näytämme sisäänrakennetun ohjelmiston Ubuntussa, jota voimme käyttää tavaroiden lataamiseen Internetistä wget . Tämän lisäksi näytämme sinulle, kuinka ajoittaa lataus Cronin avulla.
Lataa Wgetin avulla
Wget on ilmainen ohjelmistopaketti tiedostojen hakemiseen käyttämällä HTTP: tä, HTTPS: ää ja FTP: tä, yleisimmin käytettyjä Internet-protokollia. Se on ei-interaktiivinen komentorivityökalu, joten sitä voidaan helposti kutsua komentosarjoista, cron-töistä, päätelaitteista ilman X-Windows-tukea jne.
Avaa päätelaite ja tutkitaan, miten voimme käyttää wgetiä lataamaan tavaroita verkosta. Wgetin kanssa lataamisen perussyntaksi on seuraava:
wget [option]… [URL]…
Tämä komento lataa wget-käyttöoppaan paikalliseen asemaan
wget http://www.gnu.org/software/wget/manual/wget.pdf
Ληνύχ Κρών
Ubuntun mukana tulee cron-daemon, jota käytetään tiettyyn aikaan suoritettavien tehtävien ajoitukseen. Crontabin avulla voit määrittää toiminnot ja ajat, jotka ne tulisi suorittaa. Näin ajoit normaalisti tehtävän komentorivityökalulla.
Avaa pääteikkuna ja kirjoita crontab -e.
Jokainen ristikkäosan osa on erotettu välilyönnillä, ja viimeisessä osassa on yksi tai useampi välilyönti. Cron-merkintä koostuu minuutista (0-59), tunnista (0-23, 0 = keskiyö), päivästä (1-31), kuukaudesta (1-12), arkipäivästä (0-6, 0 = sunnuntai), komennosta. Edellä olevan crontabin kolmas merkintä lataa wget.pdf kello 2 aamulla. Ensimmäinen merkintä (0) ja toinen merkintä (2) tarkoittaa 2:00. Kolmas - viides merkintä (*) tarkoittaa mitä tahansa kellonaikaa, kuukautta tai viikkoa. Viimeinen merkintä on wget-komento ladata wget.pdf määritetystä URL-osoitteesta.
Tämä on wgetin perus- ja miten Cron toimii. Otetaan ryöstö tosielämässä esimerkki lataamisen ajoituksesta.
Aikataulu Lataa
Aiomme ladata Firefox 3.6: n klo 2.00, koska Internet-palveluntarjoajamme antaa vain rajoitetun määrän tietoa, meidän on lopetettava lataus klo 8.00. Näin asennus näyttää.
Ohita kaksi ensimmäistä merkintää yllä olevasta sivunäytöstä. Kolmas ja neljäs komento ovat ainoat tarvitsemasi komennot. Kolmas komento määrittää tehtävän, joka lataa Firefoxin kello 2.00:
[code]
0 2 * * * wget -c http://download.mozilla.org/?product=firefox-3.6.6&os=win&lang=fi-FI
[/code]
-C-vaihtoehdot tarkoittavat, että wgetin pitäisi jatkaa olemassa olevaa latausta, ellei sitä ole vielä saatu päätökseen.
Neljäs komento lopettaa wgetin klo 8. Killall on unix-komento, joka tappaa prosessit nimen mukaan.
[code]
0 8 * * * killall wget
[/code]
Killall wget käskee Ubuntua lopettamaan wgetin lataamasta tiedostoa kello 8.00.
Muita hyödyllisiä wget-komentoja
1. Määritä hakemisto tiedoston lataamiseksi
[code]
wget –output-document = / home / zainul / Lataukset / wget manual.pdf http://www.gnu.org/software/wget/manual/wget.pdf
[/code]
vaihtoehdon –output-document avulla voit määrittää hakemiston ja ladattavan tiedoston nimen
2. Verkkosivuston lataaminen
wget pystyy myös lataamaan verkkosivuston.
[code]
wget -m http://www.google.com/profiles/zainul.franciscus
[/code]
Yllä oleva komento lataa koko Google-profiilisivuni. Vaihtoehto '-m käskee wgetä lataamaan määritetyn URL-osoitteen peilikuvan.
Toinen tärkeä vaihtoehto on kertoa wgetille, kuinka monta linkkiä sen on seurattava ladattaessa verkkosivustoa.
[code]
wget -r -l1 http://www.google.com/profiles/zainul.franciscus
[/code]
Yllä oleva wget-komento käyttää kahta vaihtoehtoa. Ensimmäinen vaihtoehto '-r' käskee wgetä lataamaan määritetyn verkkosivuston rekursiivisesti. Toinen vaihtoehto ”-l1” kertoo wgetille, että se saa vain ensimmäisen tason linkit kyseiseltä verkkosivustolta. Voimme asettaa jopa kolme tasoa ‘-l2’ ja ’-l3’.
3. Ohitetaan robotin pääsy
Web-päällikkö ylläpitää Robot.txt-nimistä tekstitiedostoa. Robot.txt-tiedosto ylläpitää luetteloa URL-osoitteista, joita verkkosivun indeksoijan, kuten wgetin, ei pitäisi indeksoida. Voimme kertoa wgetille, että se jättää huomiotta Robot.txt-tiedoston ja -erobotit = pois -vaihtoehdon. Seuraava komento kehottaa wgetä lataamaan Google-profiilini ensimmäisen sivun ja jättämään huomioimatta Robot.txt-tiedoston.
[code]
wget -erobots = pois http://www.google.com/profiles/zainul.franciscus
[/code]
Toinen hyödyllinen vaihtoehto on -U. Tämä vaihtoehto peittää wgetin selaimena. Ota huomioon, että sovelluksen peittäminen toisena sovelluksena voi rikkoa verkkopalveluntarjoajan termiä ja palvelua.
[code]
wget -erobots = pois käytöstä -U Mozilla http://www.google.com/profiles/zainul.franciscus
[/code]
Johtopäätös
Wget on erittäin vanha koulu, mutta hakkeroitu GNU-ohjelmistopaketti, jota voimme käyttää tiedostojen lataamiseen. Wget on interaktiivinen komentorivityökalu, mikä tarkoittaa, että voimme antaa sen toimia tietokoneellamme taustalla käynnistämättä mitään sovellusta. Katso wget-man -sivu
[code]
$ mies wget
[/code]
ymmärtää muita vaihtoehtoja, joita voimme käyttää wgetin kanssa.
Linkit
Wget-käsikirja
Kuinka yhdistää kaksi ladattua tiedostoa, kun wget epäonnistuu puolivälissä
Linuxin pikavinkki: lataaminen ja estäminen yhdellä kertaa