Co je to Web Crawler, a jak to funguje?

Jul 9, 2025
Obecný
Enzozo / Shutterstock

Už jste někdy hledal něco na Google a přemýšlel, „Jak to víte, kde hledat?“ Odpověď je „web roboti“, které hledají na internetu, a index tak, že můžete najít věci snadno online. Vysvětlíme.

Vyhledávače a Crawlers

Když se vyhledávat pomocí klíčového slova na vyhledávače jako Google nebo Bing. Se sifts místě přes biliony stránek pro generování seznamu výsledků týkajících se tohoto pojmu. Jak přesně se tyto vyhledávače mají všechny tyto stránky ze spisu, víte, jak se dívat na ně a vytvářet tyto výsledky během několika vteřin?

Odpovědí je prohledávače, také známý jako pavouci. Toto jsou automatické programy (často nazývané „roboti“ nebo „roboty“), že „plazit“ nebo procházení na webu tak, aby mohly být přidány do vyhledávače. Tito roboti index webové stránky, vytvořit seznam stránek, které nakonec se objevují ve výsledcích vyhledávání.

Roboti také vytvářet a ukládat kopie těchto stránek v databázi motoru, který umožňuje, aby se vyhledávání téměř okamžitě. To je také důvod, proč vyhledávače často obsahují mezipaměti verze stránek ve svých databázích.

PŘÍBUZNÝ: Jak získat přístup k webové stránce, když je to Down

Site Mapy a Selection

Griboedov / Shutterstock

Tak, jak se roboti vybrat, které stránky se plazit? No, z nichž nejčastější scénář je, že majitelé webových stránek chtějí vyhledávače procházet své stránky. Mohou dosáhnout tím, že požaduje Google, Bing, Yahoo, nebo jiný vyhledávač k indexu své stránky. Tento postup se liší od motoru k motoru. Také vyhledávače často vybrat populární a dobře propojené webové stránky k procházení tím, že sleduje, kolikrát, že URL je propojen na jiných veřejných místech.

Vlastníci webových stránek mohou používat určité procesy pomáhat vyhledávače index svých webových stránkách, jako je například
nahrání mapa stránek. Jedná se o soubor, který obsahuje všechny odkazy a stránky, které jsou součástí vašich webových stránkách. Je běžně používá k označení, jaké stránky byste chtěli indexovány.

Jakmile vyhledávače již lezl webových stránek najednou, budou automaticky procházet tento web znovu. Frekvence se liší v závislosti na tom, jak populární webové stránky je mimo jiné metriky. Proto se majitelé stránek často udržovat aktualizované mapy stránek, aby motory vědět, jaké nové stránky do indexu.

Roboti a Zdvořilost faktor

Devenorr / Shutterstock

Co když webové stránky neudělaný chcete některých nebo všech jejích stránkách se objeví na vyhledávače? Například, možná nebudete chtít, aby lidé hledat stránky pouze pro členy nebo vidět váš 404 chybová stránka . To je místo, kde seznam vyloučení kraul, také známý jako robots.txt, vstoupí do hry. Jedná se o jednoduchý textový soubor, který diktuje na pásech, které webové stránky vyjmout z indexování.

Dalším důvodem, proč robots.txt Důležité je, že webové prohledávače mohou mít významný vliv na výkon webu. Vzhledem k tomu, roboti jsou v podstatě stahovat všechny stránky na svých webových stránkách, které spotřebovávají zdroje a může způsobit zpomalení. Dorazí v nepředvídatelných časech a bez schválení. Pokud nepotřebujete vaše stránky opakovaně indexovány, pak zastavení roboti by mohla pomoci snížit některé ze svých webových stránek zatížení. Naštěstí většina roboti zastavení procházení určitých stránek založených na pravidlech jejich vlastníka.

metadata Magie

Pod URL a titulek každého výsledku vyhledávání v Google, najdete krátký popis stránky. Tyto popisy jsou nazývané úryvky. Můžete si všimnout, že fragment stránky v Googlu nemusí vždy vyrovnaná se skutečným obsahem internetových stránek. To je proto, že mnoho internetových stránek mají něco, co nazývá „ meta tagy „, Které jsou vlastní popisy, které majitelé stránek přidat do svých stránek.

Majitelé stránek často přijít s lákavou popisy metadat písemné, aby chcete kliknout na internetových stránkách. Google také uvádí další metainformace, jako jsou ceny a dostupnosti zásob. To je užitečné zejména pro ty, běh e-commerce webové stránky.

Vaše Vyhledávání

Hledání webu je nezbytnou součástí používání internetu. Hledání webu je skvělý způsob, jak objevit nové webové stránky, obchody, komunity a zájmy. Každý den navštěvují webové prohlašovače miliony stránek a přidají je do vyhledávačů. Zatímco Crawlers mají nějaké downsides, stejně jako zaujmout zdroje stránek, jsou neocenitelné pro majitele stránek a návštěvníků.

PŘÍBUZNÝ: Jak odstranit posledních 15 minut historie vyhledávání Google


Obecný - Nejoblíbenější články

Jak důležitý je zdroj napájení (PSU) při budování PC?

Obecný Jan 20, 2025

md-obrázky / shutterstock.com Napájení (PSU) je kritickou součástí jakéhokoliv PC. Síla všechny komponenty ve vašem PC a špatný nebo vadný může ..


Co dělat „WYD“ a „HYD“ Mean, a jak je můžete užívat?

Obecný Jan 17, 2025

Vann Vicente. Chystáte se zahájit konverzaci s někým? Zkratky SDM a HYD jsou nejkratší cesty pro spuštění back-a-dále s přítelem. Zjistit, co znamenají, a ..


Co je to deska?

Obecný Feb 23, 2025

Maryia_k / Shutterstock.com. Základní deska je tam, kde to všechno začíná pro PC. Je to složka, která je základem všeho. Existuje tolik různých ana..


Co je Smart Home Hub?

Obecný May 31, 2025

Aeotec Začínáme s chytrý domov Technologie je skličující. Existuje mnoho různých cest, jak můžete jít dolů. Běžnou součástí inteligentních d..


Co je OLED?

Obecný Jul 9, 2025

UGIS RIBA / Shutterstock.com Pokud si myslíte, že si koupíte novou televizi nebo smartphonu, můžete vidět termín "oled" používaný k popisu typu displ..


Jak přidat kontakt na domovskou obrazovku v systému Android

Obecný Aug 27, 2025

Volání a SMS lidí je pravděpodobně velká část toho, co děláte ve svém telefonu Android. Proč to neudělat co nejjednodušší dosáhnout oblíbených? Ukážeme vám, jak př..


Jak používat „ano“ Command na Mac

Obecný Aug 20, 2025

Garagestock / Shutterstock.com. . \ T Ano Příkaz byla poprvé zahrnuta ve vydání BSD 4.0 v roce 1993, a to ještě existuje v moderních operač..


Evropská unie chce Universal Mobile Charger, ale Apple nemá

Obecný Aug 13, 2025

Zoomik / Shutterstock.com. Podle zprávy Reuters. EU navrhuje právní předpisy, že všechna zařízení mají společnou mobilní nabíječku v z..


Kategorie