Når du skriver en adresse i din webbrowser, sker der mange ting bag kulisserne. Og det meste bestemmes af de forskellige dele af den URL, du skrev. Lad os se nærmere på.
En URL kan bestå af en masse forskellige dele. Der er et værtsnavn, der kortlægges til en IP-adresse for en bestemt ressource på internettet og en række yderligere oplysninger, der fortæller din browser og serveren, hvordan man håndterer ting. Du kan tænke på en IP-adresse som at være noget som et telefonnummer. Et værtsnavn er som navnet på en person, hvis telefonnummer du vil slå op. Og en standard kaldet Domain Name System (DNS) fungerer i baggrunden som en telefonbog og oversætter de mere menneskelige venlige værtsnavne til de IP-adresser, som netværk bruger til at dirigere trafik.
Når vi holder denne analogi i tankerne, skal vi se på strukturen på en URL og hvordan det fungerer for at bringe dig, hvor du vil hen.
Hvordan en URL er struktureret
Strukturen af en URL blev først defineret af Sir Tim Berners-Lee - den fyr, der oprettede Internettet og den første webbrowser - i 1994. URL'er kombinerer i det væsentlige ideen om domænenavne med ideen om at bruge en filsti til at identificere en bestemt mappe og filstruktur. Så det ligner at bruge en sti som C: \ Documents \ Personal \ myfile.txt i Windows, men med nogle ekstra ting i starten for at hjælpe med at finde den rigtige server på internettet, hvor den sti findes, og den protokol, der bruges til at få adgang til Information.
En URL består af flere forskellige dele. Tag for eksempel en grundlæggende URL som den, der er vist på billedet nedenfor.
Denne enkle URL er opdelt i to hovedkomponenter: ordningen og autoriteten.
Ordning
Mange mennesker betragter en URL som bare en webadresse, men det er ikke helt så simpelt. En webadresse er en URL, men alle URL'er er ikke webadresser. Andre tjenester, du kan få adgang til på Internettet - som FTP - eller endda lokalt - som MAILTO - er også URL'er. Ordningsdelen af en URL (disse bogstaver efterfulgt af et kolon) angiver den protokol, som en app (som din webbrowser) og serveren skal kommunikere med.
Webadresser er den mest almindelige URL, men der er andre. Så du kan muligvis se ordninger som:
- HyperText Transfer Protocol (HTTP): Dette er den underliggende protokol på internettet og bestemmer, hvilke handlinger webservere og browsere skal tage som svar på visse kommandoer.
- HTTP Secure ( HTTPS ) : Dette er en form for HTTP, der fungerer over et sikkert, krypteret lag til sikrere transport af information.
- File Transfer Protocol (FTP): Denne protokol bruges ofte stadig til overførsel af filer over internettet.
I moderne browsere er ordningen ikke teknisk påkrævet som en del af URL'en. Hvis du går ind på et websted som “www.howtogeek.com”, bestemmer din browser automatisk den rigtige protokol, der skal bruges. Nogle andre apps (og protokoller) kræver stadig brug af en ordning.
Myndighed
Autoritetsdelen af en URL (som er forud for to skråstreger) er i sig selv opdelt i en masse dele. Lad os starte med en meget enkel URL - den slags, der fører dig til hjemmesiden på et websted.
I dette enkle eksempel kaldes hele "www.example.com" -delen et værtsnavn, og den løses til en IP-adresse. Du kan også skrive en IP-adresse i din browsers adresselinje i stedet for værtsnavnet, hvis du tilfældigvis kender den.
Men når man analyserer værtsnavnet, hjælper det med at læse det bagud for at forstå, hvad der foregår, så her er disse komponenter:
- Topdomæne: I eksemplet her er "com" det øverste niveau domæne. Disse er det højeste niveau i Domain Name System (DNS) hierarki, der bruges til at oversætte IP-adresser til enkle sprogadresser, der er lettere for os mennesker at huske. Disse topdomæner oprettes og administreres af Internet Corporation for Assigned Names and Numbers (ICANN). De tre mest almindelige topdomæner er .com, .net og .gov. De fleste lande har også deres eget to-bogstaver-topdomæne, så du kan se domæner som .us (USA), .uk (Storbritannien), .ca (Canada) og mange andre. Der er også nogle yderligere topdomæner (som .museum), der er sponsoreret og administreret af private organisationer. Ud over disse er der også nogle generiske topdomæner (som .club, .life og .news).
- Underdomæne: Da DNS er et hierarkisk system, betragtes både "www" og "eksempel" -delene i vores eksempel-URL som underdomæner. "Www" -delen er et underdomæne af topdomænet "com", og "www" -delen er et underdomæne af "eksempel" -domænet. Derfor ser du ofte et firma med et registreret navn som “google.com” opdelt i separate underdomæner som “www.google.com”, “news.google.com”, “mail.google.com” og snart.
Det er det mest grundlæggende eksempel på autoritetsafsnittet i en URL, men ting kan blive mere komplicerede. Der er to andre komponenter, som autoritetsafsnittet kan indeholde:
- Brugerinformation: Myndighedssektionen kan også indeholde et brugernavn og en adgangskode til det websted, du åbner. Det er usædvanligt at se denne struktur i webadresser i dag, men det kan ske. Hvis det findes, kommer brugerinfodelen foran værtsnavnet og efterfølges af et @ -tegn. Så du kan muligvis se noget som “//username:[email protected]”, hvis det indeholder brugeroplysningerne.
- Portnummer: Netværksenheder bruger IP-adresser til at få oplysninger til den rigtige computer på et netværk. Når den trafik ankommer, fortæller et portnummer computeren, hvilken applikation den trafik er beregnet til. Portnummeret er et andet element, som du ikke ofte ser, når du surfer på nettet, men du kan muligvis se det i netværksapps (som spil), der kræver, at du indtaster en URL. Hvis URL'en inkluderer et portnummer, kommer det efter værtsnavnet og indledes med et kolon. Det ville se sådan ud: “//www.example.com:8080.”
Så det er ordningen og autoritetsdelene af en URL, men som du måske har gættet efter at have set på en masse URL'er, mens du surfer på nettet, kan de inkludere endnu flere ting.
Stier, forespørgsler og fragmenter
Der er tre yderligere dele af en URL, som du muligvis ser efter autoritetsdelen: stier, forespørgsler og fragmenter. Sådan fungerer disse.
Sti
Autoritetssektionen i en URL får din browser (eller hvilken som helst app) til den rigtige server på et netværk. Den sti, der følger - som fungerer ligesom en sti i Windows, macOS eller Linux - fører dig til den rigtige mappe eller fil på den server. Stien er forud for en skråstreg, og der er en skråstreg mellem hver bibliotek og underkatalog, som denne:
www.example.com/folder/subfolder/filename.html
Det sidste stykke er navnet på den fil, der åbnes, når du åbner webstedet. Selvom du muligvis ikke ser det i adresselinjen, betyder det ikke, at det ikke er der. Nogle sprog, der bruges til at oprette websider, skjuler det filnavn og den udvidelse, du ser. Dette gør URL'en lettere at huske og skrive og giver den et renere look.
Forespørgsel
Forespørgselsdelen af en URL bruges til at identificere ting, der ikke er en del af en streng stistruktur. Oftest ser du dem bruges, når du foretager en søgning, eller når en webside leverer data gennem en formular. Forespørgselsdelen forud for et spørgsmålstegn og kommer efter stien (eller efter værtsnavnet, hvis en sti ikke er inkluderet).
Som et eksempel kan du tage denne URL, der blev præsenteret, da vi søgte Amazon efter søgeordene "wi-fi extender":
https://www.amazon.com/s/ref=nb_sb_noss_2?url=search-alias%3Daps&field-keywords=wi-fi+extender
Søgningsformularen videregav oplysninger til Amazons søgemaskine. Efter spørgsmålstegnet kan du se, at der er to dele til forespørgslen: en URL til søgningen (det er "url = search-alias% 3Daps & field" -delen) og de nøgleord, vi skrev (det er "nøgleordene = wi-fi + extender ”-del).
Det er et ret simpelt eksempel, og du vil ofte se webadresser med yderligere (og mere komplicerede) variabler. Her er f.eks. URL'en, da vi søgte Google efter søgeordet "howtogeek":
https://www.google.com/search?q=howtogeek&rlz=1C1GCEA_enUS751US751&oq=howtogeek&aqs=chrome..69i57j69i60l4j0.1839j1j4&sourceid=chrome&ie=UTF-8
Som du kan se, er der nogle forskellige oplysninger der. I dette tilfælde kan du se, at der er yderligere oplysninger, der angiver søgesproget, den browser, vi brugte (Chrome) og endda browserens versionsnummer.
Fragment
Den sidste komponent i en URL, som du muligvis ser, kaldes et fragment. Fragmentet er forud for et hash-mærke (#) og bruges til at angive en bestemt placering på en webside. Ved kodning af en webside kan designere oprette ankre til specifik tekst som overskrifter. Når det rigtige fragment bruges i slutningen af en URL, indlæser din browser siden og springer derefter til det anker. Ankre og URL'er med fragmenter bruges ofte til at oprette indholdstabeller på websider for at gøre det lettere at navigere.
Her er et eksempel. Wikipedia's side på Renæssance er et ganske langt dokument, og det er opdelt i ca. 11 sektioner, som hver har flere underafsnit. Men hver overskrift på siden har et anker inkluderet, og en indholdsfortegnelse øverst i artiklen indeholder links, der giver dig mulighed for at springe til de forskellige sektioner. Disse links fungerer ved at inkludere fragmenter.
Du kan også bruge disse fragmenter direkte i din adresselinje eller som links, der kan deles. Sig for eksempel, at du ville vise nogen det afsnit på den side, der dækker Rusland. Du kan bare sende dem dette link:
https://en.wikipedia.org/wiki/Renaissance#Russia
Den "#Russia" del i slutningen af URL'en springer dem direkte til det afsnit efter indlæsning af siden.
Så der har du det - mere end du sandsynligvis nogensinde ville vide om, hvordan webadresser fungerer.
Billedkredit: Pawel Horazy / Shutterstock