Kiedy wpisujesz adres w przeglądarce internetowej, za kulisami dzieje się wiele rzeczy. Większość z nich zależy od różnych części wpisanego adresu URL. Przyjrzyjmy się bliżej.
Adres URL może składać się z kilku różnych części. Istnieje nazwa hosta, która odwzorowuje adres IP określonego zasobu w internecie oraz kilka dodatkowych informacji, które mówią przeglądarce i serwerowi, jak sobie z tym poradzić. Możesz pomyśleć o adres IP jak numer telefonu. Nazwa hosta jest jak imię i nazwisko osoby, której numer telefonu chcesz sprawdzić. I standard o nazwie System nazw domen (DNS) działa w tle jak książka telefoniczna, tłumacząc bardziej przyjazne dla człowieka nazwy hostów na adresy IP używane przez sieci do kierowania ruchem.
Mając na uwadze tę analogię, przyjrzyjmy się strukturze adresu URL i sposobowi, w jaki prowadzi on Cię tam, gdzie chcesz.
Struktura adresu URL
Struktura adresu URL została po raz pierwszy zdefiniowana przez Sir Tima Bernersa-Lee - człowieka, który stworzył sieć i pierwszą przeglądarkę internetową - w 1994 roku. Adresy URL zasadniczo łączą ideę nazwy domen z myślą o użyciu ścieżki do pliku w celu zidentyfikowania określonego folderu i struktury plików. Jest to więc podobne do korzystania ze ścieżki takiej jak C: \ Documents \ Personal \ myfile.txt w systemie Windows, ale z kilkoma dodatkowymi informacjami na początku, aby pomóc znaleźć właściwy serwer w Internecie, gdzie ta ścieżka istnieje i protokół używany do uzyskania dostępu do Informacja.
Adres URL składa się z kilku różnych części. Weźmy na przykład podstawowy adres URL, taki jak na poniższym obrazku.
Ten prosty adres URL jest podzielony na dwa główne elementy: schemat i uprawnienia.
Schemat
Wiele osób myśli o adresie URL jako o adresie internetowym, ale nie jest to takie proste. Adres internetowy to adres URL, ale wszystkie adresy URL nie są adresami internetowymi. Inne usługi, do których można uzyskać dostęp w Internecie - takie jak FTP - a nawet lokalnie - jak MAILTO - również są adresami URL. Część schematu adresu URL (litery zakończone dwukropkiem) oznaczają protokół, z którym aplikacja (np. Przeglądarka internetowa) powinna się komunikować i serwer.
Adresy internetowe to najpopularniejsze adresy URL, ale są też inne. Możesz więc zobaczyć schematy takie jak:
- HyperText Transfer Protocol (HTTP): jest to podstawowy protokół sieciowy, który określa, jakie działania powinny podejmować serwery i przeglądarki internetowe w odpowiedzi na określone polecenia.
- Bezpieczny HTTP ( HTTPS ) : Jest to forma protokołu HTTP, która działa w bezpiecznej, zaszyfrowanej warstwie w celu bezpieczniejszego przesyłania informacji.
- Protokół przesyłania plików (FTP): Ten protokół jest często nadal używany do przesyłania plików przez Internet.
W nowoczesnych przeglądarkach schemat nie jest technicznie wymagany jako część adresu URL. Jeśli wejdziesz na stronę internetową, taką jak „www.howtogeek.com”, Twoja przeglądarka automatycznie określi właściwy protokół. Mimo to niektóre inne aplikacje (i protokoły) wymagają użycia schematu.
Autorytet
Część adresu URL z uprawnieniami (która jest poprzedzona dwoma ukośnikami) jest sama podzielona na kilka części. Zacznijmy od bardzo prostego adresu URL - takiego, który prowadzi do strony głównej witryny internetowej.
W tym prostym przykładzie cała część „www.example.com” nazywana jest nazwą hosta i jest tłumaczona na adres IP. Możesz także wpisać adres IP w pasku adresu przeglądarki zamiast nazwy hosta, jeśli go znasz.
Ale podczas analizowania nazwy hosta warto przeczytać ją wstecz, aby zrozumieć, co się dzieje, więc oto te składniki:
- Domena najwyższego poziomu: W tym przykładzie „com” to domena najwyższego poziomu. To najwyższy poziom w System nazw domen Hierarchia (DNS) używana do tłumaczenia adresów IP na proste adresy językowe, które są łatwiejsze do zapamiętania przez ludzi. Te domeny najwyższego poziomu są tworzone i zarządzane przez Internet Corporation for Assigned Names and Numbers (ICANN). Trzy najpopularniejsze domeny najwyższego poziomu to .com, .net i .gov. Większość krajów ma również własne dwuliterowe domeny najwyższego poziomu, więc zobaczysz takie domeny, jak .us (Stany Zjednoczone), .uk (Wielka Brytania), .ca (Kanada) i wiele innych. Istnieją również dodatkowe domeny najwyższego poziomu (takie jak .museum), które są sponsorowane i zarządzane przez organizacje prywatne. Oprócz tego istnieją również ogólne domeny najwyższego poziomu (takie jak .club, .life i .news).
- Subdomena: Ponieważ DNS jest systemem hierarchicznym, zarówno część „www”, jak i „przykład” naszego przykładowego adresu URL są uznawane za subdomeny. Część „www” to subdomena domeny najwyższego poziomu „com”, a część „www” to subdomena domeny „przykładowej”. Dlatego często firma o zarejestrowanej nazwie, np. „Google.com”, jest podzielona na oddzielne subdomeny, takie jak „www.google.com”, „news.google.com”, „mail.google.com” i wkrótce.
To najbardziej podstawowy przykład sekcji dotyczącej uprawnień w adresie URL, ale sprawy mogą się jeszcze bardziej skomplikować. Istnieją dwa inne komponenty, które może zawierać sekcja dotycząca uprawnień:
- Informacje o użytkowniku: Sekcja uprawnień może również zawierać nazwę użytkownika i hasło do witryny, do której uzyskujesz dostęp. Obecnie rzadko spotyka się taką strukturę w adresach URL, ale może się zdarzyć. Jeśli jest obecny, część informacji o użytkowniku znajduje się przed nazwą hosta i następuje po niej znak @. Możesz więc zobaczyć coś takiego, jak „// nazwa_użytkownika: hasł[email protected]”, jeśli zawiera informacje o użytkowniku.
- Numer portu: Urządzenia sieciowe używają adresów IP do pobierania informacji do właściwego komputera w sieci. Kiedy przychodzi ten ruch, numer portu informuje komputer o aplikacji, dla której ten ruch jest przeznaczony. Numer portu to kolejny element, którego nie będziesz często widzieć podczas przeglądania internetu, ale możesz go zobaczyć w aplikacjach sieciowych (takich jak gry), które wymagają podania adresu URL. Jeśli adres URL zawiera numer portu, następuje po nazwie hosta i jest poprzedzony dwukropkiem. Wyglądałoby to mniej więcej tak: „//www.example.com:8080”.
To jest schemat i części adresu URL, ale jak można się domyślić, patrząc na wiele adresów URL podczas przeglądania sieci, mogą one zawierać jeszcze więcej elementów.
Ścieżki, zapytania i fragmenty
Istnieją trzy dodatkowe części adresu URL, które mogą być widoczne po części dotyczącej uprawnień: ścieżki, zapytania i fragmenty. Oto jak to działa.
Ścieżka
Sekcja uprawnień adresu URL przenosi przeglądarkę (lub jakąkolwiek aplikację) na właściwy serwer w sieci. Ścieżka, która następuje - która działa tak samo jak ścieżka w systemie Windows, macOS lub Linux - prowadzi do właściwego folderu lub pliku na tym serwerze. Ścieżka jest poprzedzona ukośnikiem, a między każdym katalogiem i podkatalogiem znajduje się ukośnik, na przykład:
www.example.com/folder/subfolder/filename.html
Ostatnia część to nazwa pliku, który jest otwierany po wejściu na stronę internetową. Chociaż możesz go nie widzieć na pasku adresu, nie oznacza to, że go tam nie ma. Niektóre języki używane do tworzenia stron internetowych ukrywają nazwę pliku i rozszerzenie, które przeglądasz. Dzięki temu adres URL jest łatwiejszy do zapamiętania i wpisania oraz nadaje mu bardziej przejrzysty wygląd.
Pytanie
Część adresu URL zawierająca zapytanie służy do identyfikacji rzeczy, które nie są częścią ścisłej struktury ścieżki. Najczęściej zobaczysz je podczas wyszukiwania lub gdy strona internetowa dostarcza dane za pośrednictwem formularza. Część zapytania jest poprzedzona znakiem zapytania i znajduje się po ścieżce (lub po nazwie hosta, jeśli ścieżka nie jest uwzględniona).
Jako przykład weźmy ten adres URL przedstawiony podczas wyszukiwania w Amazon słów kluczowych „wzmacniacz wi-fi”:
https://www.amazon.com/s/ref=nb_sb_noss_2?url=search-alias%3Daps&field-keywords=wi-fi+extender
Formularz wyszukiwania przekazał informacje do wyszukiwarki Amazon. Po znaku zapytania widać, że zapytanie składa się z dwóch części: adresu URL do wyszukiwania (to jest część „url = search-alias% 3Daps & field”) oraz wpisanych przez nas słów kluczowych (to jest „słowa kluczowe = wi-fi + extender ”).
To dość prosty przykład i często zobaczysz adresy URL z dodatkowymi (i bardziej skomplikowanymi) zmiennymi. Na przykład oto adres URL, gdy szukaliśmy w Google słowa kluczowego „howtogeek”:
https://www.google.com/search?q=howtogeek&rlz=1C1GCEA_enUS751US751&oq=howtogeek&aqs=chrome..69i57j69i60l4j0.1839j1j4&sourceid=chrome&ie=UTF-8
Jak widać, są tam różne informacje. W takim przypadku możesz zobaczyć dodatkowe informacje wskazujące język wyszukiwania, używaną przez nas przeglądarkę (Chrome), a nawet numer wersji przeglądarki.
Fragment
Ostatni składnik adresu URL, który możesz zobaczyć, to fragment. Fragment poprzedzony jest znakiem krzyżyka (#) i służy do wskazania określonej lokalizacji na stronie internetowej. Podczas kodowania strony internetowej projektanci mogą tworzyć kotwice dla określonego tekstu, takiego jak nagłówki. Kiedy odpowiedni fragment zostanie użyty na końcu adresu URL, przeglądarka załaduje stronę, a następnie przejdzie do tej kotwicy. Kotwice i adresy URL z fragmentami są często używane do tworzenia spisów treści na stronach internetowych, aby ułatwić nawigację.
Oto przykład. Strona Wikipedii na renesans to dość długi dokument, podzielony na około 11 sekcji, z których każda ma wiele podsekcji. Ale każdy nagłówek na stronie ma dołączoną kotwicę, a spis treści u góry artykułu zawiera linki, które pozwalają przeskoczyć do różnych sekcji. Te linki działają poprzez dołączanie fragmentów.
Możesz również użyć tych fragmentów bezpośrednio na pasku adresu lub jako linki do udostępniania. Załóżmy na przykład, że chcesz pokazać komuś sekcję tej strony, która obejmuje Rosję. Możesz po prostu wysłać im ten link:
https://en.wikipedia.org/wiki/Renaissance#Russia
Ta część „#Russia” na końcu adresu URL przenosi ich bezpośrednio do tej sekcji po załadowaniu strony.
Więc masz to - więcej niż prawdopodobnie chciałeś wiedzieć o działaniu adresów URL.
Źródło zdjęcia: Pawel Horazy / Shutterstock