Коли ви вводите адресу у веб-браузері, багато чого відбувається за лаштунками. І більшість із них визначається різними частинами URL-адреси, яку ви ввели. Давайте розглянемо уважніше.
URL може складатися з безлічі різних частин. Існує ім’я хосту, яке відображається на IP-адресі певного ресурсу в Інтернеті, а також купа додаткової інформації, яка повідомляє вашому браузеру та серверу, як поводитися з речами. Ви можете придумати IP-адреса як щось на зразок телефонного номера. Ім'я хоста схоже на ім'я людини, номер телефону якої ви хочете знайти. І стандарт, який називається Система доменних імен (DNS) працює у фоновому режимі, як телефонна книга, перекладаючи більш зручні для людини імена хостів в IP-адреси, які мережі використовують для маршрутизації трафіку.
Пам’ятаючи про цю аналогію, давайте поглянемо на структуру URL-адреси та як вона працює, щоб дістатися до того місця, куди ви хочете.
Як структурована URL-адреса
Структуру URL-адреси вперше визначив сер Тім Бернерс-Лі - хлопець, який створив Інтернет і перший веб-браузер - у 1994 році. URL-адреси, по суті, поєднують ідею доменні імена з ідеєю використання шляху до файлу для ідентифікації певної папки та структури файлів. Отже, це схоже на використання шляху, такого як C: \ Documents \ Personal \ myfile.txt в Windows, але з деякими додатковими матеріалами на початку, щоб допомогти знайти правильний сервер в Інтернеті, де цей шлях існує, і протокол, що використовується для доступу до інформація.
URL-адреса складається з декількох різних частин. Візьмемо, наприклад, базову URL-адресу, подібну до тієї, що показана на зображенні нижче.
Ця проста URL-адреса розбита на дві основні складові: схему та повноваження.
Схема
Багато людей вважають URL-адресу просто веб-адресою, але це не так просто. Веб-адреса - це URL-адреса, але всі URL-адреси не є веб-адресами. Інші послуги, до яких ви можете отримати доступ в Інтернеті - наприклад, FTP - або навіть локально - як MAILTO - також є URL-адресами. Частина схеми URL-адреси (ті літери, за якими йде двокрапка) позначає протокол, з яким програма (наприклад, ваш веб-браузер) і сервер повинні взаємодіяти.
Веб-адреси - найпоширеніша URL-адреса, але є й інші. Отже, ви можете побачити такі схеми:
- Протокол передачі гіпертексту (HTTP): це базовий протокол Інтернету, який визначає, які дії повинні виконувати веб-сервери та браузери у відповідь на певні команди.
- Захищений HTTP ( HTTPS ) : Це форма HTTP, яка працює над захищеним, зашифрованим шаром для більш безпечного транспортування інформації.
- Протокол передачі файлів (FTP): Цей протокол часто все ще використовується для передачі файлів через Інтернет.
У сучасних браузерах схема технічно не потрібна як частина URL-адреси. Якщо ви ввійдете на веб-сайт, такий як “www.howtogeek.com”, ваш браузер автоматично визначить правильний протокол для використання. Тим не менше, деякі інші програми (і протоколи) вимагають використання схеми.
Авторитет
Організована частина URL-адреси (якій передують дві скісні риски) сама розбивається на купу частин. Почнемо з дуже простої URL-адреси - тієї, яка переведе вас на домашню сторінку веб-сайту.
У цьому простому прикладі вся частина “www.example.com” називається іменем хосту, і вона перетворюється на IP-адресу. Ви також можете ввести IP-адресу в адресний рядок веб-переглядача замість імені хосту, якщо вам це відомо.
Але при синтаксичному аналізі імені хоста допомагає прочитати його назад, щоб зрозуміти, що відбувається, отже ось такі компоненти:
- Домен верхнього рівня: У прикладі тут "com" - це домен верхнього рівня. Це найвищий рівень в Система доменних імен (DNS) ієрархія використовується для перекладу IP-адрес у прості мовні адреси, які нам, людям, легше запам’ятати. Ці домени верхнього рівня створюються та управляються Інтернет-корпорацією з присвоєння імен та номерів (ICANN). Трьома найпоширенішими доменами верхнього рівня є .com, .net та .gov. У більшості країн також є власний домен верхнього рівня із двох літер, тому ви побачите домени, такі як .us (США), .uk (Великобританія), .ca (Канада) та багато інших. Є також деякі додаткові домени верхнього рівня (наприклад .museum), які фінансуються та управляються приватними організаціями. На додаток до них існують також деякі загальні домени верхнього рівня (наприклад .club, .life та .news).
- Піддомен: Оскільки DNS є ієрархічною системою, і частини “www”, і “приклад” нашої прикладної URL-адреси вважаються субдоменами. Частина “www” є субдоменом домену верхнього рівня “com”, а частина “www” - субдоменом домену “example”. Ось чому ви часто бачите компанію із зареєстрованим іменем, як-от "google.com", розбиту на окремі піддомени, такі як "www.google.com", "news.google.com", "mail.google.com" та так далі.
Це найосновніший приклад уповноваженого розділу URL-адреси, але все може ускладнитися. Є ще два компоненти, які може містити розділ повноважень:
- Інформація про користувача: Розділ повноважень може також містити ім’я користувача та пароль для веб-сайту, до якого ви переходите. Сьогодні нечасто можна побачити цю структуру в URL-адресах, але це може трапитися. Якщо присутні, частина інформації про користувача стоїть перед іменем хосту, за якою слідує знак @. Отже, ви можете побачити щось на зразок «//користувача: пароль@www.example.com», якщо він містить інформацію про користувача.
- Номер порту: Мережеві пристрої використовують IP-адреси для отримання інформації до потрібного комп’ютера в мережі. Коли цей трафік надходить, номер порту повідомляє комп'ютеру програму, для якої цей трафік призначений. Номер порту - ще один елемент, який ви часто не бачите під час перегляду веб-сторінок, але ви можете побачити його в мережевих додатках (наприклад, іграх), які вимагають введення URL-адреси. Якщо URL-адреса містить номер порту, вона постає після імені хосту і перед нею ставиться двокрапка. Це виглядало б приблизно так: "//www.example.com:8080."
Отже, це схема та уповноважені частини URL-адреси, але, як ви могли здогадатися, переглянувши багато URL-адрес під час перегляду веб-сторінок, вони можуть включати ще більше речей.
Шляхи, запити та фрагменти
Є три додаткові частини URL-адреси, які ви можете побачити після частини повноважень: шляхи, запити та фрагменти. Ось як вони працюють.
Шлях
Розділ повноважень URL-адреси спрямовує ваш браузер (або будь-яку іншу програму) на потрібний сервер у мережі. Шлях, який слідує - який працює так само, як шлях у Windows, macOS або Linux - приведе вас до потрібної папки або файлу на цьому сервері. Шляху передує коса риса, і між кожною директорією та підкаталогом є коса риса, наприклад:
www.example.com/folder/subfolder/filename.html
Останній фрагмент - це назва файлу, який відкривається під час доступу до веб-сайту. Хоча ви можете не побачити його в адресному рядку, це не означає, що його там немає. Деякі мови, що використовуються для створення веб-сторінок, приховують ім’я файлу та розширення, яке ви переглядаєте. Це полегшує запам’ятовування та введення URL-адреси та надає їй чистіший вигляд.
Запит
Частина запиту URL-адреси використовується для ідентифікації речей, які не є частиною суворої структури шляху. Найчастіше ви побачите, як вони використовуються під час пошуку або коли веб-сторінка доставляє дані через форму. Частині запиту передує знак запитання і йде після шляху (або після імені хосту, якщо шлях не включений).
Як приклад, візьмемо цю URL-адресу, представлену під час пошуку в Amazon ключових слів «wi-fi extender»:
https://www.amazon.com/s/ref=nb_sb_noss_2?url=search-alias%3Daps&field-keywords=wi-fi+extender
Форма пошуку передавала інформацію пошуковій системі Amazon. Після знака питання ви бачите, що у запиті є дві частини: URL-адреса для пошуку (це „url = search-alias% 3Daps & field“) та ключові слова, які ми ввели (це „keywords = wi-fi + подовжувач ”частина).
Це досить простий приклад, і ви часто бачите URL-адреси з додатковими (і більш складними) змінними. Наприклад, ось URL-адреса, коли ми шукали в Google ключове слово “howtogeek”:
https://www.google.com/search?q=howtogeek&rlz=1C1GCEA_enUS751US751&oq=howtogeek&aqs=chrome..69i57j69i60l4j0.1839j1j4&sourceid=chrome&ie=UTF-8
Як бачите, там є інша інформація. У цьому випадку ви бачите, що є додаткова інформація, що вказує мову пошуку, браузер, яким ми користувались (Chrome), і навіть номер версії браузера.
Фрагмент
Кінцевий компонент URL-адреси, який ви можете побачити, називається фрагментом. Фрагменту передує хеш-знак (#) і використовується для позначення конкретного місця на веб-сторінці. Під час кодування веб-сторінки дизайнери можуть створювати прив'язки для певного тексту, наприклад заголовків. Коли відповідний фрагмент використовується в кінці URL-адреси, ваш браузер завантажує сторінку, а потім переходить до цього якоря. Якіри та URL-адреси з фрагментами часто використовуються для створення таблиць вмісту на веб-сторінках для полегшення навігації.
Ось приклад. Сторінка Вікіпедії на Відродження це досить довгий документ, і він розбитий приблизно на 11 розділів, кожен з яких має кілька підрозділів. Але кожен заголовок на сторінці містить прив’язку, а зміст у верхній частині статті містить посилання, що дозволяють переходити до різних розділів. Ці посилання працюють, включаючи фрагменти.
Ви також можете використовувати ці фрагменти безпосередньо в адресному рядку або як спільні посилання. Скажімо, наприклад, ви хотіли показати комусь розділ цієї сторінки, який охоплює Росію. Ви можете просто надіслати їм це посилання:
https://en.wikipedia.org/wiki/Renaissance#Russia
Частина "# Росія" в кінці URL-адреси перескакує їх прямо до цього розділу після завантаження сторінки.
Отже, у вас є - більше, ніж ви, мабуть, хотіли знати про те, як працюють URL-адреси.
Кредит зображення: Павел Хоразі / Shutterstock