Когда вы вводите адрес в свой веб-браузер, многие вещи происходят за кулисами. И большая часть этого определяется различными частями введенного вами URL. Давайте посмотрим поближе.
URL-адрес может состоять из множества разных частей. Существует имя хоста, которое сопоставляется с IP-адресом определенного ресурса в Интернете, и множество дополнительной информации, которая сообщает вашему браузеру и серверу, как с этим справляться. Вы можете думать о айпи адрес как что-то вроде номера телефона. Имя хоста похоже на имя человека, номер телефона которого вы хотите найти. И стандарт под названием Система доменных имен (DNS) работает в фоновом режиме, как телефонная книга, переводя более понятные имена хостов в IP-адреса, которые сети используют для маршрутизации трафика.
Помня об этой аналогии, давайте рассмотрим структуру URL и то, как она работает, чтобы вы могли попасть туда, куда вы хотите.
Как структурирован URL
Структура URL-адреса была впервые определена сэром Тимом Бернерсом-Ли - парнем, который создал Интернет и первый веб-браузер - в 1994 году. URL-адреса, по сути, объединяют идею доменные имена с идеей использования пути к файлу для определения конкретной папки и файловой структуры. Таким образом, это похоже на использование такого пути, как C: \ Documents \ Personal \ myfile.txt в Windows, но с некоторыми дополнительными сведениями в начале, которые помогут найти правильный сервер в Интернете, на котором существует этот путь, и протокол, используемый для доступа к Информация.
URL-адрес состоит из нескольких разных частей. Возьмем, например, базовый URL-адрес, подобный показанному на изображении ниже.
Этот простой URL-адрес разбит на два основных компонента: схему и авторитет.
Схема
Многие люди думают, что URL - это просто веб-адрес, но все не так просто. Веб-адрес - это URL-адрес, но все URL-адреса не являются веб-адресами. Другие службы, к которым вы можете получить доступ в Интернете, например FTP, или даже локально, например MAILTO, также являются URL-адресами. Часть схемы URL-адреса (эти буквы, за которыми следует двоеточие) обозначает протокол, по которому приложение (например, ваш веб-браузер) и сервер должны взаимодействовать.
Веб-адреса являются наиболее распространенными URL-адресами, но есть и другие. Итак, вы можете увидеть такие схемы:
- Протокол передачи гипертекста (HTTP): это базовый протокол Интернета, который определяет, какие действия веб-серверы и браузеры должны выполнять в ответ на определенные команды.
- HTTP Secure ( HTTPS ) : Это форма HTTP, которая работает на безопасном зашифрованном уровне для более безопасной передачи информации.
- Протокол передачи файлов (FTP): этот протокол до сих пор часто используется для передачи файлов через Интернет.
В современных браузерах эта схема технически не требуется как часть URL-адреса. Если вы войдете на такой веб-сайт, как «www.howtogeek.com», ваш браузер автоматически определит правильный протокол для использования. Тем не менее, некоторые другие приложения (и протоколы) требуют использования схемы.
Власть
Авторитетная часть URL-адреса (которой предшествуют две косые черты) сама разбита на несколько частей. Давайте начнем с очень простого URL - такого типа, который приведет вас на главную страницу веб-сайта.
В этом простом примере вся часть «www.example.com» называется именем хоста и преобразуется в IP-адрес. Вы также можете ввести IP-адрес в адресную строку браузера вместо имени хоста, если вам это известно.
Но при анализе имени хоста полезно прочитать его в обратном направлении, чтобы понять, что происходит, поэтому вот эти компоненты:
- Домен верхнего уровня: В данном примере «com» - это домен верхнего уровня. Это самый высокий уровень в система доменных имен (DNS) иерархия, используемая для перевода IP-адресов в адреса на простых языках, которые нам, людям, легче запомнить. Эти домены верхнего уровня создаются и управляются Интернет-корпорацией по присвоению имен и номеров (ICANN). Три наиболее распространенных домена верхнего уровня - это .com, .net и .gov. В большинстве стран также есть свои собственные двухбуквенные домены верхнего уровня, поэтому вы увидите такие домены, как .us (США), .uk (Великобритания), .ca (Канада) и многие другие. Есть также несколько дополнительных доменов верхнего уровня (например, .museum), которые спонсируются и управляются частными организациями. В дополнение к ним есть также несколько общих доменов верхнего уровня (например, .club, .life и .news).
- Поддомен: Поскольку DNS представляет собой иерархическую систему, обе части «www» и «example» в нашем примере URL считаются субдоменами. Часть «www» является поддоменом домена верхнего уровня «com», а часть «www» - поддоменом домена «example». Вот почему вы часто видите компанию с зарегистрированным названием, например google.com, разбитым на отдельные субдомены, такие как www.google.com, news.google.com, mail.google.com и скоро.
Это самый простой пример авторитетного раздела URL, но все может быть сложнее. Раздел полномочий может содержать еще два компонента:
- Информация о пользователе: Раздел полномочий также может содержать имя пользователя и пароль для сайта, к которому вы получаете доступ. Сегодня редко можно увидеть такую структуру в URL, но такое бывает. Если присутствует, часть информации о пользователе идет перед именем хоста и сопровождается знаком @. Таким образом, вы можете увидеть что-то вроде «//username:[email protected]», если оно включает информацию о пользователе.
- Номер порта: Сетевые устройства используют IP-адреса для передачи информации на нужный компьютер в сети. Когда приходит этот трафик, номер порта сообщает компьютеру приложение, для которого этот трафик предназначен. Номер порта - это еще один элемент, который вы не часто видите при просмотре веб-страниц, но вы можете увидеть его в сетевых приложениях (например, в играх), которые требуют ввода URL-адреса. Если URL-адрес включает номер порта, он идет после имени хоста и предваряется двоеточием. Это будет выглядеть примерно так: «//www.example.com:8080».
Итак, это схема и авторитетные части URL-адреса, но, как вы могли догадаться, просмотрев множество URL-адресов во время просмотра веб-страниц, они могут включать в себя еще больше.
Пути, запросы и фрагменты
Есть три дополнительных части URL-адреса, которые вы можете увидеть после части полномочий: пути, запросы и фрагменты. Вот как это работает.
Дорожка
Раздел полномочий URL-адреса направляет ваш браузер (или любое другое приложение) на нужный сервер в сети. Следующий путь - который работает так же, как путь в Windows, macOS или Linux - приведет вас к нужной папке или файлу на этом сервере. Путь предваряется косой чертой, и между каждым каталогом и подкаталогом есть косая черта, например:
ввв.эксампле.ком/фолдер/субфолдер/филенаме.хтмл
Последняя часть - это имя файла, который открывается при входе на веб-сайт. Хотя вы можете не видеть его в адресной строке, это не значит, что его там нет. Некоторые языки, используемые для создания веб-страниц, скрывают имя файла и расширение, которое вы просматриваете. Это упрощает запоминание и ввод URL-адреса и придает ему более понятный вид.
Запрос
Часть URL-адреса запроса используется для идентификации вещей, которые не входят в строгую структуру пути. Чаще всего они используются, когда вы выполняете поиск или когда веб-страница предоставляет данные через форму. Части запроса предшествует вопросительный знак и идет после пути (или после имени хоста, если путь не включен).
В качестве примера возьмем этот URL, представленный при поиске в Amazon ключевых слов «расширитель Wi-Fi»:
хттпс://ввв.амазон.ком/с/реф=нб_сб_нос_2?урл=сеарч-алиас%зДапс&фиелд-кейвордс=ви-фи+экстендер
Форма поиска передавала информацию в поисковую систему Amazon. После вопросительного знака вы можете увидеть, что запрос состоит из двух частей: URL для поиска (это часть «url = search-alias% 3Daps & field») и введенные нами ключевые слова (это «ключевые слова = wi-fi + расширитель »).
Это довольно простой пример, и вы часто будете видеть URL-адреса с дополнительными (и более сложными) переменными. Например, вот URL-адрес, по которому мы искали в Google ключевое слово «howtogeek»:
хттпс://ввв.гоогле.ком/сеарч?к=новтогеек&рлз=1К1ЖСЕА_енИС751УС751&ок=новтогеек&акс=хроме..69и57ж69и60л4й0.1839ж1й4&соурсеид=хроме&и=УТФ-8
Как видите, там другая информация. В этом случае вы можете увидеть дополнительную информацию с указанием языка поиска, браузера, который мы использовали (Chrome), и даже номера версии браузера.
Фрагмент
Последний компонент URL-адреса, который вы можете увидеть, называется фрагментом. Фрагменту предшествует решетка (#), и он используется для обозначения определенного места на веб-странице. При кодировании веб-страницы дизайнеры могут создавать привязки для определенного текста, например заголовков. Когда в конце URL-адреса используется правильный фрагмент, ваш браузер загрузит страницу, а затем перейдет к этой привязке. Якоря и URL-адреса с фрагментами часто используются для создания таблиц содержания на веб-страницах, чтобы упростить навигацию.
Вот пример. Страница Википедии на Ренессанс - довольно длинный документ, разбитый примерно на 11 разделов, каждый из которых состоит из нескольких подразделов. Но каждый заголовок на странице имеет привязку, а оглавление вверху статьи включает ссылки, позволяющие переходить к различным разделам. Эти ссылки работают за счет включения фрагментов.
Вы также можете использовать эти фрагменты непосредственно в адресной строке или в качестве общих ссылок. Скажем, например, вы хотели показать кому-нибудь раздел этой страницы, посвященный России. Вы можете просто отправить им эту ссылку:
хттпс://ен.википедия.орг/вики/Ренаиссанче#Россия
Часть «#Russia» в конце URL-адреса переводит их прямо в этот раздел после загрузки страницы.
Итак, у вас есть это - больше, чем вы, вероятно, когда-либо хотели знать о том, как работают URL-адреса.
Кредит изображения: Павел Горазы / Shutterstock