Что такое URL? Структура URL
Что такое URL?
URL означает Uniform Resource Locator, что переводится на вьетнамский язык как унифицированный указатель ресурсов. В частности, URL — это адрес уникального ресурса в Интернете. Каждый действительный URL будет указывать на уникальный ресурс, этот ресурс может быть страницей HTML, документом CSS, изображением, видео, файлом PDF. В некоторых исключительных случаях URL может указывать на другой Ресурс больше не существует или был перемещен по другому адресу (перемещен).
URL-адреса могут содержать множество различных элементов. Они включают имя хоста, которое сопоставляется с IP-адресом определенного ресурса в Интернете, и кучу дополнительной информации, которая сообщает браузерам и серверам, как с этим обращаться. Вы можете думать об IP-адресе как о номере телефона, имя хоста как об имени человека, которому принадлежит этот номер телефона, который вы хотите найти. А стандарт, называемый системой доменных имен (DNS), работает в фоновом режиме как телефонная книга, преобразуя имена хостов в IP-адреса, которые сеть использует для маршрутизации трафика.
Где URL-адрес?
URL обычно можно найти в адресной строке в верхней части окна веб-браузера. На ноутбуках и настольных компьютерах URL веб-сайта всегда будет отображаться в адресной строке, когда пользователь прокручивает веб-сайт.
В случае мобильных устройств поведение браузера по умолчанию приводит к исчезновению URL-адреса, как только пользователь начинает прокручивать страницу вниз. Однако он снова появится, когда пользователь прокрутит страницу вверх.
История URL-адресов
Сохранение данных, связанных с использованием веб-сайтов, стало серьезной проблемой конфиденциальности. Все больше пользователей требуют, чтобы поставщики услуг приложений и поисковые системы были прозрачны в отношении информации, которую они собирают, сохраняют и продают третьим лицам.
Например, в марте 2019 года Google обновил политику конфиденциальности Chrome. Google отмечает, что в базовом режиме браузера Chrome поисковая система хранит информацию локально в вашей системе. Эта информация включает в себя историю просмотров, т. е. URL-адреса посещенных страниц, а также кэши текста, изображений и других ресурсов с этих страниц.
Однако Google также собирает и хранит данные в течение различных периодов времени. Некоторые данные могут быть удалены, когда человек захочет, некоторые удаляются автоматически, а другие хранятся Google в течение более длительных периодов времени, когда это необходимо.
Структура URL-адреса
Структура URL была впервые определена в 1994 году сэром Тимом Бернерсом-Ли, человеком, который создал первый веб и браузер. По сути, URL объединяют доменные имена с использованием путей к файлам для идентификации определенных структур файлов и каталогов. Таким образом, это похоже на использование пути C:DocumentsPersonalmyfile.txt в Windows, но добавляет что-то сверху, чтобы он мог найти нужный сервер в Интернете, где находится этот путь, и использовать протокол для доступа к информации.
URL содержит несколько других путей. Например, ниже представлено изображение базового URL, давайте проанализируем его структуру.
Этот простой URL-адрес разделен на два основных компонента: Scheme (протокол подключения) и Authotiry (провайдер).
Схема
Многие думают об URL как о веб-адресе, но это не так просто. Веб-адрес — это URL, но не все URL являются веб-адресами. Другие службы, к которым вы можете получить доступ в Интернете, такие как FTP или даже MAILTO, также являются URL. Часть Scheme в URL (буквы, следующие за двоеточием) представляет собой протокол, по которому взаимодействуют приложение (например, веб-браузер) и сервер.
Веб-адреса являются наиболее распространенными URL, но есть и другие. Поэтому вы увидите такие схемы:
- : Это базовый протокол Интернета, определяющий, какие действия веб-серверы и браузеры должны выполнять в ответ на определенные команды.
- Защищенный протокол HTTP (): это форма HTTP, работающая на защищенном, зашифрованном уровне для более безопасной передачи информации.
- Протокол передачи файлов (): этот протокол часто используется для передачи файлов через Интернет.
HTTP (Hypertext Transfer Protocol) и HTTPS (Hypertext Transfer Protocol Secure) — это сетевые протоколы связи между веб-серверами и веб-браузерами. Они передают сообщения, извлекают информацию через систему доменных имен (DNS) и отправляют ее обратно браузеру.
Разница между HTTP и HTTPS заключается в том, что HTTPS шифрует передачу данных. Этот протокол безопасности лучше защищает ваш сайт и имеет важное значение для улучшения вашего рейтинга поиска.
Другое отличие заключается в том, что HTTPS использует порт TCP/IP (Transmission Control Protocol/Internet Protocol) с номером 443, зашифрованный с помощью Transport Layer Security (TLS). В то время как HTTP URL использует порт TCP/IP с номером 80.
Важное примечание: Веб-браузеры также могут обрабатывать другие протоколы, включая FTP и mailto. FTP позволяет обмениваться файлами между различными веб-серверами, локально или удаленно. Затем направляйте пользователей на определенный адрес электронной почты.
В современных браузерах Scheme технически не обязательно является частью URL. Если вы зайдете на сайт вроде www.TipsMake.com, браузер автоматически определит подходящий протокол для использования. Однако некоторые другие приложения (и протоколы) требуют использования схемы.
Власть
Часть URL-адреса Authority (часть, которая начинается после двух слешей) делится на небольшие части. Начните с простого URL-адреса, обычно того, который ведет на домашнюю страницу веб-сайта.
В этом простом примере вся часть 'www.example.com' называется hostname и отвечает за получение IP-адреса. Если вы знаете IP-адрес, вы можете ввести его в адресную строку браузера вместо hostname.
Вот некоторые из его ингредиентов:
- : В этом примере «com» — это домен верхнего уровня. Это самый высокий уровень в иерархии доменных имен, используемый для перевода IP-адресов в простые, легко запоминающиеся языковые адреса. Эти домены верхнего уровня создаются и управляются Корпорацией по управлению доменными именами и IP-адресами в Интернете (ICANN). Существует три популярных домена верхнего уровня: .com., .net, .gov. В большинстве стран есть двухбуквенные домены верхнего уровня, вы увидите такие доменные имена, как .us (США), .vn (Вьетнам), .ca (Канада) и т. д. Существует несколько доменов верхнего уровня, дополнения верхнего уровня (например, .museum) спонсируются и управляются отдельными организациями. Кроме того, существуют также некоторые общие домены верхнего уровня, такие как .club, .life и .news.
- Поддомен: Поддомен включает любое слово или фразу, которые предшествуют первой точке URL. Что касается всемирной паутины, www является самым популярным. Он указывает, что веб-сайт доступен через Интернет и использует HTTP для связи. Поскольку DNS является иерархией, обе части «www» и «example» примера URL выше считаются поддоменами. Часть «www» является поддоменом домена верхнего уровня «com», а часть «www» является поддоменом домена «example». Вот почему вы видите компании с зарегистрированными именами, такими как «google.com», разделенными на поддомены, такие как «www.google.com», «news.google.com», «mail.google.com» и т. д. Владельцы сайтов могут использовать любое слово в качестве поддомена для целей организации сайта, поскольку оно указывает на определенную папку из основного домена. Некоторые из самых популярных вариантов — «blog» и «news».
Это самый простой пример части Authority URL, другие URL могут быть более сложными. В разделе Authority есть еще два компонента:
- Информация о пользователе: раздел Authority может также содержать имя пользователя и пароль веб-сайта, который вы посещаете. В настоящее время вы вряд ли столкнетесь с такой структурой URL. Раздел информации о пользователе идет перед именем сервера и за ним следует знак @. Например, вы можете увидеть URL, который включает информацию о пользователе, например:
//имя пользователя:пароль@www.example.com
- Номер порта: Сетевые устройства используют IP-адреса для получения информации на соответствующий компьютер в сети. Когда поступает трафик, номер порта сообщает компьютеру, на какое приложение нацелен этот трафик. Обычно вы не видите номер порта при веб-серфинге, но вы можете увидеть его в сетевых приложениях, таких как игры, которые требуют ввода URL-адреса. Если URL-адрес содержит номер порта, он отображается после имени хоста и перед двоеточием. Вы должны увидеть его примерно так:
//www.example.com:8080
Дополнительные компоненты URL
После раздела «Автор» вы можете увидеть три дополнительные части URL-адреса: путь, запрос и фрагмент.
Путь
Часть URL Authority направляет браузеры (или другие приложения) на нужный сервер в сети. Путь (который работает как путь в Windows, macOS или Linux) ведет к нужной папке или файлу на этом сервере. Пути начинаются со слеша и имеют слеши между папками и подпапками следующим образом:
www.example.com/folder/subfolder/filename.html
Последняя часть — это имя файла, который будет открыт при доступе к веб-сайту. Даже если вы не видите эту ссылку в адресной строке, это не значит, что ее там нет. Некоторые языки, используемые для создания веб-страниц, скрывают имена файлов и расширения, чтобы пользователям было легче запоминать и вводить URL-адреса.
запрос
Часть запроса URL используется для идентификации вещей, которые не являются частью фиксированной структуры пути. Обычно вы увидите их использование для выполнения поиска или когда веб-сайты доставляют данные через формы. Этой части запроса предшествует вопросительный знак, а за ней следует путь (или после имени сервера, если пути нет).
Например, ниже приведен URL-адрес при поиске «расширитель Wi-Fi» на Amazon.
Форма поиска передала информацию поисковой системе Amazon. За вопросительным знаком следуют две части запроса: URL для поиска (это часть 'url=search-alias%3Daps&field') и введенное ключевое слово (это часть 'keywords=wi-fi+extender').
Это довольно простой пример, и вы часто будете видеть URL с различными плагинами. Например, это URL при поиске ключевого слова 'TipsMake' в Google.
Как вы видите, здесь есть еще информация. В этом случае вы увидите используемый браузер.
Параметры
?key1=value1&key2=value2 — дополнительные параметры, предоставляемые веб-серверу. Эти параметры представляют собой список пар ключ/значение, разделенных символом &. Веб-сервер может использовать эти параметры для выполнения дополнительной работы перед возвратом ресурса. У каждого веб-сервера есть свои правила относительно параметров, и единственный надежный способ узнать, обрабатывает ли конкретный веб-сервер параметры, — спросить владельца веб-сервера.
Якорная ссылка (якорь)
#SomewhereInTheDocument — это якорь для другой части самого ресурса. Якорь представляет собой тип «закладки» внутри ресурса, предоставляя браузеру инструкции по отображению содержимого, расположенного в этом «заложенном» месте. Например, в документе HTML браузер прокрутит страницу до точки, где идентифицирован символ якоря; в видео- или аудиодокументе браузер попытается добраться до точки, которую представляет якорь. Стоит отметить, что часть после знака #, также известная как идентификатор фрагмента, никогда не отправляется на сервер с запросом.
Фрагментация
Последняя часть URL, которую вы видите, называется фрагментом. Фрагментам предшествует знак решетки (#), и они используются для идентификации определенного местоположения сайта. При написании кода для веб-сайта дизайнеры могут создавать ссылки-якоря для определенного текста, например заголовков. При использовании соответствующего фрагмента в конце URL-адреса ваш браузер загрузит страницу, а затем перейдет к этой ссылке-якорю. Ссылки-якоря и URL-адреса вместе с фрагментацией часто используются для создания оглавления веб-сайта для более легкой навигации.
Типы URL-адресов
В целом наиболее распространенными типами URL-адресов являются абсолютные и относительные.
Абсолютный URL содержит полную информацию, от протокола до пути к ресурсу или параметру. Между тем, относительный URL включает только путь к ресурсу.
Абсолютные URL-адреса и относительные URL-адреса
То, что мы видели выше, называется абсолютным URL, но есть также нечто, называемое относительным URL. Стандарт URL определяет оба – хотя он использует термины абсолютные строки URL и относительные строки URL, чтобы отличать их от объектов URL (которые являются представлениями URL в памяти).
Давайте рассмотрим разницу между «абсолютным» и «относительным» в контексте URL-адресов.
Обязательные части URL-адреса в значительной степени зависят от контекста, в котором используется URL-адрес. В адресной строке браузера URL-адрес не имеет контекста, поэтому вы должны предоставить полный URL-адрес (или абсолютный URL-адрес), как те, что мы видели выше. Вам не нужно включать протокол (браузеры используют HTTP по умолчанию) или порт (требуется только в том случае, если целевой веб-сервер использует какой-то необычный порт), но все остальные части URL-адреса необходимы.
Когда URL используется в документе, например, на странице HTML, все немного по-другому. Поскольку браузер уже имеет собственный URL документа, он может использовать эту информацию для заполнения недостающих частей любых URL, доступных в этом документе. Мы можем различать абсолютные URL и относительные URL, глядя на часть пути URL. Если часть пути URL начинается с символа “/”, браузер извлечет этот ресурс из верхнего корня сервера без ссылки на контекст, предоставленный текущим документом.
Некоторые другие типы URL-адресов
В зависимости от функциональности существуют и другие типы URL-адресов:
- Канонические URL-адреса: владельцы сайтов могут использовать их в случае дублирования контента. Канонизация URL-адреса — это способ сообщить поисковым системам, какие интернет-адреса следует сканировать и индексировать.
- URL-адреса обратного вызова: они ссылаются на основной пункт назначения, когда пользователь завершает процесс во внешней системе.
- Vanity URL: Также известные как пользовательские короткие URL, они представляют собой легко запоминающиеся веб-адреса. Обычно vanity URL представляет собой перенаправление более длинного URL. Владельцы веб-сайтов могут использовать сокращатели URL-адресов веб-сайтов, такие как Bitly, Short.io и TinyURL, для создания виртуального URL.
Семантические URL-адреса
Хотя URL-адреса являются технически сложными, они представляют собой удобочитаемую для человека точку входа на веб-сайт. Их можно запомнить, и любой может ввести их в адресную строку браузера. Люди — это ядро сети, и поэтому считается лучшей практикой создавать то, что называется семантическими URL-адресами. Семантические URL-адреса используют слова с присущими им значениями, которые может понять любой, независимо от его технического уровня.
Лингвистическая семантика, конечно, не имеет значения для компьютеров. Вы часто можете видеть URL, которые выглядят как случайные комбинации символов. Но есть много преимуществ в создании понятных человеку URL:
- Вам будет легче работать с ними.
- Каждому будет ясно все, включая то, где он находится, что делает, что читает или с чем взаимодействует в Интернете.
- Некоторые поисковые системы могут использовать такую семантику для улучшения категоризации связанных страниц.
Честно говоря, вы можете делать их такими, какими хотите. Но вот несколько полезных советов:
- Никаких специальных символов. Только латинские буквы, с дефисами (-) вместо пробелов. Никаких специальных символов, никаких символов из других языков – только простые латинские буквы и тире.
- Планирование. Планируйте иерархию своего сайта, соглашения об именовании и т. д. Вам не следует ничего менять после этого, поэтому планируйте тщательно. Необходимость планировать все заранее также является единственным серьезным недостатком во всем процессе создания семантических URL.
- Не делайте URL слишком длинным: Google рекомендует не более 5 слов в заголовке страницы. Что касается общей длины URL – постарайтесь, чтобы она была менее 100 символов, включая домен.
Сокращение URL-адресов
Сокращение URL-адресов — это метод, при котором URL-адрес можно сделать значительно короче, но при этом он будет по-прежнему указывать на запрошенную страницу. Сокращатели делают это, используя перенаправления на короткое доменное имя.
Существует множество сервисов сокращения URL. Хотя многие программы бесплатны, те, которые предлагают такие возможности, как веб-аналитика, взимают плату. Компании, предлагающие сокращение URL, включают Rebrandly, Bitly, Ow.ly, clicky.me и Budurl.com.
Некоторые службы веб-хостинга, такие как GoDaddy.com, предлагают URL-сокращатели. Другие поставщики услуг, включая поисковые системы, начали отказываться от URL-сокращателей, поскольку ими часто злоупотребляют спамеры, скрывающие вредоносное ПО внутри URL-адресов. Компактный.
Как использовать URL-адреса
Любой URL можно ввести прямо в адресной строке браузера, чтобы получить доступ к ресурсу, стоящему за ним. Но это только вершина айсберга!
Язык HTML широко использует URL-адреса:
- для создания ссылок на другие документы с помощью
- связать документ с соответствующими ресурсами с помощью различных элементов, таких как или
Дэвид Пак
Обновление 27 июля 2024 г.