вступить в сро .

Универсальный локатор ресурсов


[HTTP], [FTP], [MAILTO], [WAIS], [FILE],

Из всех спецификаций World Wide Web только спецификация URI доведена до приемлемого состояния. За этим стандартом закреплен номер 1630. Выпущен этот документ в 1994 году и отражает состояние информационных ресурсов Internet на это время.
URI определяет способ записи (кодирования) адресов различных информационных ресурсов при обращении к ним из страниц WWW.
Необходимость в URI была понятна разработчикам WWW c момента зарождения системы, т.к. предполагалось объединение в единую информационную среду средств, использующих различные способы идентификации информационных ресурсов. Первоначально это были FTP архивы, информационно-поисковая система Alise и справочная система ЦЕРН. Однако Бернерс Ли подошел к делу основательно и разработал спецификацию, которая включала в себя обращения к FTP, Gopher, WAIS, Usenet, E-mail, Prospero, Telnet, Whois, X500, HTTP(WWW). В итоге была разработана универсальная спецификация, которая позволяет расширять список адресуемых ресурсов за счет появления новых.

Место применения URI - гипертестовые ссылки, которые записываются в тагах < A HREF=URI > и < LINK HREF=URI >. Встраиваемые графические объекты также адресуются по спецификации URI в тагах < IMG SRC=URI > и <FIG SRC=URI >. Реализация URI для WWW называется URL(Uniform Resource Locator). Точнее, URL -- это реализация схемы URI, отображенная на алгоритм доступа к ресурсам по сетевым протоколам. Существует еще и URN (Uniform Resource Name), которое отображает URI в пространство имен на сети.

При разработке URI преследовались следующие принципы:

  • Расширяемость - новые адресные схемы должны были легко вписываться в существующий синтаксис URI.
  • Полнота - по возможности, любая из существовавших схем должна была описываться посредством URI.
  • Читаемость - адрес должен был быть легко читаем человеком, что вообще характерно для технологии WWW - документы вместе с ссылками могут разрабатываться в обычном текстовом редакторе.Прежде, чем рассмотреть различные схемы представления адресов, приведем пример простого адреса URI:
    http://abcd.efj.com/asd/index.html

    Перед двоеточием стоит имя схемы адреса - "http". Это имя отделено двоеточием от остатка URI, который называется путь. В данном случае путь состоит из доменного адреса машины, на которой установлен сервер HTTP и пути от корня дерева сервера к файлу "index.html".

    Кроме представленной выше полной записи URI, существует упрощенная. Она предполагает, что к моменту ее использования многие параметры адреса ресурса уже определены (протокол, адрес машины в сети, некоторые элементы пути). При таких предположениях автор гипертекстовых страниц может указывать только относительный адрес ресурса, т.е. адрес относительный базовых определенных ресурсов.

    Схема HTTP. Это основная схема для WWW. В схеме указывается ее идентификатор, адрес машины, TCP порт, путь в директории сервера, поисковый критерий и метка. Приведем несколько примеров URI для схемы HTTP.
    http://abc.def.ijk.com/asd/qwer.html

    Это наиболее распространенный вид URI, применяемый в документах WWW. Вслед за именем схемы (http) следует путь, состоящий из доменного адреса машины и полного адреса HTML документа в дереве сервера HTTP.

    В качестве адреса машины допустимо использование и IP адреса:
    http://100.111.222.33/abc/abc.html
    При указании адреса ресурса возможна ссылка на точку внутри файла HTML. Для этого вслед за именем документа может быть указана метка внутри документа:
    http://abc.abc.com/abc/new.html#m1
    Символ "#" разделяет имя документа от имени метки. Обратите внимание, что пробел перед символом # не допускается. Другая возможность схемы HTTP - передача параметров. Первоначально предполагалось, что в качестве параметров будут передаваться ключевые слова, но, помере развития механизма СGI скриптов, в качестве параметров стала передаваться и другая информация.
    http://abc.abc.com/index_1.html?key1+key2
    В данном примере предполагается, что документ "index_1.html" - документ с возможностью поиска по ключевым словам. При этом в зависимости от поисковой машины (программы, реализующей поиск) знак "+" будет интерпритироваться либо как "AND", либо как "OR". Вообще говоря, "+" - заменяет " " и относится к классу неотображаемых символов. Если необходимо передать такой символ в строке параметров, то следует передавать в шестнадцатиричном виде его ASCII код.
    http://abc.abc.com/index_1.html?key1%20key2
    В данном случае имется один параметр в котором два слова разделены пробелом. Символ "%" обозначает начало ASCII кода, который продолжается до первого символа отличного от цифры.

    При использовании HTML Forms параметры передаются как поименованные поля:
    http://abc.abc.com/index_1.html?field_1=val1+field_2=val2
    Значения "field_1" и "field_2" - это имена полей, а "val1" и "val2" - их значения. При этом приведенному выше URI может соответствовать следующая HTML форма:
    < FORM ACTION=http://abc.abc.com/base/db >
    Введите заначения полей:
    Поле "field_1":< INPUT NAME="filed_1" VALUE="val1" >
    Поле "field_2":< INPUT NAME="field_2" VALUE="val2" >
    < HR >
    < /FORM >


    [
    В начало]

    Схема FTP. Данная схема позволяет адресовать файловые архивы FTP из программ-клиентов World Wide Web. При этом программа должна поддерживать протокол FTP. В данной схеме возможно указание не только имени схемы, адреса FTP архива, но и идентификатора пользователя и даже его пароля. Наиболее часто данная схема используется для доступа к публичным архивам FTP:
    ftp://abc.abc.com/pub/file.zip
    В данном случае записана ссылка на архив "abc.abc.com" c идентификатором "anonymous" или "ftp" (анонимный доступ). Если есть необходимость указать идентификатор пользователя и его пароль, то можно это сделать перед адресом машины:
    ftp://nobody:password@abc.abc.com/users/local/pub
    В данном случае эти параметры отделены от адреса машины символом "@", и отделены друг от друга двоеточием. В некоторых системах можно указать и тип передаваемой информации, но данная возможность не стандартизирована. Стандарт рекомендует определять тип по характеру данных (текстовая информация- ASCII, двоичная - IMAGE). Следует также учитывать, что не рекомендуется применять в данных случаях имя и пароь в виду отсутствия защиты от перехвата.
    [
    В начало]

    Схема MAILTO. Данная схема предназначена для отправки почты по стандарту RFC822(стандарт почтового сообщения). Общий вид схемы выглядит как:
    mailto:name@abc.abc.com

    [
    В начало]

    Схема WAIS. WAIS -- распределенная информационно-поисковая система. Учитывая, что она работает в двух режимах: поиска и просмотра. При поиске используется форма со знаком "?", отделяющим адресную часть в пути от ключевых слов:
    wais://abc.abc.com/wais?internet
    В данном случае обращаются к базе данных wais на сервере abc.abc.com с запросом на поиск документов со словом internet. Сервер должен вернуть клиенту список документов. После получения этого списка можно использовать вторую форму схемы wais - запрос на просмотр документа:
    wais://abc.abc.com/wais/wtype/063=/internet/internet.txt
    063 -- это идентификатор документа. Схема wais хороша там, где надо обслуживать постоянно действующий запрос, который неизменен на протяжении длительного времени, но при этом выдает свежие документы.
    [
    В начало]

    Схема FILE. World Wide Web технология используется как в сетевом, так и в локальном режимах. Для локального режима используют схему FILE.
    file:///C|/text/html/index.htm
    В данном примере приведено обращение к локальному документу на персональном компьютере с MS-DOS или MS-Windows. Следует заметить, что данная схема не может быть применена к CGI скриптам. Клиент запускает только программы просмотра на основе MIME типов из заголовка сообщений сервера или по расширению файла.

    Вот далеко не полный список используемых схем, в данном разделе приведены основные. Число ресурсов может расширяться путем введения новых схем.