Использование метаданных при создании HTML документов

www.cyberguru.ru

Атрибут HTTP-EQUIV

META-теги с атрибутом HTTP-EQUIV эквивалентны HTTP-заголовкам. Обычно они управляют действиями броузеров и могут быть использованы для совершенствования информации, выдаваемой обычными заголовками. Таги такой формы могут дать такой же эффект, что и HTTP-заголовки, и на некоторых серверах автоматически могут быть переведены в настоящие HTTP-заголовки. HTTP-заголовки описываются в RFC1945 (HTTP/1.0) и RFC2068 (HTTP/1.1).

HTTP-заголовки могут быть сгенерированы с помощью CGI-скриптов. Это позволяют сделать серверы Apache и CERN. В других серверах могут использоваться другие механизмы генерирования заголовков. Некоторые генерируемые сервером поля заголовков не могут быть подменены значениями из META-тегов (в частности Date), другие подменяются только при ненормальном статус-коде (<>200). Когда заголовок не понятен, то значение HTTP-заголовка превалирует над значением META-тегов.

Expires

Источники: HTTP/1.1 (RFC2068)

Дата устаревания. Управление кэшированием в HTTP/1.0. В Netscape Navigator это выглядит следующим образом: если указанная дата прошла, то очередной запрос этого html-документа вызывает повторный сетевой запрос, а не подгрузку html-документа из кэша. Дата со значением "0" интерпретируется как "сейчас". Такое значение заставляет броузер каждый раз при запросе проверять - изменялся ли этот html-документ. Это, кстати относится и к прокси-агентам. Поисковые роботы могут либо совсем не индексировать такой документ, либо постоянно "обнюхивать" его.

Дата должна быть задана в формате, описываемом в RFC850,

что эквивалентно HTTP-заголовку

Expires: Wed, 26 Feb 1997 08:21:57 GMT

Pragma

Контроль кэширования для HTTP/1.0. Значением должно быть "no-cache". Очень полезный контейнер, я всегда использую его при выдаче результатов работы любого скрипта.

Content-Type

Источники: HTTP/1.0 (RFC1045)

Указание типа html-документа. Может быть расширено указанием кодировки страницы (charset). Если же указывать charset в содержании META-тега, то Netscape Navigator выводит такую html-страницу уже в заданном charset. Однако будьте аккуратны, если текст страницы в кодировке Windows, а значение charset=KOI8-r, то никакими силами пользователь не сможет поменять encoding, чтобы увидеть нормальные слова!

Content-language

Источники: HTTP/1.0

Указание языка документа. Может использоваться поисковыми машинами при индексировании html-страниц. Комбинация поля Accept-Language (посылаемого броузером) с содержимым Content-language может быть условием выбора сервером того или иного языка.

что эквивалентно HTTP-заголовку

В недавно вышедшей спецификации HTML 4.0 появилась другая возможность явного указания языка -

Content-language: en-GB

Язык описывается парой значений (язык-диалект). В примере: Английский-Великобритания

Refresh

Источники: Netscape

Определение задержки в секундах, после которой броузер автоматически обновляет html-документ. Дополнительная возможность - автоматическая загрузка другого документа.

что эквивалентно HTTP-заголовку

Refresh: 3; URL=http://www.name.com/page.html

В Netscape Navigator это дает такой же эффект, что и нажатие на кнопку Reload.

Window-target

Источники: Jahn Rentmeister

Определяет окно текущей страницы; может быть использован для прекращения появления новых окон броузера при применении фреймовых структур. Действует для многих (но не для всех) броузеров.

что эквивалентно HTTP-заголовку

Window-target: _top

Ext-cache

Источники: Netscape

Определяет имя альтернативного кэша для Netscape Navigator

PICS-Label

Platform-Independant Content rating Scheme. Обычно используется для определения рейтинга "взрослости" (adult) содержания (sex,violence, ...):-)) однако это довольно гибкая схема и может использоваться для других целей.

Cache-Control

Источники: HTTP/1.1

Определяет действия кэша по отношению к данному html-документу. Возможные значения:

Public - документ кэшируется в доступных для всех кэшах
Private - только в частном кэше
no-cache - не может быть кэширован
no-store - может быть кэширован, но не сохраняется

Vary

Источники: HTTP/1.1

Определяет доступные альтернативы для указанных в CONTENT полей HTTP-заголовка.

что эквивалентно HTTP-заголовку

Vary: Content-language

Lotus

Lotus-редакторы генерируют свои собственные поля Bulletin-Date и Bulletin-Text атрибуты. Bulletin-Text содержит описание документа

Robots

Источники: Spidering

Управление индексацией страницы для поисковых роботов.

Возможные значения:

ALL
NONE
INDEX
NOINDEX
FOLLOW
NOFOLLOW

Description

Источники: Spidering, Altavista, Infoseek

Краткая аннотация содержания html-документа. Используется поисковыми системами для описания html-документа. Этот тег сильно полезен в случаях, когда в html-документе мало текста, когда это управляющий фреймами файл (frameset) или в начале документа используются скрипты. Длина текста до 100 символов.

Keywords

Источники: Altavista, Infoseek

Используется поисковыми системами для индексирования html-документа. Обычно здесь указываются синонимы к словам в заголовке (title) или альтернативный заголовок. Длина списка до 1000 символов. Не допускается использование одного и того же ключевого слова более 7 раз, поисковые системы просто будут игнорировать это слово.

Document-state

Источники: Spidering

Управление индексацией html-страницы для поисковых роботов. Определяет частоту индексации - или один раз индексировать, или реиндексировать документ регулярно.

Возможные значения:

Static
Dynamic

URL

Источники: Spidering

Author

Источники: HTML редакторы

Обычно имя автора, формат произвольный.

Generator

Источники: HTML редакторы

Обычно название и версия редактора, с помощью которого создана эта страница. Может быть использована для определения доли рынка, занимаемого тем или иным продуктом.

Copyright

Источники: HTML редакторы

Обычно описание авторских прав на html-документ в произвольном формате

Distribution

Возможные значения

global
local
iu (internal use)

Resource-type

Текущее состояние данного файла. Важен для поисковых систем, т.е. если его значение document, то поисковая система приступает к его индексированию.

Прочие

Classification
Formatter
Site-languages
Version
Template
Operator
Rating
Creation
Host
Document
Subject
Build
Random text ()

Помимо перечисленных более или менее стандартных тегов существует еще множество других специализированных, например, для конкретной поисковой машины тегов.

Таг LINK

Таг LINK предоставляет html-документу независимый от среды метод определения отношения данного html-документа к другим документам и ресурсам Сети. Используется с аргументами REL и REV. С помощью тега LINK можно:

создавать в html-документе специальные навигационные кнопки или меню
управлять процессом отображения набора HTML файлов в печатные документы
привязывать такие ассоциированные ресурсы, как таблицы стилей и скрипты
предоставлять альтернативные формы для данного документа

где http://www.name.com/help.html - страница помощи по данному документу.

Атрибуты REL и REV могут также использоваться с тегом A. Таги LINK могут использоваться только в заголовке документа (head)

Атрибут REL

HTML 3.2 REL-теги

top, contents, index, glossary, copyright, next, previous, search

Некоторые из рекомендованных типов взаимосвязей:

rel=top: Данная связь указывает на вершину в некой иерархической структуре, например на первую, либо титульную страницу в неком наборе документов.
rel=contents: Данная связь указывает на некий файл, где приводится оглавление к данному документу.
rel=index: Данная связь указывает на другой html-документ, который можно использовать в целях индексного поиска по текущему документу.
rel=glossary: Данная связь указывает на некий html-документ, где содержится глоссарий терминов, относящихся к текущему документу.
rel=copyright: Данная связь ссылается на текст, где указаны авторские права на данный документ.
rel=next: Данная связь указывает на следующий html-документ в неком заранее предопределенном маршруте просмотра. Например, она может использоваться для упреждающей автоматической загрузки браузером следующей страницы.
rel=previous: Данная связь ссылается на предыдущий документ в неком предопределенном маршруте просмотра.
rel=help: Данная связь указывает на html-документ, предлагающий некую помощь, например это может быть текст, дающий более развернутое описание и предлагающий ссылки на другие документы по этой теме. Назначение этой связи - оказание помощи тем читателям, кто потерял свой путь в Web.
rel=search: Данная ссылка ведет к поисковой странице, контролирующей некий набор страниц, связанных общей темой.

Многие системы изобретают свои дополнительные значения аргументов REL и REV

Таг Schema
Этот тег содержит URL документа-шаблона. Действие всех метаданных из документа-шаблона будут распространены на документ с тегом Schema (так работает Dublin Core).

ViewCall REL-теги

home, bookmark, tickertape, vmail, icon, prefetch, keyn, fastxx

AOLpress REL-теги

AOLpress использует несколько дополнительных, по сравнению с HTML 3.2, тегов

Home, ToC, Index, Glossary, Copyright, Up, Next, Previous, Help, Bookmark, First, Last

Атрибут REV

Используется в конструкции LINK для индикации обратного соотношения html-документов.

где текущая страница является страницей помощи для документа http://www.name.com/index.html

Использование в случае использования Lynx вызовет автоматическую отсылку почты по адресу document-owner.

Таг BASE

Этот тег определяет для данного html-документа базовый адрес URL, который затем будет использоваться для переопределения относительных адресов. Тег BASE полезен, если документ может быть скопирован в другое место или запрошен по другому пути с использованием символической ссылки, или редиректа с imagemap, и т.д.

Страница сайта http://silicontaiga.ru
Оригинал находится по адресу http://silicontaiga.ru/home.asp?artId=6348