Использование метаданных при создании HTML документов
Атрибут HTTP-EQUIV
META-теги с атрибутом HTTP-EQUIV эквивалентны HTTP-заголовкам. Обычно они управляют действиями броузеров и могут быть использованы для совершенствования информации, выдаваемой обычными заголовками. Таги такой формы могут дать такой же эффект, что и HTTP-заголовки, и на некоторых серверах автоматически могут быть переведены в настоящие HTTP-заголовки. HTTP-заголовки описываются в RFC1945 (HTTP/1.0) и RFC2068 (HTTP/1.1). HTTP-заголовки могут быть сгенерированы с помощью CGI-скриптов. Это позволяют сделать серверы Apache и CERN. В других серверах могут использоваться другие механизмы генерирования заголовков. Некоторые генерируемые сервером поля заголовков не могут быть подменены значениями из META-тегов (в частности Date), другие подменяются только при ненормальном статус-коде (<>200). Когда заголовок не понятен, то значение HTTP-заголовка превалирует над значением META-тегов. Expires Источники: HTTP/1.1 (RFC2068) Дата устаревания. Управление кэшированием в HTTP/1.0. В Netscape Navigator это выглядит следующим образом: если указанная дата прошла, то очередной запрос этого html-документа вызывает повторный сетевой запрос, а не подгрузку html-документа из кэша. Дата со значением "0" интерпретируется как "сейчас". Такое значение заставляет броузер каждый раз при запросе проверять - изменялся ли этот html-документ. Это, кстати относится и к прокси-агентам. Поисковые роботы могут либо совсем не индексировать такой документ, либо постоянно "обнюхивать" его. Дата должна быть задана в формате, описываемом в RFC850, что эквивалентно HTTP-заголовку Expires: Wed, 26 Feb 1997 08:21:57 GMT Pragma Контроль кэширования для HTTP/1.0. Значением должно быть "no-cache". Очень полезный контейнер, я всегда использую его при выдаче результатов работы любого скрипта. Content-Type Источники: HTTP/1.0 (RFC1045) Указание типа html-документа. Может быть расширено указанием кодировки страницы (charset). Если же указывать charset в содержании META-тега, то Netscape Navigator выводит такую html-страницу уже в заданном charset. Однако будьте аккуратны, если текст страницы в кодировке Windows, а значение charset=KOI8-r, то никакими силами пользователь не сможет поменять encoding, чтобы увидеть нормальные слова! Content-language Источники: HTTP/1.0 Указание языка документа. Может использоваться поисковыми машинами при индексировании html-страниц. Комбинация поля Accept-Language (посылаемого броузером) с содержимым Content-language может быть условием выбора сервером того или иного языка. что эквивалентно HTTP-заголовку В недавно вышедшей спецификации HTML 4.0 появилась другая возможность явного указания языка - Content-language: en-GB Язык описывается парой значений (язык-диалект). В примере: Английский-Великобритания Refresh Источники: Netscape Определение задержки в секундах, после которой броузер автоматически обновляет html-документ. Дополнительная возможность - автоматическая загрузка другого документа. что эквивалентно HTTP-заголовку Refresh: 3; URL=http://www.name.com/page.html В Netscape Navigator это дает такой же эффект, что и нажатие на кнопку Reload. Window-target Источники: Jahn Rentmeister Определяет окно текущей страницы; может быть использован для прекращения появления новых окон броузера при применении фреймовых структур. Действует для многих (но не для всех) броузеров. что эквивалентно HTTP-заголовку Window-target: _top Ext-cache Источники: Netscape Определяет имя альтернативного кэша для Netscape Navigator PICS-Label Platform-Independant Content rating Scheme. Обычно используется для определения рейтинга "взрослости" (adult) содержания (sex,violence, ...):-)) однако это довольно гибкая схема и может использоваться для других целей. Cache-Control Источники: HTTP/1.1 Определяет действия кэша по отношению к данному html-документу. Возможные значения:
Vary Источники: HTTP/1.1 Определяет доступные альтернативы для указанных в CONTENT полей HTTP-заголовка. что эквивалентно HTTP-заголовку Vary: Content-language Lotus Lotus-редакторы генерируют свои собственные поля Bulletin-Date и Bulletin-Text атрибуты. Bulletin-Text содержит описание документа Robots Источники: Spidering Управление индексацией страницы для поисковых роботов. Возможные значения:
Description Источники: Spidering, Altavista, Infoseek Краткая аннотация содержания html-документа. Используется поисковыми системами для описания html-документа. Этот тег сильно полезен в случаях, когда в html-документе мало текста, когда это управляющий фреймами файл (frameset) или в начале документа используются скрипты. Длина текста до 100 символов. Keywords Источники: Altavista, Infoseek Используется поисковыми системами для индексирования html-документа. Обычно здесь указываются синонимы к словам в заголовке (title) или альтернативный заголовок. Длина списка до 1000 символов. Не допускается использование одного и того же ключевого слова более 7 раз, поисковые системы просто будут игнорировать это слово. Document-state Источники: Spidering Управление индексацией html-страницы для поисковых роботов. Определяет частоту индексации - или один раз индексировать, или реиндексировать документ регулярно. Возможные значения:
URL Источники: Spidering Управление индексацией html-страницы для поисковых роботов. Определяет частоту индексации - или один раз индексировать, или реиндексировать документ регулярно. Author Источники: HTML редакторы Обычно имя автора, формат произвольный. Generator Источники: HTML редакторы Обычно название и версия редактора, с помощью которого создана эта страница. Может быть использована для определения доли рынка, занимаемого тем или иным продуктом. Copyright Источники: HTML редакторы Обычно описание авторских прав на html-документ в произвольном формате Distribution Возможные значения
Resource-type Текущее состояние данного файла. Важен для поисковых систем, т.е. если его значение document, то поисковая система приступает к его индексированию. Прочие
Помимо перечисленных более или менее стандартных тегов существует еще множество других специализированных, например, для конкретной поисковой машины тегов. Таг LINKТаг LINK предоставляет html-документу независимый от среды метод определения отношения данного html-документа к другим документам и ресурсам Сети. Используется с аргументами REL и REV. С помощью тега LINK можно:
где http://www.name.com/help.html - страница помощи по данному документу. Атрибуты REL и REV могут также использоваться с тегом A. Таги LINK могут использоваться только в заголовке документа (head) HTML 3.2 REL-теги top, contents, index, glossary, copyright, next, previous, search Некоторые из рекомендованных типов взаимосвязей:
Используется в конструкции LINK для индикации обратного соотношения html-документов. где текущая страница является страницей помощи для документа http://www.name.com/index.html Использование в случае использования Lynx вызовет автоматическую отсылку почты по адресу document-owner. Этот тег определяет для данного html-документа базовый адрес URL, который затем будет использоваться для переопределения относительных адресов. Тег BASE полезен, если документ может быть скопирован в другое место или запрошен по другому пути с использованием символической ссылки, или редиректа с imagemap, и т.д.
Страница сайта http://silicontaiga.ru
Оригинал находится по адресу http://silicontaiga.ru/home.asp?artId=6348 |