индексация сайтов.XML поисковиками

Индексируют… но типа не всякий XML-код.

Достаточно давний пример в индексе — site:erum.ru, в Яндексе, в bing.com, go.mail.ru — не индексирует, мэйловцы ссылались на неподдержание технологии XSLT… хотя её никто не поддерживает (не забывая при этом похвастаться #индексацией AJAX).

Эта демка — в G и в Я — это XML, кроме глагне, но похожий для ПС на HTML или на XHTML.

Если XSLT используется только на сервере, а результат отдаётся клиенту с заголовком Content-Type: text/html такое не будем считать документом.XML… как и большинство находящегося по запросу filetype:xml… тип файла — это не MIME, смотрите HTTP-заголовки.

ps Вебмастеры, зацикленные на валидности и “правильном” <!DOCTYPE всё несут в валидатор. Можно отнести и эту страницу… она Well‑formed — “правильно построена”… чего достаточно для отображения браузером (просто иначе не все из них справляются). Беда: в суете с декларациями так и не замечается, где в этом всём XSLT — являющаяся целью. Ещё бытует мнение, что XML — это тупо отказ от тегов HTML… в выдаче получалось начало текста вместо заголовка документа. Поэтому, пока ПС приучены к HTML — наверное лучше бы использовать в XML-документах теги HTML — их видят боты. А декларации в отображаемом документе — поминаются в файле.XSL как в примере: из XML в XHTML — например, чтобы все свойства.CSS работали. Думайте о необходимостях, а не о догматах.W3C

pps Во время писания… замечено четыре пересекающихся, но различных понимания XML: Яндексом, Гуглем, браузерами и валидатором — считающим валидным XML с корнем <root>, но вот невалидным то же самое с корневым элементом <html>… типа валидатор подразумевал XHTML

ppps Потом… Яндекс показывал в выдаче картинку XML рядом с XML-документами, т. е. типа признал таковыми… например, с корневым элементом <rss>… этой картинкой помечались не все XML-документы, пока не выкинулись из индекса почти все… да, страницы этого сайта Яндекс не считает XML-ем… вот таковы догматы евонных программеров. Давеча ТП отказалась отвечать на вопросы по индексированию файлов.xml, заявив, что Яндекс их якобы не индексирует, но всё не так! Вероятно, есть некий набор признаков, при наличии которых — индексит-как-XML XML а вот созерцаемую вами страницу — счёл за HTML… ну и хрен бы с ним.

pppps <Rss> в Гугле.

Введение в XSLT

Как поисковики читают <title> и <meta/> в документах.XML?

Какие теги использовать в XML?

странный случай в выдаче с иконкой XML XML

неудавшаяся попытка сделать в выдаче иконку XML