Индексируют… но типа не всякий XML-код.
Достаточно давний пример в индексе — site:erum.ru, в Яндексе, в bing.com, go.mail.ru — не индексирует, мэйловцы ссылались на неподдержание технологии XSLT… хотя её никто не поддерживает (не забывая при этом похвастаться #индексацией AJAX).
Эта демка — в G и в Я — это XML, кроме глагне, но похожий для ПС на HTML или на XHTML.
Если XSLT используется только на сервере, а результат отдаётся клиенту с заголовком Content-Type: text/html — такое не будем считать документом.XML… как и большинство находящегося по запросу filetype:xml… тип файла — это не MIME, смотрите HTTP-заголовки.
ps Вебмастеры, зацикленные на валидности и “правильном” <!DOCTYPE — всё несут в валидатор. Можно отнести и эту страницу… она Well‑formed — “правильно построена”… чего достаточно для отображения браузером (просто иначе не все из них справляются). Беда: в суете с декларациями так и не замечается, где в этом всём XSLT — являющаяся целью. Ещё бытует мнение, что XML — это тупо отказ от тегов HTML… в выдаче получалось начало текста вместо заголовка документа. Поэтому, пока ПС приучены к HTML — наверное лучше бы использовать в XML-документах теги HTML — их видят боты. А декларации в отображаемом документе — поминаются в файле.XSL — как в примере: из XML в XHTML — например, чтобы все свойства.CSS работали. Думайте о необходимостях, а не о догматах.W3C
pps Во время писания… замечено четыре пересекающихся, но различных понимания XML: Яндексом, Гуглем, браузерами и валидатором — считающим валидным XML с корнем <root>, но вот невалидным то же самое с корневым элементом <html>… типа валидатор подразумевал XHTML…
ppps Потом… Яндекс показывал в выдаче картинку рядом с XML-документами, т. е. типа признал таковыми… например, с корневым элементом <rss>… этой картинкой помечались не все XML-документы, пока не выкинулись из индекса почти все… да, страницы этого сайта Яндекс не считает XML-ем… вот таковы догматы евонных программеров. Давеча ТП отказалась отвечать на вопросы по индексированию файлов.xml, заявив, что Яндекс их якобы не индексирует, но всё не так! Вероятно, есть некий набор признаков, при наличии которых — индексит-как-XML а вот созерцаемую вами страницу — счёл за HTML… ну и хрен бы с ним.
pppps <Rss> в Гугле.
Введение в XSLT
Как поисковики читают <title> и <meta/> в документах.XML?
Какие теги использовать в XML?