Если PDF-документ с великолепным содержимым не имеет должной популярности у целевых пользователей, на это есть две причины отсутствие доступа к нему и плохая поддержка (изоляция).
Отсутствие доступа
Многие владельцы сайтов предоставляют посетителям доступ к официальным документам и рекламным буклетам только после заполнения специальной формы (анкеты). Им это нужно, чтобы определить своих потенциальных клиентов. В обмен на оставленную персональную информацию (имя, адрес электронной почты, номер телефона и т. д.) посетители могут скачать нужную им информацию, например официальный документ.
Поисковая система не может заполнить анкету для доступа к такому содержимому. Поэтому если заполнение формы единственный способ добраться до вашего PDF-документа, данный документ не появится в списках результатов поиска.
Изоляция
Часто владелец сайта обеспечивает доступ к своим PDF-документам, но так, словно говорит: «Не думаю, что это важный документ». Например, многие владельцы делают доступ к PDF-документам иерархическим.
Слишком часто к PDF-документу ведет единственная ссылка та, что находится на странице с описанием отдельного продукта это и означает плохую поддержку или изоляцию PDF-документа. Такая односторонняя информационная архитектура и соответствующий интерфейс говорят поисковым системам, что вы (владелец сайта) не считаете свои PDF документы ценными. Если бы вы думали по-другому, то разместили бы ссылки на данный URL не в одном месте, а в нескольких.
Одно из простых решений для размещения дополнительных ссылок на PDF-документы карта сайта. Многие специалисты по поисковой оптимизации (даже сотрудники поисковых систем) часто полагают, что карта сайта чудесно обеспечивает доступ к его содержимому. Однако, как сказано в соответствующем разделе этой книги, обеспечение доступа только одна из составляющих компонента «Ссылки». Также важны релевантность и интуитивная ориентация. Для юзабилити имеет значение и размещение перекрестных ссылок, и внешнее продвижение сайта.
Всегда сообщайте посетителям сайта важную информацию до того, как они нажмут ссылку на PDF-документ. Во-первых, человек должен знать, что после нажатия данной ссылки откроется PDF-документ. Это повлечет за собой запуск Acrobat Reader или другого подобного приложения, если оно установлено на компьютере пользователя. Запуск дополнительных приложений без предупреждения ведет к негативному впечатлению от посещения сайта.
Во-вторых, ввиду того что PDF-документ гораздо больше HTML-файла по объему, необходимо сообщить его объем пользователю до того, как он нажмет ссылку. Не забывайте, что соответствие ожиданиям пользователя положительно сказывается на впечатлении от поиска.
И еще: вставляйте ключевые слова и словосочетания в текст ссылок на PDF-документы или рядом с ними. Карта сайта, состоящая только из гиперссылок, тоже во многом помогает, но все же это не идеальный подход с точки зрения улучшения поисковой видимости. Лучше добавить краткое содержание всех PDF-документов, включив в него как можно больше ключевых слов.
Например, простым способом проинформировать посетителей сайта нашей вымышленной компании TranquiliTeas о том, что будет открыт PDF -документ, является такая текстовая ссылка:
Некоторые владельцы сайтов создают страницы-классификаторы с кратким содержанием PDF-документов. Ссылка на такую страницу добавляется в карту сайта (или в предметный указатель сайта), а сама страница включается в общую схему навигации сайта.
Запрет сканирования содержимого PDF
Иногда часть содержимого веб-сайта хранится и в формате HTML, и в PDF. Во избежание фильтрации по дублированию/избыточности, с помощью протокола запрета сканирования (обычно файл robots.txt) сообщайте поисковым системам, какое содержимое не нужно сканировать.
Один из путей PDF-оптимизации разместить PDF-документы с дублирующим содержимым в одном каталоге, а оригинальные PDF-документы в другом.
Например, в каталог pdfs можно поместить дублирующие PDF-документы, а в каталог pdf. оригиналы. После этого осталось только указать дублирующее содержимое в протоколе ограничения сканирования для роботов:
User-agent: *
Disallow: /pelfs/