Как поисковые машины могут ранжировать пользовательский контент


Пользовательским контентом называют текстовую, графическую, аудио и видеоинформацию в сети Интернет.

Пользовательский контент организовывается преимущественно пользователями сайтов, этим-то он и отличается от других типов информации в сети. К этому виду контента относятся всевозможные форумы, блоги, доски объявлений, комментарии к продуктам, сайты Википедии и подкасты, словом, все то, что размещают в сети Интернет простые пользователи.

Так, например, у Yahoo есть патент, в котором представлены различные варианты обозначения самого понятия пользовательского контента а также способы помещения его в список.

Мнение изобретателей таково, что в сети расположены страницы с отзывами о товарах, на них можно найти интересную и полезную информацию, которая может быть не доступной пользователю посредством обычного поиска.

Действительно у поисковых систем могут возникнуть серьезные проблемы с распределением и ранжированием контента пользователей.

Выделяют три причины, которые могут создать проблемы для поисковиков:
- Небольшой объем пользовательского контента;
- Отсутствие соответствующих ссылок на данный контент а также их отсутствие в самом контенте;
- Наличие орфографических и пунктуационных ошибок, которые очень часто встречаются в пользовательском контенте.

Предлагаются три концепции, которые помогут попасть единицам пользовательской информации в списки поисковых систем.

Инструменты и сама методика призваны рассчитать качественное значение документа, авторский уровень, а также уровень сетевого ресурса. Следующей ступенью является определения рейтинга на основании вышеуказанных показателей, то есть авторского уровня, уровня ресурса и качества информации. Здесь также выделяется и результат поиска.

Прежде всего, нужно сосредоточиться на качестве информации, которая содержится в документе не зависимо от того публикация ли это в блоге, комментарий на форуме или отзыв о каком-либо продукте. Существуют определенные элементы, которые оказывают значительное влияние на поиск:

- Пользовательский уровень;
- Общее количество сообщений конкретного пользователя;
- Связь документа пользователя с основным документом в плане контекста;
- Корень тренда;
- Количество просмотров данного документа;
- Присутствие в документе графических и мультимедийных элементов, ссылок на другие документы;
- Размер документа;
- Длина тренда, к которому относится данный документ;
- Наличие или отсутствие дочерних документов, а также их характер;

А сейчас уделим внимание еще одной характеристике пользовательского контента – уровню автора. Здесь важно то, насколько автор разбирается в том вопросе, который он рассматривает. На рейтинг в этой области влияют следующие детали:

А) Количество имеющих отношение к данному вопросу авторских публикаций;
Б) Качественный индекс документа;
В) Число документов опубликованных автором за определенный отрезок времени;
Г) Общее число авторских ответов и комментариев;
Д) Количество групп, в которых этот автор участвует.


Только материалы из рубрики ТИЦ свободны для копирования без каких-либо условий. Ссылка на остальные материалы обязательна.