Возможно ли определить тематику сайта автоматически ?

Автор Cornely, 10-04-2019, 23:02:04

« назад - далее »

CornelyTopic starter

Задача загнать список доменов и чтобы раскидало по тематикам . Авто , сад и огород , adult , games , business , education и тд и тп . Как это сделать пока не представляю .
Смутно помню что в поисковиках(или каталогах ?) присутствовал некий числовой параметр , который отвечал за категорию сайта .
Это позволяет не отображать сайты из тематики , к примеру , adult в запросе про детские игрушки .
Напомните плиз кто в курсе про это ? Или мне приснилось  ???
А может есть еще методы .
  •  


ruschan

Цитата: Cornely от 10-04-2019, 23:02:04
Задача загнать список доменов и чтобы раскидало по тематикам . Авто , сад и огород , adult , games , business , education и тд и тп . Как это сделать пока не представляю .
Смутно помню что в поисковиках(или каталогах ?) присутствовал некий числовой параметр , который отвечал за категорию сайта .
Это позволяет не отображать сайты из тематики , к примеру , adult в запросе про детские игрушки .
Напомните плиз кто в курсе про это ? Или мне приснилось  ???
А может есть еще методы .

По поводу списка не факт, что получится. А по одному, у того же мегаиндекса вроде было. Но результат конечно "оооочень поверхностный"
ГК Гефест консалт https://www.gkgefestconsult.ru - разрешительная документация, лицензирование, сертификация, обучение специалистов, включение в НРС и допуски СРО.
  •  


Sky-fi

Цитата: Cornely от 10-04-2019, 23:02:04Как это сделать пока не представляю
Раньше был ДМОЗ, ЯК - оттуда многие брали данные. Сейчас сам не представляю, где их взять.

CornelyTopic starter

Если пойти совсем по топoрному сценарию можно скачивать несколько страниц сайта . Затем сравнивать их с неким набором ключей  для каждой категории и категорию с наибольшим числом совпадений считать основной .
Но это ж блин придется проверять минимум несколько десятков тысяч ключей каждый раз для каждого сайта  :o
  •