Страница 1 из 1

Парсинг определенных URLs WPGrabber

Добавлено: 13 дек 2021, 21:13
sonar4ik
Добрый день.
Часто бывает, что URL идет от домена, без вложенности, соответственно, определить к какой категории относиться та или другая статья - проблематично.
Либо, мне нужна парсинг определнного списка статей (URLs).
Либо, я хочу использовать sitemap для определение URLs, которые нужно парсить.

Вопросы:
1) Возможно ли как то использовать Sitemap для определения URLs?
2) Могу ли я составлять свой список страниц, которые хочу спарсить, а не все в подряд?
Спасибо.

Re: Парсинг определенных URLs WPGrabber

Добавлено: 21 дек 2021, 19:17
Admin
Настроить по sitemap.xml можно, но плагин WPGrabber будет парсить все новости подряд, а не только из определенных рубрик.
Затем организовать парсинг по рубрикам можно в принципе по фильтрам.

Re: Парсинг определенных URLs WPGrabber

Добавлено: 22 сен 2022, 19:10
vgricin
Подскажите пожалуйста, какое выражение прописать в Дополнительной обработке для исключения некоторых
URL категории?