Парсинг определенных URLs WPGrabber

В этой ветке создаем темы по настройке лент WPGrabber.

Модератор: Admin

Ответить
sonar4ik
Сообщения: 1
Зарегистрирован: 10 дек 2021, 15:30

Парсинг определенных URLs WPGrabber

Сообщение sonar4ik » 13 дек 2021, 21:13

Добрый день.
Часто бывает, что URL идет от домена, без вложенности, соответственно, определить к какой категории относиться та или другая статья - проблематично.
Либо, мне нужна парсинг определнного списка статей (URLs).
Либо, я хочу использовать sitemap для определение URLs, которые нужно парсить.

Вопросы:
1) Возможно ли как то использовать Sitemap для определения URLs?
2) Могу ли я составлять свой список страниц, которые хочу спарсить, а не все в подряд?
Спасибо.

Аватара пользователя
Admin
Администратор
Сообщения: 578
Зарегистрирован: 22 ноя 2015, 12:18
Откуда: СССР
Благодарил (а): 48 раз
Поблагодарили: 20 раз
Контактная информация:

Re: Парсинг определенных URLs WPGrabber

Сообщение Admin » 21 дек 2021, 19:17

Настроить по sitemap.xml можно, но плагин WPGrabber будет парсить все новости подряд, а не только из определенных рубрик.
Затем организовать парсинг по рубрикам можно в принципе по фильтрам.
Главная часть любого оружия, есть голова его владельца. Заказ лент WPGrabber

vgricin
Новичок
Сообщения: 4
Зарегистрирован: 08 май 2022, 23:16
Благодарил (а): 1 раз

Re: Парсинг определенных URLs WPGrabber

Сообщение vgricin » 22 сен 2022, 19:10

Подскажите пожалуйста, какое выражение прописать в Дополнительной обработке для исключения некоторых
URL категории?

Ответить