Добрый день.
Часто бывает, что URL идет от домена, без вложенности, соответственно, определить к какой категории относиться та или другая статья - проблематично.
Либо, мне нужна парсинг определнного списка статей (URLs).
Либо, я хочу использовать sitemap для определение URLs, которые нужно парсить.
Вопросы:
1) Возможно ли как то использовать Sitemap для определения URLs?
2) Могу ли я составлять свой список страниц, которые хочу спарсить, а не все в подряд?
Спасибо.
Парсинг определенных URLs WPGrabber
Модератор: Admin
- Admin
- Администратор
- Сообщения: 578
- Зарегистрирован: 22 ноя 2015, 12:18
- Откуда: СССР
- Благодарил (а): 48 раз
- Поблагодарили: 20 раз
- Контактная информация:
Re: Парсинг определенных URLs WPGrabber
Настроить по sitemap.xml можно, но плагин WPGrabber будет парсить все новости подряд, а не только из определенных рубрик.
Затем организовать парсинг по рубрикам можно в принципе по фильтрам.
Затем организовать парсинг по рубрикам можно в принципе по фильтрам.
Главная часть любого оружия, есть голова его владельца. Заказ лент WPGrabber
Re: Парсинг определенных URLs WPGrabber
Подскажите пожалуйста, какое выражение прописать в Дополнительной обработке для исключения некоторых
URL категории?
URL категории?