Здравствуйте.
Хочу собрать адреса страниц с индексной страницы: https://superkuhen..ru/retsepty/category/sup?vi=0
На сайте-источнике в коде адреса имеют вид: /retsepty/gorokhovyj-sup-s-okhotnichimi-kolbaskami-2
Скрин: http://joxi.ru/Q2Ko45Guwlke62
Т.е адреса относительные.
Настроил шаблон сбора ссылок:/retsepty/[\w-]+
Но почему-то парсятся ссылки с подставлением полного пути индексной страницы
НАстройки:http://joxi.ru/823X49ETD0yLyA
Результат:http://joxi.ru/LmGo4aGuJ0O0Ym
Не пойму, в чем дело.
Неправильно парсятся URL адреса с индексной страницы WPGrabber
Модератор: Admin
-
- Новичок
- Сообщения: 4
- Зарегистрирован: 30 мар 2020, 16:12
- Admin
- Администратор
- Сообщения: 578
- Зарегистрирован: 22 ноя 2015, 12:18
- Откуда: СССР
- Благодарил (а): 48 раз
- Поблагодарили: 20 раз
- Контактная информация:
Re: Неправильно парсятся URL адреса с индексной страницы WPGrabber
Данная проблема настраивается через шаблон обработки.
Главная часть любого оружия, есть голова его владельца. Заказ лент WPGrabber
Re: Неправильно парсятся URL адреса с индексной страницы WPGrabber
Поддержка помогла разобраться. Нужно в настройках ленты, вкладка дополнительно прописать шаблон замены (индексная html-страница):
|retsepty/category/sup/|is (в шаблоне поиска),
а шаблоне замены оставить пустое поле
|retsepty/category/sup/|is (в шаблоне поиска),
а шаблоне замены оставить пустое поле