Страница 1 из 1

Неправильно парсятся URL адреса с индексной страницы WPGrabber

Добавлено: 28 апр 2020, 17:34
InfernalRain
Здравствуйте.
Хочу собрать адреса страниц с индексной страницы: https://superkuhen..ru/retsepty/category/sup?vi=0

На сайте-источнике в коде адреса имеют вид: /retsepty/gorokhovyj-sup-s-okhotnichimi-kolbaskami-2
Скрин: http://joxi.ru/Q2Ko45Guwlke62
Т.е адреса относительные.

Настроил шаблон сбора ссылок:/retsepty/[\w-]+
Но почему-то парсятся ссылки с подставлением полного пути индексной страницы

НАстройки:http://joxi.ru/823X49ETD0yLyA
Результат:http://joxi.ru/LmGo4aGuJ0O0Ym

Не пойму, в чем дело.

Re: Неправильно парсятся URL адреса с индексной страницы WPGrabber

Добавлено: 25 янв 2022, 16:51
SWORDMAN
У меня то же самое

Re: Неправильно парсятся URL адреса с индексной страницы WPGrabber

Добавлено: 25 янв 2022, 16:56
Admin
Данная проблема настраивается через шаблон обработки.

Re: Неправильно парсятся URL адреса с индексной страницы WPGrabber

Добавлено: 25 янв 2022, 17:54
SWORDMAN
Поддержка помогла разобраться. Нужно в настройках ленты, вкладка дополнительно прописать шаблон замены (индексная html-страница):
|retsepty/category/sup/|is (в шаблоне поиска),
а шаблоне замены оставить пустое поле