Настройка ленты newsland

В этой ветке создаем темы по настройке лент WPGrabber.

Модератор: Admin

Закрыто
Armiatit
Новичок
Сообщения: 8
Зарегистрирован: 08 авг 2016, 16:47

Настройка ленты newsland

Сообщение Armiatit » 08 авг 2016, 17:01

Доброго времени суток.
Пытаюсь настроить ленту но ничего не получается.
После нажатия кнопки "Тест импорта" мне выдает "Найдено ссылок: 0".

Думаю проблема в "Шаблон ссылок", но даже прописав "httpss://newsland\.com/\S{1,}/
Все равно выдает ошибку: "Найдено ссылок: 0".

Вот как я заполнил настройку ленты:
Тип ленты: html
URL индексной страницы: httpss:_//newsland_com/ (конечно без _ в ссылке)
Кодировка HTML-страницы: uyf-8
Шаблон ссылок: httpss://newsland\.com/user/\S{10}/content/\S{1,}/\S{7}/
Шаблон заголовка: <h1>(.*?)</h1>
Начальная точка полного текста: <div class="post post2">
Конечная точка полного текста: <div class="post-bot blue-block">

Прощу помощи у знающих данный грабер, что я делаю не так?

WPGrabber
Администратор
Сообщения: 135
Зарегистрирован: 24 ноя 2015, 22:09
Откуда: СССР
Благодарил (а): 4 раза
Поблагодарили: 5 раз
Контактная информация:

Re: Нас тройка ленты

Сообщение WPGrabber » 08 авг 2016, 17:14

И вам не хварать )))
Начнем стого, что ссылка выглядит так:

Код: Выделить всё

/user/4296647985/content/krupneishaia-aviakompaniia-mira-otmenila-vse-reisy/5382233

Armiatit
Новичок
Сообщения: 8
Зарегистрирован: 08 авг 2016, 16:47

Re: Нас тройка ленты

Сообщение Armiatit » 08 авг 2016, 17:31

Я видел что ссылка как вы написали.
Под нее и делал шаблон ссылки.
Вроде правильно.
Я понимаю так (разбиваю на куски):
/user/
/user/
--
/4296647985/ - десять знаков
/\S{10}/ - правили которое берет десять знаков.
--
/content/
/content/
--
/krupneishaia-aviakompaniia-mira-otmenila-vse-reisy/ - много чего угодно
/\S{1,}/ - правило, больше одного и не ограницено в количестве знаков
--
/5382233 - семь знаков
/\S{7}/ - правили которое берет семь знаков.

Я считаю что правильно написал шаблон ссылок.
Но из за того что не находит новости, я думаю что то не правильно, вот только не понимаю что именно?

WPGrabber
Администратор
Сообщения: 135
Зарегистрирован: 24 ноя 2015, 22:09
Откуда: СССР
Благодарил (а): 4 раза
Поблагодарили: 5 раз
Контактная информация:

Re: Нас тройка ленты

Сообщение WPGrabber » 08 авг 2016, 18:01

Судя по вашему вы сделали совсем не так. Вот ваш:

Код: Выделить всё

Шаблон ссылок: httpss://newsland\.com/user/\S{10}/content/\S{1,}/\S{7}/
А ссылка выглядит так:

Код: Выделить всё

/user/4296647985/content/krupneishaia-aviakompaniia-mira-otmenila-vse-reisy/5382233
Загадка: Найти одно отличие )))

Armiatit
Новичок
Сообщения: 8
Зарегистрирован: 08 авг 2016, 16:47

Re: Нас тройка ленты

Сообщение Armiatit » 08 авг 2016, 18:05

Вы говорите за присутствие доменного имени или за слеш на конце?
Других отличий я не вижу.

WPGrabber
Администратор
Сообщения: 135
Зарегистрирован: 24 ноя 2015, 22:09
Откуда: СССР
Благодарил (а): 4 раза
Поблагодарили: 5 раз
Контактная информация:

Re: Нас тройка ленты

Сообщение WPGrabber » 08 авг 2016, 18:12

Браво. Вы даже нашли 2 существенных различия.
Не нужно что то пытаться добавить свое, прежде не сделав соответствующие доп. шаблоны. Как есть в исходнике, так и нужно использовать.

Armiatit
Новичок
Сообщения: 8
Зарегистрирован: 08 авг 2016, 16:47

Re: Нас тройка ленты

Сообщение Armiatit » 08 авг 2016, 18:16

Ну в исходнике есть доменное имя, как же без него.
А вот если убрать (или добавить) слеш в конце, то все равно ни чего не находит.
Я пробовал много разных вариантов шаблона ссылки, но так: httpss://newsland.com/\S{1,}
Ни находит ни одной ссылки, хотя я думаю так он должен брать абсолютно все ссылки что есть на странице.

Кроме слеша не видите ни каких проблем?

Armiatit
Новичок
Сообщения: 8
Зарегистрирован: 08 авг 2016, 16:47

Re: Нас тройка ленты

Сообщение Armiatit » 08 авг 2016, 18:17

Хотя нет, простите, начал находить ссылки, пусть не те что нужно. Но все же заработал.
Спасибо за помощь.
Пошел дальше настраивать ленту.

WPGrabber
Администратор
Сообщения: 135
Зарегистрирован: 24 ноя 2015, 22:09
Откуда: СССР
Благодарил (а): 4 раза
Поблагодарили: 5 раз
Контактная информация:

Re: Нас тройка ленты

Сообщение WPGrabber » 08 авг 2016, 18:24

Не знаю каким образом вы смотрели код страницы, но нет там доменного имени в ссылках на статьи. Используйте CTRL+U для просмотра кода страницы, ну или ПКМ и просмотр кода, но никак не копируя ссылку с индексной страницы.

Armiatit
Новичок
Сообщения: 8
Зарегистрирован: 08 авг 2016, 16:47

Re: Нас тройка ленты

Сообщение Armiatit » 08 авг 2016, 18:27

Большое вам спасибо, теперь понял как надо было делать.
P.S - Ленту получилось настроить.

WPGrabber
Администратор
Сообщения: 135
Зарегистрирован: 24 ноя 2015, 22:09
Откуда: СССР
Благодарил (а): 4 раза
Поблагодарили: 5 раз
Контактная информация:

Re: Нас тройка ленты

Сообщение WPGrabber » 08 авг 2016, 18:32

Поздравляю!!!

Закрыто