Парсинг ВК (Заголовок)

В этой ветке создаем темы по настройке лент WPGrabber.

Модератор: Admin

Ответить
Pimpleks
Участник
Сообщения: 12
Зарегистрирован: 13 фев 2016, 10:48

Парсинг ВК (Заголовок)

Сообщение Pimpleks » 25 авг 2016, 02:25

Сообственно раньше стояло так

Код: Выделить всё

|(?=<br><br>)\S+.*|is
Но теперь не работает - выдает всю длину, версия последняя.

WPGrabber
Администратор
Сообщения: 135
Зарегистрирован: 24 ноя 2015, 22:09
Откуда: СССР
Благодарил (а): 4 раза
Поблагодарили: 5 раз
Контактная информация:

Re: Парсинг ВК (Заголовок)

Сообщение WPGrabber » 25 авг 2016, 12:22

Если у вас wpgrabber_2.1.2_test-5 и не работает, то перекачайте и переустановите плагин.

Pimpleks
Участник
Сообщения: 12
Зарегистрирован: 13 фев 2016, 10:48

Re: Парсинг ВК (Заголовок)

Сообщение Pimpleks » 30 авг 2016, 06:23

Обновил до версии тест 6, но заголовки так и выдает полные, в лююом констукторе регулярных выражений работате, но не на парсере.
Регулярка вида
|\S+.*/<div class="wall_post_text">/(.*)<br> <br>\S+.*|is замена $1 количестов 1
Попробуйте спарсить в контактехоть одну группу, что не так? почему не работает?

WPGrabber
Администратор
Сообщения: 135
Зарегистрирован: 24 ноя 2015, 22:09
Откуда: СССР
Благодарил (а): 4 раза
Поблагодарили: 5 раз
Контактная информация:

Re: Парсинг ВК (Заголовок)

Сообщение WPGrabber » 30 авг 2016, 08:47

Вы хотябы примерно представляете, что оно делает? Эта регулярка вообще для чего? Убить ленту?

Код: Выделить всё

|\S+.*/<div class="wall_post_text">/(.*)<br> <br>\S+.*|is
Вы меня еще первым выражением удивили:

Код: Выделить всё

|(?=<br><br>)\S+.*|is

Pimpleks
Участник
Сообщения: 12
Зарегистрирован: 13 фев 2016, 10:48

Re: Парсинг ВК (Заголовок)

Сообщение Pimpleks » 30 авг 2016, 09:11

Не поверите, но регулятора - взять заголовок. Еще раз повторюсь что в конструкторе все работает.
Cсылку прилагаю.

Pimpleks
Участник
Сообщения: 12
Зарегистрирован: 13 фев 2016, 10:48

Re: Парсинг ВК (Заголовок)

Сообщение Pimpleks » 30 авг 2016, 09:13

А что удивило то ? мне нужен текст - заголовок - который содержится до тега <br>. Примера как такового нет нигде. Через констурктор работает.

Pimpleks
Участник
Сообщения: 12
Зарегистрирован: 13 фев 2016, 10:48

Re: Парсинг ВК (Заголовок)

Сообщение Pimpleks » 30 авг 2016, 09:17

Мое представление - убирает теги до текста - убирате после, берет середину. Или регулярка имеет другое значение?

Pimpleks
Участник
Сообщения: 12
Зарегистрирован: 13 фев 2016, 10:48

Re: Парсинг ВК (Заголовок)

Сообщение Pimpleks » 30 авг 2016, 12:06

прошу объяснить пожалуйста в чем проблема,

Код: Выделить всё

<div class="wall_post_text">(.*?)<br>
тоже не работает, поэтому и замудряю как могу, но не работатет никак.

WPGrabber
Администратор
Сообщения: 135
Зарегистрирован: 24 ноя 2015, 22:09
Откуда: СССР
Благодарил (а): 4 раза
Поблагодарили: 5 раз
Контактная информация:

Re: Парсинг ВК (Заголовок)

Сообщение WPGrabber » 30 авг 2016, 17:49

Для чего и к чему это выражение?

Pimpleks
Участник
Сообщения: 12
Зарегистрирован: 13 фев 2016, 10:48

Re: Парсинг ВК (Заголовок)

Сообщение Pimpleks » 31 авг 2016, 08:15

Это выражение для того чтобы взять заголовок с новости в контакте. Слова до символа <br>

WPGrabber
Администратор
Сообщения: 135
Зарегистрирован: 24 ноя 2015, 22:09
Откуда: СССР
Благодарил (а): 4 раза
Поблагодарили: 5 раз
Контактная информация:

Re: Парсинг ВК (Заголовок)

Сообщение WPGrabber » 31 авг 2016, 08:24

Pimpleks писал(а):прошу объяснить пожалуйста в чем проблема,

Код: Выделить всё

<div class="wall_post_text">(.*?)<br>
тоже не работает, поэтому и замудряю как могу, но не работатет никак.
Это выражение работает, но бывает берет слишком длинный заголовок - https://prntscr.com/ccd9a5
К каждой ленте с ВК нужен индивидуальный подход и одно выражение для всех лент не сделаешь.

Pimpleks
Участник
Сообщения: 12
Зарегистрирован: 13 фев 2016, 10:48

Re: Парсинг ВК (Заголовок)

Сообщение Pimpleks » 31 авг 2016, 08:45

Могу дать доступ, но в том то и дело что не работает, указано 15 символов. Вот оно все 15 и выдает.
https://prntscr.com/ccdeob
https://prntscr.com/ccdf25

WPGrabber
Администратор
Сообщения: 135
Зарегистрирован: 24 ноя 2015, 22:09
Откуда: СССР
Благодарил (а): 4 раза
Поблагодарили: 5 раз
Контактная информация:

Re: Парсинг ВК (Заголовок)

Сообщение WPGrabber » 31 авг 2016, 09:01

И опять не правильно делаете, нужно так - https://prntscr.com/ccdikk

Pimpleks
Участник
Сообщения: 12
Зарегистрирован: 13 фев 2016, 10:48

Re: Парсинг ВК (Заголовок)

Сообщение Pimpleks » 31 авг 2016, 09:03

Ясно, спасибо, а что тогда редактирует шаблон обработки с названием - заголовок?

WPGrabber
Администратор
Сообщения: 135
Зарегистрирован: 24 ноя 2015, 22:09
Откуда: СССР
Благодарил (а): 4 раза
Поблагодарили: 5 раз
Контактная информация:

Re: Парсинг ВК (Заголовок)

Сообщение WPGrabber » 31 авг 2016, 10:51

Уже спарсенный заголовок, но не только так, как вы придумали.

Ответить