Проблема с адресом картинок

В этой ветке создаем темы по настройке лент WPGrabber.

Модератор: Admin

Закрыто
denya090
Участник
Сообщения: 20
Зарегистрирован: 13 дек 2015, 10:29

Проблема с адресом картинок

Сообщение denya090 » 30 дек 2015, 16:25

Здравствуйте уважаемые гуру! Просьба помочь с не совсем стандартным шаблоном. В общем, иногда попадаются доноры, в который при парсинге картинок адрес домена удваивается и картинка не отображается. Например вот html код картинки:

Код: Выделить всё

<img  itemprop="contentUrl" src="//www.bostonglobe.com/rf/image_r/Boston/2011-2020/2012/04/21/BostonGlobe.com/Sports/Images/mp21pesky1.r.jpg" data-fullsrc="//c.o0bg.com/rf/image_960w/Boston/2011-2020/2012/04/21/BostonGlobe.com/Sports/Images/mp21pesky1.jpg" alt="
"/>
при стандартной настройке адрес парсится вот так:

Код: Выделить всё

https://www.bostonglobe.com/www.bostonglobe.com/rf/image_r/Boston/2011-2020/2012/04/21/BostonGlobe.com/Sports/Images/mp21pesky1.r.jpg
Как видите, домен задваивается и картинка не отображается. как правильно прописать шаблон обработки, чтоб это задваивание домена в адресе убрать? Также большая картинка по коду залита на другой домен. Как ее тоже вытянуть корректно без задваивания?

Зарание огромное вам спасибо и с наступающим!!!

WPGrabber
Администратор
Сообщения: 135
Зарегистрирован: 24 ноя 2015, 22:09
Откуда: СССР
Благодарил (а): 4 раза
Поблагодарили: 5 раз
Контактная информация:

Re: Проблема с адресом картинок

Сообщение WPGrabber » 10 янв 2016, 17:37

В пути файла два слэша src="// плагином обрабатываются как относительный путь, вот он и добавляет доменное имя - добавьте протокол https через доп. шаблоны обработки.

denya090
Участник
Сообщения: 20
Зарегистрирован: 13 дек 2015, 10:29

Re: Проблема с адресом картинок

Сообщение denya090 » 11 янв 2016, 10:08

Да это я понимаю. Я же выше писал. Естественно пытался, но все равно ничего не выходит. Не могу понять, какой должен быть именно шаблон для данной обработки. Там еще картинка на другой домен залита (тоже выше в описании). Я присылал вам ленту почтой, как вы просили в личном сообщении, но ответа так и не получил. Напишите тут пожалуйста, как должен выглядеть этот шаблон обработки для корректного парсинга картинок.

WPGrabber
Администратор
Сообщения: 135
Зарегистрирован: 24 ноя 2015, 22:09
Откуда: СССР
Благодарил (а): 4 раза
Поблагодарили: 5 раз
Контактная информация:

Re: Проблема с адресом картинок

Сообщение WPGrabber » 11 янв 2016, 16:14

Тогда понадобятся как минимум два шаблона обработки, один для вырезания превью картинки:

Код: Выделить всё

src="//www.bostonglobe.com/rf/image_r/Boston/2011-2020/2012/04/21/BostonGlobe.com/Sports/Images/mp21pesky1.r.jpg"
и второй для вывода полноразмерной из:

Код: Выделить всё

data-fullsrc="//c.o0bg.com/rf/image_960w/Boston/2011-2020/2012/04/21/BostonGlobe.com/Sports/Images/mp21pesky1.jpg"
С вырезанием

Код: Выделить всё

data-full
и добавлением протокола перед двумя слэшами. Уж более развернуто не знаю как объяснить, поэкспериментируйте с шаблона обработки.

denya090
Участник
Сообщения: 20
Зарегистрирован: 13 дек 2015, 10:29

Re: Проблема с адресом картинок

Сообщение denya090 » 12 янв 2016, 15:14

Да именно я это и делал! Все равно не получается вытянуть картинки. А тут вы никак не напишите нужные шаблоны обработки? Я думал, данный форум будет по аналогу родного, который закрылся. Где юзерам помогали в сложных лентах админы, выкладывали записи шаблонов обработки, различные интересные и необычные ленты. Получается, вы тут такого не собираетесь делать? Только платные услуги? Как-то несколько непонятно, что именно тогда подразумевает раздел на данном форуме "Настройки лент WPGrabber". Извините, если я не правильно понял его назначение. Просто вот все то, что вы мне выше пишете - вы переписываете мой вопрос своими словами. Естественно, тут нужно 2 шаблона обработки. Естественно, адрес "задваивающегося" домена нужно убрать и оставить только протокол https://. Все это ясно и понятно без любых пояснений. Но не получается никак!!! Донор не стандартный, не хочет ни как работать! Я пытался делать сам, давал друзьям на пробу и даже высылал вам ленту по вашей просьбе к вам на почту. Но ответа на поставленный вопрос так не получил не по почте, не тут, ни от друзей. Обрадовался открытию форума, где могут помочь решать такие проблемы, как ранее на закрывшемся. Но судя по всему, я ошибся с выводами((( Форум в работает несколько в другом режиме и получить помощь можно только платно? Или я что-то не так понимаю?

username
Новичок
Сообщения: 3
Зарегистрирован: 12 янв 2016, 15:24

Re: Проблема с адресом картинок

Сообщение username » 12 янв 2016, 15:26

Вроде решение элементарное. Используйте дополнительную обработку для страницы до парсинга.
Шаблон поиска |src="//|is
Шаблон замены src="https://

denya090
Участник
Сообщения: 20
Зарегистрирован: 13 дек 2015, 10:29

Re: Проблема с адресом картинок

Сообщение denya090 » 12 янв 2016, 20:29

username писал(а):Вроде решение элементарное. Используйте дополнительную обработку для страницы до парсинга.
Шаблон поиска |src="//|is
Шаблон замены src="https://
Огромное вам спасибо! Действительно элементарное решение, я пытался что-то выдумать))).
Ну дальше замена картинки на большую в данном шаблоне - уже дело техники. Оставлю тут и второй шаблон обработки для вытягивания большого фото, может кому пригодится:

Страница контента до парсинга

Код: Выделить всё

|<img  itemprop="contentUrl" src=".*?" data-fullsrc="(.*?)" alt=".*?"/>|is
Шаблон замены

Код: Выделить всё

<img src="$1" />
p.s. Уважаемые админы, не лишайте возможности решать проблемы по лентам, как это было на старом форуме! Именно такие действия и будут привлекать сюда пользователей! Мы же не просим вас тут делать нам халявные ленты и выставлять в топик. Но все же ждем от вас хоть малейшей помощи, раз уж вы открыли данный раздел на форуме, а не элементарных отписок вида "поэкспериментируйте с шаблона обработки". Просто у каждого бывают проблемы различного характера. Вот хочется их решать именно таким способом! Думаю, вы не обидитесь на конструктивную критику.

WPGrabber
Администратор
Сообщения: 135
Зарегистрирован: 24 ноя 2015, 22:09
Откуда: СССР
Благодарил (а): 4 раза
Поблагодарили: 5 раз
Контактная информация:

Re: Проблема с адресом картинок

Сообщение WPGrabber » 13 янв 2016, 06:54

denya090 писал(а):Уважаемые админы, не лишайте возможности решать проблемы по лентам, как это было на старом форуме! Именно такие действия и будут привлекать сюда пользователей! Мы же не просим вас тут делать нам халявные ленты и выставлять в топик. Но все же ждем от вас хоть малейшей помощи, раз уж вы открыли данный раздел на форуме, а не элементарных отписок вида "поэкспериментируйте с шаблона обработки". Просто у каждого бывают проблемы различного характера. Вот хочется их решать именно таким способом! Думаю, вы не обидитесь на конструктивную критику.
Уважаемые пользователи, Форум и создан для ВЗАИМОПОМОЩИ. Лично я ни чем, ни кого не ограничивал и не давал повода для обсуждения действий Админов. Да возможно в моем ответе мало конкретики, но суть и куда копать я объяснил, а вам осталось только сделать самому шаблоны.
Сделав уже более 2000 лент и встречая сложного донора, сам понимаю, что ни *** не понимаю )))
Помогайте друг - другу, а мы в свою очередь дадим подсказку в каком направлении искать.
denya090 писал(а):

Код: Выделить всё

|<img  itemprop="contentUrl" src=".*?" data-fullsrc="(.*?)" alt=".*?"/>|is
Можно чуть проще сделать:

Код: Выделить всё

|<img[^>]+data-fullsrc="(.*?)"[^>]+>|is
ВСЕМ на заметку: Читаем - https://php.net/manual/ru/book.pcre.php

denya090
Участник
Сообщения: 20
Зарегистрирован: 13 дек 2015, 10:29

Re: Проблема с адресом картинок

Сообщение denya090 » 14 янв 2016, 13:36

СПАСИБО!!!

Закрыто