Не находит заголовок статьи

В этой ветке создаем темы по настройке лент WPGrabber.

Модератор: Admin

Ответить
donivill
Новичок
Сообщения: 6
Зарегистрирован: 03 сен 2016, 15:42

Не находит заголовок статьи

Сообщение donivill » 03 сен 2016, 15:46

Настроил ссылки, их прекрасно находит.
Пример страницы:
https://www..forbes..ru/milliardery/324163-operatsiya-likvidatsiya-chem-bogat-mikhail-prokhorov

Перешел к заголовку, название беру отсюда:
<meta name="title" content="Операция «Ликвидация»: чем богат Михаил Прохоров" />

Формула заголовка проста:
<meta name="title" content="(.*?)" />

Результат:
https://www..forbes..ru/milliardery/324163-operatsiya-likvidatsiya-chem-bogat-mikhail-prokhorov"> (50169 Байт) Заголовок не найден!

В чем может быть дело?

Аватара пользователя
Admin
Администратор
Сообщения: 578
Зарегистрирован: 22 ноя 2015, 12:18
Откуда: СССР
Благодарил (а): 48 раз
Поблагодарили: 20 раз
Контактная информация:

Re: Не находит заголовок статьи

Сообщение Admin » 03 сен 2016, 15:54

Попробуйте: <h1[^>]+>(.*?)</h1>
Главная часть любого оружия, есть голова его владельца. Заказ лент WPGrabber

donivill
Новичок
Сообщения: 6
Зарегистрирован: 03 сен 2016, 15:42

Re: Не находит заголовок статьи

Сообщение donivill » 03 сен 2016, 15:55

Вот, на всякий случай, скриншот всех настроек:
Изображение

donivill
Новичок
Сообщения: 6
Зарегистрирован: 03 сен 2016, 15:42

Re: Не находит заголовок статьи

Сообщение donivill » 03 сен 2016, 15:56

Admin писал(а):Попробуйте: <h1[^>]+>(.*?)</h1>
Не помогло
Изображение

Аватара пользователя
Admin
Администратор
Сообщения: 578
Зарегистрирован: 22 ноя 2015, 12:18
Откуда: СССР
Благодарил (а): 48 раз
Поблагодарили: 20 раз
Контактная информация:

Re: Не находит заголовок статьи

Сообщение Admin » 03 сен 2016, 16:03

Попробуйте на вкладке "Дополнительно" плагина включить - Для запросов использовать метод: file_get_contents
Главная часть любого оружия, есть голова его владельца. Заказ лент WPGrabber

donivill
Новичок
Сообщения: 6
Зарегистрирован: 03 сен 2016, 15:42

Re: Не находит заголовок статьи

Сообщение donivill » 03 сен 2016, 18:05

Спасибо, заработало!

Wind
Участник
Сообщения: 15
Зарегистрирован: 24 фев 2016, 20:24

Re: Не находит заголовок статьи

Сообщение Wind » 27 окт 2016, 09:52

Добрый день! тоже столкнулся с подобной проблемой.
парсит ссылку правильно, заголовок не видит (
источник view-source:https://www..pppi..ru/news/
заголовки идут вида <h3>бла бла бла</h3>.
При указании в настройках шаблона заголовка <h3>(.*?)</h3> выдает заголовок не найден. Оба предложенных варианта решения пробовал, не помогло..

Загрузка страниц:
https://www..pppi..ru/news/v-stroitelstvo-novogo-porta-v-arhangelske-vlozhat-40-mlrd-rubley (15289 Байт) Заголовок не найден!
Подскажите пожалуйста как решить проблему?

Аватара пользователя
Admin
Администратор
Сообщения: 578
Зарегистрирован: 22 ноя 2015, 12:18
Откуда: СССР
Благодарил (а): 48 раз
Поблагодарили: 20 раз
Контактная информация:

Re: Не находит заголовок статьи

Сообщение Admin » 27 окт 2016, 18:27

Что то я не увидел в этих статьях тегов типа <h3>. Попробуйте <b class="news-title">(.*?)</b>
Главная часть любого оружия, есть голова его владельца. Заказ лент WPGrabber

Wind
Участник
Сообщения: 15
Зарегистрирован: 24 фев 2016, 20:24

Re: Не находит заголовок статьи

Сообщение Wind » 28 окт 2016, 12:42

:P гм. Еще раз на всякий случай уточню алгоритм работы..
-Задаем страницу с ссылками на статьи которые будут парситься,
-задаем шаблон заголовка, который берется с этой страницы,
-далее переходим на страницу которую будем парсить, из нее вычленяем текст.
Важный момент, я правильно понимаю, что название статьи берется со страницы на которой ссылки? Или же заголовок берется из тела самой статьи?
В любом случае конструкция <b class="news-title">(.*?)</b> работать не хочет.
скриншотики...
донор https://www..pppi..ru/news/

Изображение
исходный код страницы со ссылками:
Изображение

Подчеркнул заголовок.

Аватара пользователя
Admin
Администратор
Сообщения: 578
Зарегистрирован: 22 ноя 2015, 12:18
Откуда: СССР
Благодарил (а): 48 раз
Поблагодарили: 20 раз
Контактная информация:

Re: Не находит заголовок статьи

Сообщение Admin » 29 окт 2016, 04:46

Заголовок берется из тела самой статьи. Загрузите Вашу ленту для анализа, может что то не так сделали.
Главная часть любого оружия, есть голова его владельца. Заказ лент WPGrabber

Wind
Участник
Сообщения: 15
Зарегистрирован: 24 фев 2016, 20:24

Re: Не находит заголовок статьи

Сообщение Wind » 31 окт 2016, 08:51

Спасибо за отклик, но опять ложная тревога. :?
Пересоздал ленту заново с теми же настройками и все заработало.
А вот про то что заголовок берется из статьи полезная инфа :) как раньше настраивал ленты фиг знает... видимо заголовки одинаково выводились на донорах, поэтому проблем не возникало

vitosbbc
Новичок
Сообщения: 7
Зарегистрирован: 18 апр 2020, 19:08

Re: Не находит заголовок статьи

Сообщение vitosbbc » 18 апр 2020, 19:14

Добрый день подскажите пытаюсь спарсить заголовок со статей www.mzso..info/all-news, ссылки определяет, но вот заголовок как бы не пробовал всегда определяет только "Пост | Информпортал МЗ СО"
Вложения
Безымянный.png
Безымянный.png (54.07 КБ) 10640 просмотров

Аватара пользователя
Admin
Администратор
Сообщения: 578
Зарегистрирован: 22 ноя 2015, 12:18
Откуда: СССР
Благодарил (а): 48 раз
Поблагодарили: 20 раз
Контактная информация:

Re: Не находит заголовок статьи

Сообщение Admin » 18 апр 2020, 20:03

Вот здесь по моему уже задавали данный вопрос: viewtopic.php?f=5&t=999
Главная часть любого оружия, есть голова его владельца. Заказ лент WPGrabber

Ответить