Страница 1 из 1

Не находит заголовок статьи

Добавлено: 03 сен 2016, 15:46
donivill
Настроил ссылки, их прекрасно находит.
Пример страницы:
https://www..forbes..ru/milliardery/324163-operatsiya-likvidatsiya-chem-bogat-mikhail-prokhorov

Перешел к заголовку, название беру отсюда:
<meta name="title" content="Операция «Ликвидация»: чем богат Михаил Прохоров" />

Формула заголовка проста:
<meta name="title" content="(.*?)" />

Результат:
https://www..forbes..ru/milliardery/324163-operatsiya-likvidatsiya-chem-bogat-mikhail-prokhorov"> (50169 Байт) Заголовок не найден!

В чем может быть дело?

Re: Не находит заголовок статьи

Добавлено: 03 сен 2016, 15:54
Admin
Попробуйте: <h1[^>]+>(.*?)</h1>

Re: Не находит заголовок статьи

Добавлено: 03 сен 2016, 15:55
donivill
Вот, на всякий случай, скриншот всех настроек:
Изображение

Re: Не находит заголовок статьи

Добавлено: 03 сен 2016, 15:56
donivill
Admin писал(а):Попробуйте: <h1[^>]+>(.*?)</h1>
Не помогло
Изображение

Re: Не находит заголовок статьи

Добавлено: 03 сен 2016, 16:03
Admin
Попробуйте на вкладке "Дополнительно" плагина включить - Для запросов использовать метод: file_get_contents

Re: Не находит заголовок статьи

Добавлено: 03 сен 2016, 18:05
donivill
Спасибо, заработало!

Re: Не находит заголовок статьи

Добавлено: 27 окт 2016, 09:52
Wind
Добрый день! тоже столкнулся с подобной проблемой.
парсит ссылку правильно, заголовок не видит (
источник view-source:https://www..pppi..ru/news/
заголовки идут вида <h3>бла бла бла</h3>.
При указании в настройках шаблона заголовка <h3>(.*?)</h3> выдает заголовок не найден. Оба предложенных варианта решения пробовал, не помогло..

Загрузка страниц:
https://www..pppi..ru/news/v-stroitelstvo-novogo-porta-v-arhangelske-vlozhat-40-mlrd-rubley (15289 Байт) Заголовок не найден!
Подскажите пожалуйста как решить проблему?

Re: Не находит заголовок статьи

Добавлено: 27 окт 2016, 18:27
Admin
Что то я не увидел в этих статьях тегов типа <h3>. Попробуйте <b class="news-title">(.*?)</b>

Re: Не находит заголовок статьи

Добавлено: 28 окт 2016, 12:42
Wind
:P гм. Еще раз на всякий случай уточню алгоритм работы..
-Задаем страницу с ссылками на статьи которые будут парситься,
-задаем шаблон заголовка, который берется с этой страницы,
-далее переходим на страницу которую будем парсить, из нее вычленяем текст.
Важный момент, я правильно понимаю, что название статьи берется со страницы на которой ссылки? Или же заголовок берется из тела самой статьи?
В любом случае конструкция <b class="news-title">(.*?)</b> работать не хочет.
скриншотики...
донор https://www..pppi..ru/news/

Изображение
исходный код страницы со ссылками:
Изображение

Подчеркнул заголовок.

Re: Не находит заголовок статьи

Добавлено: 29 окт 2016, 04:46
Admin
Заголовок берется из тела самой статьи. Загрузите Вашу ленту для анализа, может что то не так сделали.

Re: Не находит заголовок статьи

Добавлено: 31 окт 2016, 08:51
Wind
Спасибо за отклик, но опять ложная тревога. :?
Пересоздал ленту заново с теми же настройками и все заработало.
А вот про то что заголовок берется из статьи полезная инфа :) как раньше настраивал ленты фиг знает... видимо заголовки одинаково выводились на донорах, поэтому проблем не возникало

Re: Не находит заголовок статьи

Добавлено: 18 апр 2020, 19:14
vitosbbc
Добрый день подскажите пытаюсь спарсить заголовок со статей www.mzso..info/all-news, ссылки определяет, но вот заголовок как бы не пробовал всегда определяет только "Пост | Информпортал МЗ СО"

Re: Не находит заголовок статьи

Добавлено: 18 апр 2020, 20:03
Admin
Вот здесь по моему уже задавали данный вопрос: viewtopic.php?f=5&t=999