Удаление из html кода пустых абзацев и/или пустых тегов

В этой ветке создаем темы по настройке лент WPGrabber.

Модератор: Admin

Ответить
InfernalRain
Новичок
Сообщения: 4
Зарегистрирован: 30 мар 2020, 16:12

Удаление из html кода пустых абзацев и/или пустых тегов

Сообщение InfernalRain » 10 янв 2021, 13:20

Здравствуйте.
Помогите, пожалуйста, справиться (с казалось бы простой) задачей - удалить из контента пустые теги абзацев.
При парсинге контента отсюда
_https://www.medikforum.ru/beauty/112183-sedina- ... 0-let.html
в контент попадают пустые абзацы.
Пример из теста импорта ленты: http://joxi.ru/n2Yk1R6TbWlw9r
В исходном коде это выглядит так: http://joxi.ru/DmBNG13FJKnvom, http://joxi.ru/82QYapGuwJ0K02

Я пробовал конструкции:

Код: Выделить всё

<p[^>]*?>\s</p>

Код: Выделить всё

<p[^>]*?>\s+</p>

Код: Выделить всё

<p[^>]*?>\s*</p>
Но они не удаляют пустые абзацы

nikola111
Активный участник
Сообщения: 40
Зарегистрирован: 02 июл 2020, 01:52
Поблагодарили: 11 раз

Re: Удаление из html кода пустых абзацев и/или пустых тегов

Сообщение nikola111 » 11 янв 2021, 19:42

Попробуйте убрать обработкой
|<p dir="ltr" style="text-align:justify;"> </p>|is

InfernalRain
Новичок
Сообщения: 4
Зарегистрирован: 30 мар 2020, 16:12

Re: Удаление из html кода пустых абзацев и/или пустых тегов

Сообщение InfernalRain » 12 янв 2021, 15:45

nikola111 писал(а):
11 янв 2021, 19:42
Попробуйте убрать обработкой
|<p dir="ltr" style="text-align:justify;"> </p>|is
На мой взгялд это слишком "примитивный", т.е. не универсальный вариант использования.
Здесь мы указываем явный, применимый только к одной странице, шаблон обработки.
А потребность чистить код от пустых тегов есть и данная обработка ее не решает.

В применении к указанной странице он тоже, увы, не работает.

Ответить