Почему вырезание подписи не работает?
Добавлено: 21 мар 2022, 21:00
Здравствуйте!
Столкнулся со странной ситуацией при парсинге контента https://www[дот]royalcourt[дот]no/nyhet.html?tid=204365&sek=27262
Пытаюсь удалить подписи к картинкам. Кусок исходника:
Хочу превратить в
Если в закладке Обработка для "страница контента до парсинга" использовать:
искать: ~(<img.*?>)<span.*?>.*?<\/span>~is
заменить на: $1
То работает удаляет внутренний span.
Если пытаюсь убрать все span-ы, введя:
искать:~<span.*?><img.*?src=["'](.*?)["'].*?alt=["'](.*?)["'].*?><span>.*?<\/span><\/span>~si
заменить на: <img src="$1" alt="$2">
То получаю пустую страницу.
Что здесь не так?
Столкнулся со странной ситуацией при парсинге контента https://www[дот]royalcourt[дот]no/nyhet.html?tid=204365&sek=27262
Пытаюсь удалить подписи к картинкам. Кусок исходника:
Код: Выделить всё
<p><span id="бла-бла-бла" class="бла-бла-бла"><img src="бла-бла-бла?geometry=680x1280[color=#FF0000]>[/color]" alt="бла-бла-бла" aria-hidden='true'/><span>бла-бла-бла</span></span></p>
Код: Выделить всё
<img src="бла-бла-бла?geometry=680x1280>" alt="бла-бла-бла">
искать: ~(<img.*?>)<span.*?>.*?<\/span>~is
заменить на: $1
То работает удаляет внутренний span.
Если пытаюсь убрать все span-ы, введя:
искать:~<span.*?><img.*?src=["'](.*?)["'].*?alt=["'](.*?)["'].*?><span>.*?<\/span><\/span>~si
заменить на: <img src="$1" alt="$2">
То получаю пустую страницу.
Что здесь не так?