Парсинг закодированного текста вида \u0414\u043b\u044f \u043f\u043e

В этой ветке создаем темы по настройке лент WPGrabber.

Модератор: Admin

Ответить
zagruz
Новичок
Сообщения: 7
Зарегистрирован: 29 дек 2019, 19:19

Парсинг закодированного текста вида \u0414\u043b\u044f \u043f\u043e

Сообщение zagruz » 31 дек 2019, 13:04

С Наступающим Новым годом!

Наверное кто-то сталкивался с данной ситуацией. Есть вот это:

Код: Выделить всё

<p>
  <div class="noindex_replace" id="noindexbe87205981f4b07e99dcebdbbd1fce76"></div><script>var noindexbe87205981f4b07e99dcebdbbd1fce76 = "\u0414\u043b\u044f \u043f\u043e\u043b\u0443\u0447\u0435\u043d\u0438\u044f \u0434\u0435\u043d\u0435\u0436\u043d\u043e\u0433\u043e \u043f\u043e\u0441\u043e\u0431\u0438\u044f \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u043e \u043e\u0431\u0440\u0430\u0442\u0438\u0442\u044c\u0441\u044f \u0432 \u041c\u0424\u0426 \u043f\u043e \u043c\u0435\u0441\u0442\u0443 \u0436\u0438\u0442\u0435\u043b\u044c\u0441\u0442\u0432\u0430 \u0438 \u043f\u0440\u0435\u0434\u044a\u044f\u0432\u0438\u0442\u044c \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u0435 \u0434\u043e\u043a\u0443\u043c\u0435\u043d\u0442\u044b: "; document.getElementById("noindexbe87205981f4b07e99dcebdbbd1fce76").innerHTML = noindexbe87205981f4b07e99dcebdbbd1fce76; </script>
</p>
Нужно спарсить закодированный текст. WPGrabber выдает только теги p, текст же отсутствует.
Надеюсь на вашу помощь.

Аватара пользователя
Admin
Администратор
Сообщения: 578
Зарегистрирован: 22 ноя 2015, 12:18
Откуда: СССР
Благодарил (а): 48 раз
Поблагодарили: 20 раз
Контактная информация:

Re: Парсинг закодированного текста вида \u0414\u043b\u044f \u043f\u043e

Сообщение Admin » 13 апр 2020, 17:43

А картинку можно глянуть? Как то не совсем понятно то что вы здесь отобразили.
Главная часть любого оружия, есть голова его владельца. Заказ лент WPGrabber

zagruz
Новичок
Сообщения: 7
Зарегистрирован: 29 дек 2019, 19:19

Re: Парсинг закодированного текста вида \u0414\u043b\u044f \u043f\u043e

Сообщение zagruz » 02 июн 2020, 21:54

например в коде страницы https: //udmurt.media/news/ekonomika-i-finansy/83551/
Середина текста закодирована
----------------------------
<div class="incut__text">Этот орган утвержден распоряжением председателя правительства региона Ярослава Семенова</div>
</div>

<p>Цель рабочей группы — контроль за выплатами медицинским работникам, участвующим в оказании медпомощи гражданам с выявленным коронавирусом. </p>

<p>
<div class="noindex_replace" id="noindex291d726f8823bc93e2b4d686a63488bb"></div><script>var noindex291d726f8823bc93e2b4d686a63488bb = "\u0412 \u0440\u0430\u0431\u043e\u0447\u0443\u044e \u0433\u0440\u0443\u043f\u043f\u0443 \u0432\u043e\u0448\u043b\u0438 \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u0438\u0442\u0435\u043b\u0438 \u043f\u0440\u0430\u0432\u0438\u0442\u0435\u043b\u044c\u0441\u0442\u0432\u0430 \u0423\u0434\u043c\u0443\u0440\u0442\u0438\u0438, \u041c\u0412\u0414 \u043f\u043e \u0440\u0435\u0441\u043f\u0443\u0431\u043b\u0438\u043a\u0435, \u0421\u043b\u0435\u0434\u0441\u0442\u0432\u0435\u043d\u043d\u043e\u0433\u043e \u0443\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u0438\u044f \u0421\u041a \u043f\u043e \u0423\u0434\u043c\u0443\u0440\u0442\u0438\u0438, \u043f\u0440\u043e\u043a\u0443\u0440\u0430\u0442\u0443\u0440\u044b \u0440\u0435\u0433\u0438\u043e\u043d\u0430, \u0413\u043e\u0441\u0443\u0434\u0430\u0440\u0441\u0442\u0432\u0435\u043d\u043d\u043e\u0433\u043e \u0421\u043e\u0432\u0435\u0442\u0430 \u0423\u0420, \u0430 \u0442\u0430\u043a\u0436\u0435 \u041e\u041d\u0424 \u0438 \u0423\u0420\u041e \u043f\u0440\u043e\u0444\u0441\u043e\u044e\u0437\u0430 \u0440\u0430\u0431\u043e\u0442\u043d\u0438\u043a\u043e\u0432 \u0437\u0434\u0440\u0430\u0432\u043e\u043e\u0445\u0440\u0430\u043d\u0435\u043d\u0438\u044f \u0420\u043e\u0441\u0441\u0438\u0438. "; document.getElementById("noindex291d726f8823bc93e2b4d686a63488bb").innerHTML = noindex291d726f8823bc93e2b4d686a63488bb; </script>
</p>

<div class="incut" style="width: 100%;">
<div class="incut__text">Такие группы будут созданы во всех муниципальных образованиях</div>
</div>

Аватара пользователя
Admin
Администратор
Сообщения: 578
Зарегистрирован: 22 ноя 2015, 12:18
Откуда: СССР
Благодарил (а): 48 раз
Поблагодарили: 20 раз
Контактная информация:

Re: Парсинг закодированного текста вида \u0414\u043b\u044f \u043f\u043e

Сообщение Admin » 03 июн 2020, 20:16

Данными настройками не пробовали воспользоваться?
:?: :?: :?:
script-wpgrabber.png
script-wpgrabber.png (16.5 КБ) 9910 просмотров
Главная часть любого оружия, есть голова его владельца. Заказ лент WPGrabber

zagruz
Новичок
Сообщения: 7
Зарегистрирован: 29 дек 2019, 19:19

Re: Парсинг закодированного текста вида \u0414\u043b\u044f \u043f\u043e

Сообщение zagruz » 03 июн 2020, 22:28

Спасибо. Попробую.
Тяжело мне дается эта наука... В основном методом научного тыка. Мозги уже не те - мне под 50 :)

Аватара пользователя
Admin
Администратор
Сообщения: 578
Зарегистрирован: 22 ноя 2015, 12:18
Откуда: СССР
Благодарил (а): 48 раз
Поблагодарили: 20 раз
Контактная информация:

Re: Парсинг закодированного текста вида \u0414\u043b\u044f \u043f\u043e

Сообщение Admin » 04 июн 2020, 05:24

Понятное дело, плагин WPGrabber не простой, да и практически все источники имеют свои особенности, под которые необходимо подбирать индивидуальные настройки. Здесь даже молодежь такое чудит....
Но лучше данного плагина в сети еще пока ничего нет...
Главная часть любого оружия, есть голова его владельца. Заказ лент WPGrabber

Ответить