Текст не найден. Почему?

В этой ветке создаем темы по настройке лент WPGrabber.

Модератор: Admin

Ответить
alexwebmasster
Участник
Сообщения: 11
Зарегистрирован: 23 июл 2016, 11:00

Текст не найден. Почему?

Сообщение alexwebmasster » 14 авг 2016, 16:38

Вот к примеру донорская страница https://www.simferopol.info/news/681574/ Вот кусок кода в котором полный текст и картинка.

Код: Выделить всё

 <div class="news_img">
                                                <img width="1000" src="https://img-fotki.yandex.ru/get/131107/267681572.17c/0_351224_881f1e05_orig" class="news_item_photo">
						<meta property="og:image" content="https://img-fotki.yandex.ru/get/131107/267681572.17c/0_351224_881f1e05_orig.jpg"/>                    </div>
                				<div class="clear"></div>
				<br/>
                				<div class="news_item_text">
					<p>Председатель Государственного Совета  Республики Крым Владимир Константинов в преддверии празднования Дня  строителя поздравил работников и ветеранов отрасли с их профессиональным  праздником.<br/> <br/> По словам главы крымского парламента, профессия строителя во все времена была и остается самой почетной и востребованной.</p>
<p>&laquo;Работа по преобразованию Крыма находится в  активной фазе. Республика строится, и отрасль восстанавливает утраченные  в период экономического кризиса 2008 года позиции. Уверен, на ближайшие  пять лет перспективы хорошие, и став локомотивом республиканской  экономики, строительство в Крыму еще долгие годы будет демонстрировать  уверенные темпы роста&raquo;, &ndash; отметил глава законодательной власти  республики. <br/> <br/> Владимир Константинов пожелал всем присутствующим реализации намеченных  планов и новых достижений на выбранном пути, а также вручил заслуженные  награды.</p>				</div>
			



				

							<div class="sn_title">Похожие новости</div>
Вот мои настройки и сообщение о том что текст не найден.
:?: :?: :?:
wpgrabber_pro0.png
wpgrabber_pro0.png (77.37 КБ) 1873 просмотра
:?: :?: :?:
Прошу слезно объяснить, почему так происходит? На одних сайтах делая примерно тоже-самое все работает, а на других не работает. Логику не пойму.

alexwebmasster
Участник
Сообщения: 11
Зарегистрирован: 23 июл 2016, 11:00

Re: Текст не найден. Почему?

Сообщение alexwebmasster » 15 авг 2016, 09:42

Объясните хоть кто-то, что я не правильно делаю?

arrow31
Сообщения: 2
Зарегистрирован: 16 авг 2016, 14:01

Re: Текст не найден. Почему?

Сообщение arrow31 » 16 авг 2016, 15:20

:!: :!: :!:
wpgrabber_pro.png
wpgrabber_pro.png (29.26 КБ) 1873 просмотра

rogodessa
Новичок
Сообщения: 3
Зарегистрирован: 20 май 2016, 22:45

Re: Текст не найден. Почему?

Сообщение rogodessa » 17 авг 2016, 00:35

Потому что... неверные настройки ))

1. Не указана кодировка. Должна быть windows-1251
2. Проблема в шаблоне ссылок. Обратите внимание на разницу, например, для этой ссылки _https://www.simferopol.info/news/681624/ и _https://www.simferopol.info/news/681624 - т.е. первая со слешем в конце вторая нет. На данном сайте не настроен 301 редирект страниц без слеша в конце на страницы со слешем. По второй ссылке, соответственно, и не будет найден контент, т.к. это уже будет страница категории /news/ Чтобы избегать подобных проблем слеш в шаблоне ссылок всегда нужно экранировать, т.к. в регулярных выражениях он является разделителем (https://php.net/manual/ru/regexp.referen ... miters.php).

Настройки для вашей ленты
sim-info-set.png
sim-info-set.png (24.83 КБ) 2413 просмотров
Как-то так )

arrow31
Сообщения: 2
Зарегистрирован: 16 авг 2016, 14:01

Re: Текст не найден. Почему?

Сообщение arrow31 » 17 авг 2016, 18:20

rogodessa писал(а): Чтобы избегать подобных проблем слеш в шаблоне ссылок всегда нужно экранировать, т.к. в регулярных выражениях он является разделителем).
не знал что слеш нужно экранировать, у вас у обоих в примерах часть регулярки \/S{6}, чем отличается заглавная S от s? Хотя мой пример тоже работает

alexwebmasster
Участник
Сообщения: 11
Зарегистрирован: 23 июл 2016, 11:00

Re: Текст не найден. Почему?

Сообщение alexwebmasster » 17 авг 2016, 21:57

Огромное человеческое спасибо! малый опыт настройки лент сказывается, из-за такой мелочи застопорился.)
не знал что слеш нужно экранировать, у вас у обоих в примерах часть регулярки \/S{6}, чем отличается заглавная S от s? Хотя мой пример тоже работает
[\s\S] (все пробельные и непробельные символы, включая символ новой строки)

rogodessa
Новичок
Сообщения: 3
Зарегистрирован: 20 май 2016, 22:45

Re: Текст не найден. Почему?

Сообщение rogodessa » 17 авг 2016, 23:42

arrow31 писал(а): не знал что слеш нужно экранировать, у вас у обоих в примерах часть регулярки \/S{6}, чем отличается заглавная S от s? Хотя мой пример тоже работает
Когда писал свой ответ, ваш еще не прошел модерацию ) Я обычно тоже использую d, w или их комбинацию. Слеш экранировать не панацея, но так правильнее ;)

WPGrabber
Администратор
Сообщения: 135
Зарегистрирован: 24 ноя 2015, 22:09
Откуда: СССР
Благодарил (а): 4 раза
Поблагодарили: 5 раз
Контактная информация:

Re: Текст не найден. Почему?

Сообщение WPGrabber » 18 авг 2016, 06:32

rogodessa писал(а):Когда писал свой ответ, ваш еще не прошел модерацию ) Я обычно тоже использую d, w или их комбинацию. Слеш экранировать не панацея, но так правильнее ;)
Это верно замечено правильнее использовать их, но комбинации к примеру:

Код: Выделить всё

([\w\d]) и ([\w])
практически приведут к одному и тому же ответу, а вот подобные:

Код: Выделить всё

([\w]) и ([\w\D])
дают абсолютно другой эффект.

WPGrabber
Администратор
Сообщения: 135
Зарегистрирован: 24 ноя 2015, 22:09
Откуда: СССР
Благодарил (а): 4 раза
Поблагодарили: 5 раз
Контактная информация:

Re: Текст не найден. Почему?

Сообщение WPGrabber » 18 авг 2016, 06:38

arrow31 писал(а):не знал что слеш нужно экранировать, у вас у обоих в примерах часть регулярки \/S{6}, чем отличается заглавная S от s? Хотя мой пример тоже работает
В WPGrabber'е немного по другому, если вы не экранируете слэш, то это не приведет к фатальной ошибке и максимум выдаст предупреждение, а вот неэкранированный обратный слэш (иногда встречается в исходном коде и не путайте со служебными символами которые нужно экранировать всегда) может привести к неработоспособности всего выражения.

Ответить