Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Скриптовые языки программирования > PHP
Регистрация

Восстановить пароль

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 24.12.2013, 19:34   #1
Viboxjuwin
Пользователь
 
Регистрация: 29.09.2013
Сообщений: 11
По умолчанию Парсинг сайтй

Как можно реализовать парсинг сайта я знаю.
Но можно ли вытянуть вот с этой страницы сайта из вопросы и ответы к себе на сайт?
Ссылка: http://www.9111.ru/answers/daily/2013_12_24/
Viboxjuwin вне форума Ответить с цитированием
Старый 24.12.2013, 19:42   #2
Andkorol
Старожил
 
Регистрация: 31.05.2010
Сообщений: 3,301
По умолчанию

Можно.
Andkorol вне форума Ответить с цитированием
Старый 24.12.2013, 19:53   #3
Viboxjuwin
Пользователь
 
Регистрация: 29.09.2013
Сообщений: 11
По умолчанию

Спасибо, дорогой!)

Хотелось бы как-то обойти условие про ссылку на их сайт...
Может у Вас есть идеи на этот счет?
А что скажете про этот сайт? ССЫЛКА: http://svem.ru/questions/. Здесь как поступить посоветуете?

Я попробовал проработать ситуацию таким образом:

<?php

//откуда будем парсить информацию
$content = iconv("windows-1251", "UTF-8", file_get_contents('http://www.9111.ru/questions/q3121782-ipotechniy-kredit.html'));

// Определяем позицию строки, до которой нужно все отрезать
$pos = strpos($content, '<div id="qcontent" class="question-content__small">');

//Отрезаем все, что идет до нужной нам позиции
$content = substr($content, $pos);

// Точно таким же образом находим позицию конечной строки
$pos = strpos($content, '<br></div>');

// Отрезаем нужное количество символов от нулевого
$content = substr($content, 0, $pos);

//если в тексте встречается текст, который нам не нужен, вырезаем его
$content = str_replace('','', $content);

// выводим спарсенный текст.
echo ($content);

//echo "вставляем сюда завершающий код";



//откуда будем парсить информацию
$content = iconv("windows-1251", "UTF-8", file_get_contents('http://www.9111.ru/questions/q3121782-ipotechniy-kredit.html'));

// Определяем позицию строки, до которой нужно все отрезать
$pos = strpos($content, '<p class="answer__text">');

//Отрезаем все, что идет до нужной нам позиции
$content = substr($content, $pos);

// Точно таким же образом находим позицию конечной строки
$pos = strpos($content, '</p>');

// Отрезаем нужное количество символов от нулевого
$content = substr($content, 0, $pos);

//если в тексте встречается текст, который нам не нужен, вырезаем его
$content = str_replace('','', $content);

// выводим спарсенный текст.
echo ($content);

//echo "вставляем сюда завершающий код";
?>



Где красным - вопрос, синим - ответ. Все отображается, конечно, на моем сайте. Но как мне автоматизировать обновление этого самого контента?
Как-то уникализировать ссылки? Качать блоком?
Ссылка на тот самый сайт: http://www.9111.ru/answers/daily/2013_12_24/

Последний раз редактировалось Stilet; 25.12.2013 в 19:14.
Viboxjuwin вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Парсинг. Fahman Общие вопросы Delphi 1 18.12.2013 15:52
Парсинг nefakt Общие вопросы Delphi 4 04.05.2013 15:18
Парсинг Pearl777 Работа с сетью в Delphi 7 29.04.2013 22:19
Парсинг HSR Общие вопросы Delphi 7 02.02.2013 06:09
Парсинг TranceSmile PHP 7 06.03.2012 01:32