Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Скриптовые языки программирования > PHP
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 29.10.2012, 20:27   #1
EndoCrinolog
Пользователь
 
Регистрация: 23.08.2012
Сообщений: 26
По умолчанию Парсер для стены в ВК

Узнал про парсинг страниц, а также simple html dom.
пытаюсь спарсить со стены группы в ВК все записи. сообщения содержатся в div с классом wall_post_text.
Вот код:
PHP код:
<?php
set_time_limit
(0);

include(
'simple_html_dom.php'); // подключаем библиотеку

//$html = new simple_html_dom(); // создаем объект

$html file_get_html("http://vk.com/wall-24713873?own=1"); //загружаем HTML-код

foreach($html->find(".wall_post_text") as $element)
echo 
"$element->div<br>";
?>
Что я сделал не так? Как вывест содержимое тега?
Тут можно скачать музыку радио Рекорд:
http://www.musicofradiorecord.pusku.com/
EndoCrinolog вне форума Ответить с цитированием
Старый 29.10.2012, 20:59   #2
Кольша
Далеко не
Участник клуба
 
Аватар для Кольша
 
Регистрация: 11.08.2011
Сообщений: 1,512
По умолчанию

Лучше бы простой регуляркой вытащили
Кольша вне форума Ответить с цитированием
Старый 29.10.2012, 21:32   #3
EndoCrinolog
Пользователь
 
Регистрация: 23.08.2012
Сообщений: 26
По умолчанию

а как так? подскажите
Тут можно скачать музыку радио Рекорд:
http://www.musicofradiorecord.pusku.com/
EndoCrinolog вне форума Ответить с цитированием
Старый 29.10.2012, 21:34   #4
Кольша
Далеко не
Участник клуба
 
Аватар для Кольша
 
Регистрация: 11.08.2011
Сообщений: 1,512
По умолчанию

Гугля вам в помощь) просто введите регулярные выражения он вам такое поведает)
Кольша вне форума Ответить с цитированием
Старый 29.10.2012, 22:31   #5
EndoCrinolog
Пользователь
 
Регистрация: 23.08.2012
Сообщений: 26
По умолчанию

не люблю людей, которые отвечают ради +1 к количеству сообщений
Тут можно скачать музыку радио Рекорд:
http://www.musicofradiorecord.pusku.com/
EndoCrinolog вне форума Ответить с цитированием
Старый 29.10.2012, 22:50   #6
LZero
Форумчанин
 
Регистрация: 20.07.2012
Сообщений: 129
По умолчанию

$element->innertext наверное так вместо $element->div
LZero вне форума Ответить с цитированием
Старый 29.10.2012, 22:55   #7
EndoCrinolog
Пользователь
 
Регистрация: 23.08.2012
Сообщений: 26
По умолчанию

из блога по образцу (http://www.interez.ru/archives/88):
PHP код:
<?php

include('simple_html_dom.php'); // подключаем библиотеку


$html file_get_html("http://vk.com/wall-24713873?offset=3140&own=1"); //загружаем HTML-код
foreach($html->find('div[class="wall_post_text"]') as $element){
echo 
$element->plaintext;
echo 
"<hr>";
}
?>
всё равно пустая страница.. попробуйте вы на денвере...

По идее должно работать... у всех - одни и теже классы.. должен считать и вывести тексты
Изображения
Тип файла: jpg div.jpg (102.9 Кб, 77 просмотров)
Тут можно скачать музыку радио Рекорд:
http://www.musicofradiorecord.pusku.com/

Последний раз редактировалось EndoCrinolog; 29.10.2012 в 23:02.
EndoCrinolog вне форума Ответить с цитированием
Старый 29.10.2012, 23:42   #8
LZero
Форумчанин
 
Регистрация: 20.07.2012
Сообщений: 129
По умолчанию

Как я понял, таким способом отдает мобильную версию. Нужно передать юзер-агент правильный.
LZero вне форума Ответить с цитированием
Старый 30.10.2012, 00:11   #9
LZero
Форумчанин
 
Регистрация: 20.07.2012
Сообщений: 129
По умолчанию

PHP код:
<?php

include('simple_html_dom.php'); // подключаем библиотеку

$context = array(
    
'http' => array(
        
'user_agent' => 'Mozilla/5.0 (Windows NT 6.0; rv:16.0) Gecko/20100101 Firefox/16.0'
    
)
);

$html file_get_html("http://vk.com/wall-24713873?offset=3140&own=1"falsestream_context_create($context)); //загружаем HTML-код

foreach($html->find('div[class="wall_post_text"]') as $element){
    echo 
$element->plaintext;
    echo 
"<hr>";
}
LZero вне форума Ответить с цитированием
Старый 30.10.2012, 15:55   #10
EndoCrinolog
Пользователь
 
Регистрация: 23.08.2012
Сообщений: 26
По умолчанию

Вот что выдал:
Цитата:
Fatal error: Cannot redeclare file_get_html() (previously declared in V:\home\parser.ru\www\simple_html_d om.php:36) in V:\home\parser.ru\www\simple_html_d om.php on line 41
Тут можно скачать музыку радио Рекорд:
http://www.musicofradiorecord.pusku.com/
EndoCrinolog вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
парсер для HTML страниц OLEG'arh C# (си шарп) 3 19.01.2012 22:26
Продам парсер для фриланса. TwiX Фриланс 10 31.10.2011 15:43
Нужен парсер для торента mazahaka14 Фриланс 3 09.10.2011 08:40
Парсер для доски объвлений Shanti Помощь студентам 4 15.03.2011 22:49
Парсер для Java Marx88 Общие вопросы по Java, Java SE, Kotlin 0 01.03.2010 02:36