Форум программистов
 
О проблемах, например, с регистрацией пишите сюда - alarforum@yandex.ru, проверяйте папку спам! Обязательно пройдите активизацию e-mail, а тут можно восстановить пароль.

Вернуться   Форум программистов > Скриптовые языки программирования > Ruby
Регистрация

Восстановить пароль
Повторная активизация e-mail

Здесь нужно купить рекламу за 20 тыс руб в месяц! ) пишите сюда - alarforum@yandex.ru
Без учёта ботов - 20000 человек в день, 350000 в месяц.

Ответ
 
Опции темы
Старый 14.03.2019, 09:50   #1
WhiteChapel
 
Регистрация: 06.03.2019
Сообщений: 5
По умолчанию Rubyпарсинг сайтов

Добрый день! Начал недавно изучать Ruby, и естественно не за что серьёзное пока не брался. Возникла ситуация, надо сделать задание, но в связи с низким уровнем знаний возникли сложности в процессе выполнения. Укажите пожалуйста на что обратить внимание и подскажите хорошую литературу где я смогу разобраться в своём вопросе! Спасибо.
ЗАДАНИЕ:
Надо написать скрипт. На входе: ссылка сайта и имя файла в который будет записан результат. Для скачивания нужно использовать Curb, для парсинга nokogiri, для обработки xpath, для записи модуль csv.
ЧТО СМОГ СДЕЛАТЬ Я:

Код:
require 'open-uri'
require 'nokogiri'
require 'csv'

url = 'http://www.petsonic.com/snacks-huesos-para-perros'
html = open(url)

CSV.open("data.csv","w") do |tempname,tempPrice|

doc = Nokogiri::HTML(html)

names = []
doc.xpath('//*[@class = "attribute_list"]/*' ).each do |row|


  tempName = row.at_xpath('//span[@class = "attribute_name"]').text.strip
  tempPrice = row.at_xpath('//span[@class = "attribute_price"]').text.strip

  names.push(
    name: tempName,
    price: tempPrice
  )
end

puts names

Последний раз редактировалось Аватар; 14.03.2019 в 10:02.
WhiteChapel вне форума Ответить с цитированием
Старый 14.03.2019, 10:05   #2
Alex11223
Заблокирован
 
Регистрация: 12.01.2011
Сообщений: 19,504
По умолчанию

А вопрос-то какой?
Alex11223 вне форума Ответить с цитированием
Старый 14.03.2019, 10:13   #3
WhiteChapel
 
Регистрация: 06.03.2019
Сообщений: 5
По умолчанию

Нужно написать скрипт на Ruby, для сбора информации. Программа получает на вход:
a. ссылка на страницу категории (может передаваться любая категория сайта)
b. имя файла в который будет записан результат
После отработки скрипта результаты записывает в выходной файл с заданными именем. Для скачивания нужно использовать Curb, для парсинга nokogiri, для обработки xpath, для записи модуль csv.
Вопрос в том как мне реализовать задание, отталкиваясь от того что я имею? В том ли направлении я иду?
WhiteChapel вне форума Ответить с цитированием
Ответ

Здесь нужно купить рекламу за 20 тыс руб в месяц! ) пишите сюда - alarforum@yandex.ru
Без учёта ботов - 20000 человек в день, 350000 в месяц.

Опции темы


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Верстка сайтов Ромыч Помощь студентам 1 07.05.2008 16:31


Проекты отопления, пеллетные котлы, бойлеры, радиаторы
интернет магазин respective.ru
Пеллетный котёл Emtas
котлы EMTAS