Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Java программирование > Общие вопросы по Java, Java SE, Kotlin
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 05.07.2009, 10:39   #1
SuperOrange
 
Регистрация: 04.07.2009
Сообщений: 4
По умолчанию Как получить содержимое веб страницы?

Помогите пожалуйста, задача такая: даётся веб ссылка, мне необходимо получить количество и список ссылок на этой странице. Пока что получается вот что:
Код:
    public static void main(String[] args) throws MalformedURLException, IOException {
        String S;
        try {
            if (args.length>0) {
                S=args[0].toString();
            } else {
                S="http://mail.ru:80";
            }
        } catch (Exception E) {
            S="http://mail.ru:80";
        }

        URL hp = new URL(S);
        System.out.println("Protocol:   " + hp.getProtocol());
        System.out.println("Port:       " + hp.getPort());
        System.out.println("Host:       " + hp.getHost());
        System.out.println("File:       " + hp.getFile());
        System.out.println("Ext:        " + hp.toExternalForm());
        URLConnection hpCon = hp.openConnection();
        hpCon.connect();
        System.out.println("Date:   " + new Date(hpCon.getDate()));
        System.out.println("Type:   " + hpCon.getContentType());
        System.out.println("Exp:    " + hpCon.getExpiration());
        System.out.println("Last M: " + hpCon.getLastModified());
        System.out.println("Length: " + hpCon.getContentLength());
        if (hpCon.getContentLength() > 0) {
            System.out.println("=== Content ===");
            InputStream input = hpCon.getInputStream();
            int i=hpCon.getContentLength();
            int c;
            while (((c = input. read()) != -1) && (--i > 0)) {
                System.out.print((char) c);
            }
            input.close();
        } else {
            System.out.println("No Content Available");
        }
    }
Проблема заключается в том что почему то не все ссылки обрабатываются. Выдаёт
Код:
D:\>java MainProject http://forum.vingrad.ru/faq/act-Post/CODE-00/f-104/syntax-java.html
Protocol:   http
Port:       -1
Host:       forum.vingrad.ru
File:       /faq/act-Post/CODE-00/f-104/syntax-java.html
Ext:        http://forum.vingrad.ru/faq/act-Post/CODE-00/f-104/syntax-java.html
Date:   Sat Jul 04 22:28:23 EEST 2009
Type:   text/html; charset=UTF-8
Exp:    1246742903000
Last M: 0
Length: -1
No Content Available
Подскажите в чём проблема и что делать ?
Заранее спасибо.
SuperOrange вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Как получить параметры некоторых компонентов страницы в Webbrowser postal2 Работа с сетью в Delphi 0 02.04.2009 20:15
Как программно на делфи, запихнуть текст в форму веб-страницы ? Alexandrrrr Общие вопросы Delphi 3 29.03.2009 16:07
Картинка из веб страницы vinixp Мультимедиа в Delphi 9 17.02.2009 19:33
Как получить содержимое папки ? - fenix - Помощь студентам 4 19.04.2008 06:25