|
|
Регистрация Восстановить пароль |
Повторная активизация e-mail |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
|
Опции темы | Поиск в этой теме |
05.11.2010, 20:26 | #1 |
Пользователь
Регистрация: 28.10.2009
Сообщений: 38
|
Загрузка в Excel html-страниц, ошибки при загрузке и как их побороть
Всем доброго дня!
Прошу помощи в решении такой задачки: есть несколько сотен файлов *.asp (пример во вложении) из которых я хочу достать данные при промщи скрипта. При загрузке файла *.asp в Excel вылезает сообщение: "Ошибки во время загрузки", в котором написано следующее: При загрузке были обнаружены ошибки в следующих областях: Отсутствующий файл: H:\css\base.css?30 Отсутствующий файл: H:\css\jquery-ui-1.8.custom.css Отсутствующий файл: Н:\css\jquery.autocomplete.css?1 Отсутствующий файл: Н:\css\jquery.cluetip.css?1 Текстовый просмотр файла *.asp показал, что в самом начале файла есть содержатся строки: <link type="text/css" rel="stylesheet" href="/css/base.css?30" /> <link type="text/css" rel="stylesheet" href="/css/jquery-ui-1.8.custom.css" /> <link type="text/css" rel="stylesheet" href="/css/jquery.autocomplete.css?1" /> <link type="text/css" rel="stylesheet" href="/css/jquery.cluetip.css?1" /> Также ссылки на эти таблицы стилей содержатся и ниже по файлу. Так как файлов более 100, и загрузка каждого из них происходит около 30 (!!!) секунд, я не могу позволить себе сидеть рядом с компьютером и нажимать "ОК" всякий раз, когда выскочит предупреждение, однако, при удалении этих строк, загрузка происходит также долго, но без ошибок. Поэтому я решил для начала загрузить все файлы как текст, удалить строки <link type="text/css" rel="stylesheet" href="/css/base.css?30" /> <link type="text/css" rel="stylesheet" href="/css/jquery-ui-1.8.custom.css" /> <link type="text/css" rel="stylesheet" href="/css/jquery.autocomplete.css?1" /> <link type="text/css" rel="stylesheet" href="/css/jquery.cluetip.css?1" /> сохранить файлы, а потом загрузить их повторно и достать нужные мне данные. Я пишу такой код: Код:
Моя конечная цель - достать данные из таблиц, что лежат в *.asp Если можно загрузить *.asp оптом без какой бы то ни было конвертации, игнорируя ошибку недостающих таблиц стилей, то я буду рад и бесконечно счастлив!!! Прошу помощи в решении этой задачи. Если попутно мне объяснят, почему не работает OpenText - будет вообще супер. PS В приведённом мною коде написано: Код:
Код:
Объясните, что я делаю не так. Почему надо ставить индекс для прохода массива? |
05.11.2010, 22:15 | #2 |
Старожил
Регистрация: 02.05.2009
Сообщений: 3,907
|
А что взять надо,таблицу с грузом
Анализ,обработка данных Недорого
|
05.11.2010, 22:17 | #3 |
Пользователь
Регистрация: 28.10.2009
Сообщений: 38
|
Ну да, её.
|
05.11.2010, 22:40 | #4 |
Программист VBA
СуперМодератор
Регистрация: 13.07.2008
Сообщений: 6,856
|
А какие данные из этих файлов надо достать?
Можно, по идее, вообще не открывать эти файлы в Excel - можно выдрать нужные данные при помощи парсинга ваших ASP как текстовых файлов. Но это долго и сложно - немного проще формировать временные файлы ASP, макросом удаляя ВСЁ лишнее (а не только ссылки на таблицы стилей) Покажите на примере, какие данные нужно вытянуть - возможно, получится обойтись несколькими строками кода. Посмотрите готовое решение для парсинга сайтов и файлов HTML http://excelvba.ru/programmes/Parser
__Полезные надстройки для Excel. Парсинг сайтов и файлов.
Макросы любой сложности на заказ. Мониторинг цен конкурентов Последний раз редактировалось EducatedFool; 04.11.2016 в 07:36. |
05.11.2010, 22:50 | #5 |
Пользователь
Регистрация: 28.10.2009
Сообщений: 38
|
Каждый из ASP содержит таблицу с грузом.
Надо вынуть эту таблицу. |
05.11.2010, 23:04 | #6 |
Старожил
Регистрация: 02.05.2009
Сообщений: 3,907
|
Я думаю функцию сможете применить
Проще открыть потом файл HTML в Excel для извлечения таблицы. Код:
Анализ,обработка данных Недорого
|
05.11.2010, 23:17 | #7 |
Пользователь
Регистрация: 28.10.2009
Сообщений: 38
|
doober
Спасибо, попробую. |
06.11.2010, 14:50 | #8 |
Пользователь
Регистрация: 28.10.2009
Сообщений: 38
|
doober
Спасибо, работает. Схема, правда, получается двухпроходной: - сперва парсинг ASP в HTML - потом загрузка из HTML В связи с этим вопрос: допустим, я конвертировал 150 файлов, потом мне надо конвертировать ещё 10, которые свалились в этот же каталог. Вот этот кусок кода: Код:
|
06.11.2010, 14:55 | #9 | |
Старожил
Регистрация: 02.05.2009
Сообщений: 3,907
|
А не проще скачать страницу и сразу обработать,если конечно известен заранее URL
Цитата:
Если вас интересует только конечный результат,независимо какими путями получен.то дайте ссылку на страницы. Возможно получится упростить ваши мучения
Анализ,обработка данных Недорого
Последний раз редактировалось doober; 06.11.2010 в 14:59. |
|
06.11.2010, 15:58 | #10 |
Пользователь
Регистрация: 28.10.2009
Сообщений: 38
|
doober
Не, адрес страницы дать не могу. То есть могу, но там всё равно вход закрыт паролем, а его я дать точно не могу. Имеющееся решение меня вполне устраивает. Зашёл, скачал страницы, запустил скрипт. Первая часть скрипта преобразовала ASP в HTML, вторая загрузила эти HTML, достала из них данные и построила итоговую таблицу. Меня всё устраивает, спасибо. Ещё хотел вот что спросить, в одном из аналогичных скриптов я загружаю файлы через конструкцию вида: Код:
Ну и последний вопрос, если позволите: Я не могу понять, что я делаю не так, когда открываю список файлов при помощи конструкции вида Код:
Код:
Код:
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Ошибки при загрузке Windows | Syltan | Операционные системы общие вопросы | 6 | 20.04.2010 15:05 |
Как обработать ошибки при скачке html-страниц? | delphyok | Работа с сетью в Delphi | 6 | 14.08.2009 14:06 |
ПРИ ЗАГРУЗКЕ ВИНДЫ ДАЕТ ВЫБОР ИЗ 3, КАК УБРАТЬ 2? | iukash | Windows | 3 | 01.05.2009 14:04 |
как сделать на своем сайте возможность устанавливать его, как стартовую страницу при загрузке броузера | Chaynik | Помощь студентам | 2 | 02.03.2009 23:10 |
Ошибка при загрузке файла html | Ign | Microsoft Office Excel | 1 | 11.11.2007 13:55 |