Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Microsoft Office и VBA программирование > Microsoft Office Excel
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 24.10.2011, 09:48   #1
Molotoklk
Пользователь
 
Регистрация: 24.09.2011
Сообщений: 36
По умолчанию данные из *.pdf

здравствуйте, подскажите пожалуйста, можно ли вообще и если можно, то как вытащить данные из файлов *pdf?
нужны значения определенных позиций, например дата, номер, кадастровый номер, адрес и т.д.
Вложения
Тип файла: zip форум.zip (301.9 Кб, 22 просмотров)
Molotoklk вне форума Ответить с цитированием
Старый 24.10.2011, 10:32   #2
Hugo121
Старожил
 
Регистрация: 11.05.2010
Сообщений: 5,166
По умолчанию

Если сохранить как текст (можно бат-файл написать) - то можно макросом/скриптом уже из текста вытащить:

КАДАСТРОВАЯ
ВЫПИСКА
О
ЗЕМЕЛЬНОМ
УЧАСТКЕ
(выписка
из
государственного
кадастра
недвижимости)
11.10.2010

61/001/10-461985 КB.


1 Кадастровыйномер61:15:0600301:1045 2 Лист№1 3 Всеголистов: 8
Общиесведения4 Предыдущиеномера: 61:15:600301:664
6
Датавнесенияномеравгосударственныйк адастрнедвижимости: 02.11.2006 5 Единоеземлепользование7
Местоположениеустановленоотноситель ноориентира, расположенноговграницахучастка.
Почтовыйадресориентира: Ростовскаяобл, р-нКаменский, ТсОО"НовоеВремя", участки№28, №43, №54, №1г, №22г8 Категорияземель:
webmoney: E265281470651 Z422237915069 R418926282008
Hugo121 вне форума Ответить с цитированием
Старый 24.10.2011, 10:41   #3
doober
Старожил
 
Аватар для doober
 
Регистрация: 02.05.2009
Сообщений: 3,907
По умолчанию

Можно.
У вас есть минимум 2 варианта.
1.Сохранить в текст и парсить.
2.(Я так парсил прайсы) Программно перебираете страницы,зная структуру их.
Каждому знаку соответствует своя координата по X и Y
Получаете необходимые данные.Полей в файле я не обнаружил,с которых можно брать данные по имени
Анализ,обработка данных Недорого
doober вне форума Ответить с цитированием
Старый 24.10.2011, 11:35   #4
Molotoklk
Пользователь
 
Регистрация: 24.09.2011
Сообщений: 36
По умолчанию

doober, даже если пересохранять в текст вручную, получится намного быстрее, чем копировать нужные значения по отдельности каждое... а что значит парсить?
Molotoklk вне форума Ответить с цитированием
Старый 24.10.2011, 12:47   #5
doober
Старожил
 
Аватар для doober
 
Регистрация: 02.05.2009
Сообщений: 3,907
По умолчанию

Я сам боюсь этого страшного слова Парсинг

Во вложении для информации примеры файлов ПДф и результат.
Таких страниц в файле до 20
Если надо получить несколько данных-то естественно через текст вам делать надо,таблицу вы через текст не возьмете
Вложения
Тип файла: rar _7.rar (204.2 Кб, 63 просмотров)
Анализ,обработка данных Недорого
doober вне форума Ответить с цитированием
Старый 24.10.2011, 13:43   #6
kuklp
Участник клуба
 
Регистрация: 02.05.2010
Сообщений: 1,390
По умолчанию

Сереж, просто замени его на сплит:-)
П.С. А слова и я боюсь:-)
mailto: kuklp60@gmail.com, ящики для благодарностей:
WM Z206653985942, R334086032478, U238399322728
kuklp вне форума Ответить с цитированием
Старый 24.10.2011, 13:57   #7
Казанский
Старожил
 
Аватар для Казанский
 
Регистрация: 31.12.2010
Сообщений: 2,133
По умолчанию

> А слова и я боюсь:-)

Ага. Похоже на пирсинг
exceleved@yandex.ru Яндекс.Деньги: 410011500007619
Казанский вне форума Ответить с цитированием
Старый 24.10.2011, 14:53   #8
gluk_fm
Форумчанин
 
Аватар для gluk_fm
 
Регистрация: 09.06.2011
Сообщений: 515
По умолчанию

А подскажите пожалуйста как (или где можно посмотреть) можно написать процедуру преобразования ПДФ в текстовый файл.
Или может подскажите как можно с сайта http://markets.ft.com/RESEARCH/marke...ate=10/19/2011 "*только дата меняется
извлечь информацию в ексель? (может немного не по теме но тоже касается преобразования ПДФ)

Последний раз редактировалось gluk_fm; 24.10.2011 в 14:58.
gluk_fm вне форума Ответить с цитированием
Старый 24.10.2011, 15:22   #9
Molotoklk
Пользователь
 
Регистрация: 24.09.2011
Сообщений: 36
По умолчанию

Цитата:
Если надо получить несколько данных-то естественно через текст вам делать надо,таблицу вы через текст не возьмете
а нельзя например сделать так, чтобы из текстового документа выбирался текст, который находится между определенными словами, (например "1 Кадастровый номер " и до "2 Лист") и заносился в таблицу екселя?


в приложении текстовый файл, который получился при копировании из пдф
Вложения
Тип файла: txt текстовый файл.txt (2.0 Кб, 150 просмотров)
Molotoklk вне форума Ответить с цитированием
Старый 24.10.2011, 15:35   #10
gluk_fm
Форумчанин
 
Аватар для gluk_fm
 
Регистрация: 09.06.2011
Сообщений: 515
По умолчанию

если текст является постоянным (формат и количество строк всегда одинаковы). То делаете разбивку по столбцам и выбираете только те ячейки которые нужны.



А по моему вопросу никто ничего не подскажет? Подскажите хоть где это можно поискать.....
gluk_fm вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Как упорядочить данные (перевести данные из стольбцов в строки)? opeck Microsoft Office Excel 3 21.11.2011 01:43
PDF: внедрить свои данные AnTe Компоненты Delphi 8 12.07.2011 16:50
Данные по столбцам - упорядочить данные к друг другу PetroD Microsoft Office Excel 10 07.08.2010 12:30
PDF Яр|/||< (^_^) Компоненты Delphi 4 09.07.2009 16:50