Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Web программирование > SQL, базы данных
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 27.10.2008, 09:23   #1
Dennikid
Пользователь
 
Регистрация: 29.09.2008
Сообщений: 39
Вопрос Как создать БД в SQL из word файлов

Есть около 400 файлов word надо создать базу в которой будут ссылки на файлы. Из файлов надо вытащить поля для запросов (дата, ГОСТ, производитель) .Чтобы при запросе выдавал файлы с этими полями.

если можно либо дайте код и где его писать((( либо ссылку на норм описаную процедуру.

Заранее спасибо.

P.S. Просто SQL только начал изучать. знаю делфи, но с БД не сталкивался до сих пор.(((
Dennikid вне форума Ответить с цитированием
Старый 27.10.2008, 13:14   #2
wall66
Участник клуба
 
Аватар для wall66
 
Регистрация: 04.10.2008
Сообщений: 1,485
По умолчанию

не знаю как везде, но в веб програмировании это называется парсинг (ищи по этому ключевому слову) плюс немного работы с файловой системой... так что поисковики с уроками тебе в помощь
свободен...
wall66 вне форума Ответить с цитированием
Старый 27.10.2008, 17:37   #3
Dennikid
Пользователь
 
Регистрация: 29.09.2008
Сообщений: 39
По умолчанию

Но парсинг ведь только для xml, а мне надо для doc.
Dennikid вне форума Ответить с цитированием
Старый 27.10.2008, 20:12   #4
Serge_Bliznykov
Старожил
 
Регистрация: 09.01.2008
Сообщений: 26,229
По умолчанию

Цитата:
Из файлов надо вытащить поля для запросов (дата, ГОСТ, производитель)
просто любопытно стало - а что Вы подразумеваете под "полями для запросов"? Каким образов в Ваших .doc файлах задана нужная информация? Примерчик Вашего doc файла (можно абстрактный) с указанием что и куда Вы из него собираетесь вытянуть...
Serge_Bliznykov вне форума Ответить с цитированием
Старый 28.10.2008, 13:46   #5
wall66
Участник клуба
 
Аватар для wall66
 
Регистрация: 04.10.2008
Сообщений: 1,485
По умолчанию

Цитата:
Сообщение от Dennikid Посмотреть сообщение
Но парсинг ведь только для xml, а мне надо для doc.
парсинг xml это малая доля парсинга как такового, на самом деле это распознавание любого текста по заданному шаблону

например в твоем файле есть строка "ГОСТ: 123", парсер, если его правильно написать, найдет строку в файле содержащую символы "ГОСТ: " и возьмет то что стоит после нее в переменную, которую уже можно использовать для формирования запроса добавляющего данные в базу

так что изучай, используй, радуйся...
свободен...
wall66 вне форума Ответить с цитированием
Старый 29.10.2008, 09:44   #6
Dennikid
Пользователь
 
Регистрация: 29.09.2008
Сообщений: 39
По умолчанию

а можешь скинуть пример кода парсера для поиска слова в doc'e?
Dennikid вне форума Ответить с цитированием
Старый 29.10.2008, 10:26   #7
wall66
Участник клуба
 
Аватар для wall66
 
Регистрация: 04.10.2008
Сообщений: 1,485
По умолчанию

исходный фаил file.doc содержит все ту же строку "Гост: 123"
Цитата:
$fp=fopen("/file.doc", "r");
$file=fread($fp, filesize("file.doc"));
fclose($fp);
$gost=substr($file, strpos($file,'>AB:')+strlen(' >AB:'), strpos($file,'
',strpos($file,'>AB:'))-strpos($file,'>AB:')-strlen('>AB:'));
возвратит в переменной $gost строку "123" с некоторыми лишними символами форматирования от которых нетрудно ее почистить

значения для поиска можешь смотреть в исходном тексте док файла

п.с. регулярными выражениями не пользуюсь
свободен...

Последний раз редактировалось wall66; 29.10.2008 в 10:45.
wall66 вне форума Ответить с цитированием
Старый 29.10.2008, 10:35   #8
Dennikid
Пользователь
 
Регистрация: 29.09.2008
Сообщений: 39
По умолчанию

блин, а я как раз на регулярных в delphi и сижу((((. Кстати, а где в твоем коде реализован поиск слова "Гост"? просто у меня в strpos и strlen одни квадратики((((
Dennikid вне форума Ответить с цитированием
Старый 29.10.2008, 10:40   #9
wall66
Участник клуба
 
Аватар для wall66
 
Регистрация: 04.10.2008
Сообщений: 1,485
По умолчанию

эти квадратики и есть слово "Гост:", только закодированное для правильного отображения в нужном шрифте и оформлении в формате doc

как я уже писал выше - смотри кодировку в исходном тексте файла

если хорошо составляешь регекспы то тебе же будет легче, просто поищи пару нормальных примеров под различные цели
свободен...
wall66 вне форума Ответить с цитированием
Старый 29.10.2008, 10:44   #10
Dennikid
Пользователь
 
Регистрация: 29.09.2008
Сообщений: 39
По умолчанию

Понятно. Спасибо за советы.
Как я понял, можно и на PHP попробовать сделать парсер?
Dennikid вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Помогите создать базу SQL на Делфи photozaz БД в Delphi 3 01.11.2008 20:30
как из delphi создать в word таблицу Dennikid Общие вопросы Delphi 11 01.10.2008 16:55
Как создать новый файл Word из макроса Excel? Dorvir Microsoft Office Excel 12 08.07.2008 16:50
проблема внедрения в базу paradox файлов word и jpg ghost_7_7_7 БД в Delphi 1 30.01.2008 16:44
Delphi c SQL и выгрузка в Excel или word girl23 БД в Delphi 7 24.10.2007 17:56