Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Microsoft Office и VBA программирование > Microsoft Office Excel
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 10.12.2012, 23:29   #1
exSTAS
 
Регистрация: 10.12.2012
Сообщений: 4
По умолчанию Как найти более полные повторы, либо потенциальные

В кратце обрисую сложившуюся ситуацию. Есть огромная база данных, которая состоит из двух баз. Соответсвенно, в единой базе существуют потенциальные повторы. Некая программа Х примерно нашла эти повторы. Самое главное мне нужно найти более верные повторы и более полные. Помогите!!! База просто огромная и просто просмотреть ее в глаза нереально, хотя приходится.
exSTAS вне форума Ответить с цитированием
Старый 11.12.2012, 01:55   #2
doober
Старожил
 
Аватар для doober
 
Регистрация: 02.05.2009
Сообщений: 3,907
По умолчанию

какая СУБД?
структура таблиц ?
Анализ,обработка данных Недорого
doober вне форума Ответить с цитированием
Старый 11.12.2012, 21:19   #3
exSTAS
 
Регистрация: 10.12.2012
Сообщений: 4
По умолчанию

Цитата:
Сообщение от doober Посмотреть сообщение
какая СУБД?
структура таблиц ?
я не очень разбираюсь в структуре таблиц, БД.
Просто несколько столбцов с объединенными данными. вот пример уже обратонной части БД
Изображения
Тип файла: jpg пример таблицы.jpg (207.1 Кб, 143 просмотров)
exSTAS вне форума Ответить с цитированием
Старый 11.12.2012, 21:27   #4
doober
Старожил
 
Аватар для doober
 
Регистрация: 02.05.2009
Сообщений: 3,907
По умолчанию

Цитата:
Самое главное мне нужно найти более верные повторы и более полные.
Надо конкретно описать что является повтором.
Какое расширение файлов исходных двух баз?
Или эти базы хранятся в файлах Excel?
Без знания первоисточника я вам не смогу помочь.
Анализ,обработка данных Недорого
doober вне форума Ответить с цитированием
Старый 12.12.2012, 12:24   #5
exSTAS
 
Регистрация: 10.12.2012
Сообщений: 4
По умолчанию

Цитата:
Сообщение от doober Посмотреть сообщение
Надо конкретно описать что является повтором.
Какое расширение файлов исходных двух баз?
Или эти базы хранятся в файлах Excel?
Без знания первоисточника я вам не смогу помочь.
Изначально базы были в Access и имели формат файла DBF, потом их объединили и сохранили в Excel для удобства работы. У меня хранится общая база в Excel.

Надо определить повторы по парам и отметить на удаление худшую запись. Для тех записей, что подлежат удалению, ставить в ней значение 1. (на рисунке 1 колонка).
Есть список наборов фирм - кандидатов на повторы. Для каждого значения поля REPEAT (3 колонка) сформирована "группа" фирм кандидатов на совпадение с фирмой, у которой поле IST=1 (первая по порядку следования для каждого значения поля REPEAT). Если для рассматриваемого значения поля REPEAT нет фирм с IST=2, совпадающих с фирмой с IST=1, то в обрабатываемом файле нужно удалять всю "группу" фирм с рассматриваемым значением REPEAT. В противном случае нужно оставить только те фирмы с заданным REPEAT и IST=2, которые совпадают с фирмой с заданным REPEAT и IST=1, и саму фирму с IST=1, а остальные удалить.
Среди оставшихся фирм с заданным REPEAT и IST=1 или IST=2 нужно
выбрать одну (например, с более полным названием или адресом) и
пометить ее в Udalit (1 столбец)
Изображения
Тип файла: jpg пример.JPG (82.5 Кб, 154 просмотров)
exSTAS вне форума Ответить с цитированием
Старый 12.12.2012, 13:46   #6
EducatedFool
Программист VBA
СуперМодератор
 
Аватар для EducatedFool
 
Регистрация: 13.07.2008
Сообщений: 6,856
По умолчанию

exSTAS, зачем вы прикрепляете картинки?
У нас же форум не по фотошопу...

Были бы прикреплены реальные файлы с данными (в архиве) - вам бы уже помогли
EducatedFool вне форума Ответить с цитированием
Старый 12.12.2012, 17:44   #7
exSTAS
 
Регистрация: 10.12.2012
Сообщений: 4
По умолчанию

Вот часть файла.
Вложения
Тип файла: zip 2rep2_.zip (756.0 Кб, 8 просмотров)
exSTAS вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Oracle - вывести работников, в имени или фамилии которых какая-либо буква встречается 2 и более раз Кристина * SQL, базы данных 10 08.12.2012 20:32
Найти и выделить (либо закрасить) на изображении другое изображение DarkHacker PHP 0 13.08.2012 19:00
Нужно найти план выпуска продукции Delphi либо Paskal XaaXaa Помощь студентам 0 23.03.2012 20:52
Как вводить полные инициалы в массив структур и как при выводе не отображать слово none несколько раз? -ushёl- Помощь студентам 2 02.01.2010 14:13
В графе найти все его четырехвершинные полные подграфы[PROLOG] Bruster Помощь студентам 1 24.12.2009 09:55