|
|
Регистрация Восстановить пароль |
Повторная активизация e-mail |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
Опции темы | Поиск в этой теме |
10.12.2012, 23:29 | #1 |
Регистрация: 10.12.2012
Сообщений: 4
|
Как найти более полные повторы, либо потенциальные
В кратце обрисую сложившуюся ситуацию. Есть огромная база данных, которая состоит из двух баз. Соответсвенно, в единой базе существуют потенциальные повторы. Некая программа Х примерно нашла эти повторы. Самое главное мне нужно найти более верные повторы и более полные. Помогите!!! База просто огромная и просто просмотреть ее в глаза нереально, хотя приходится.
|
11.12.2012, 01:55 | #2 |
Старожил
Регистрация: 02.05.2009
Сообщений: 3,907
|
какая СУБД?
структура таблиц ?
Анализ,обработка данных Недорого
|
11.12.2012, 21:19 | #3 |
Регистрация: 10.12.2012
Сообщений: 4
|
я не очень разбираюсь в структуре таблиц, БД.
Просто несколько столбцов с объединенными данными. вот пример уже обратонной части БД |
11.12.2012, 21:27 | #4 | |
Старожил
Регистрация: 02.05.2009
Сообщений: 3,907
|
Цитата:
Какое расширение файлов исходных двух баз? Или эти базы хранятся в файлах Excel? Без знания первоисточника я вам не смогу помочь.
Анализ,обработка данных Недорого
|
|
12.12.2012, 12:24 | #5 | |
Регистрация: 10.12.2012
Сообщений: 4
|
Цитата:
Надо определить повторы по парам и отметить на удаление худшую запись. Для тех записей, что подлежат удалению, ставить в ней значение 1. (на рисунке 1 колонка). Есть список наборов фирм - кандидатов на повторы. Для каждого значения поля REPEAT (3 колонка) сформирована "группа" фирм кандидатов на совпадение с фирмой, у которой поле IST=1 (первая по порядку следования для каждого значения поля REPEAT). Если для рассматриваемого значения поля REPEAT нет фирм с IST=2, совпадающих с фирмой с IST=1, то в обрабатываемом файле нужно удалять всю "группу" фирм с рассматриваемым значением REPEAT. В противном случае нужно оставить только те фирмы с заданным REPEAT и IST=2, которые совпадают с фирмой с заданным REPEAT и IST=1, и саму фирму с IST=1, а остальные удалить. Среди оставшихся фирм с заданным REPEAT и IST=1 или IST=2 нужно выбрать одну (например, с более полным названием или адресом) и пометить ее в Udalit (1 столбец) |
|
12.12.2012, 13:46 | #6 |
Программист VBA
СуперМодератор
Регистрация: 13.07.2008
Сообщений: 6,856
|
exSTAS, зачем вы прикрепляете картинки?
У нас же форум не по фотошопу... Были бы прикреплены реальные файлы с данными (в архиве) - вам бы уже помогли |
12.12.2012, 17:44 | #7 |
Регистрация: 10.12.2012
Сообщений: 4
|
Вот часть файла.
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Oracle - вывести работников, в имени или фамилии которых какая-либо буква встречается 2 и более раз | Кристина * | SQL, базы данных | 10 | 08.12.2012 20:32 |
Найти и выделить (либо закрасить) на изображении другое изображение | DarkHacker | PHP | 0 | 13.08.2012 19:00 |
Нужно найти план выпуска продукции Delphi либо Paskal | XaaXaa | Помощь студентам | 0 | 23.03.2012 20:52 |
Как вводить полные инициалы в массив структур и как при выводе не отображать слово none несколько раз? | -ushёl- | Помощь студентам | 2 | 02.01.2010 14:13 |
В графе найти все его четырехвершинные полные подграфы[PROLOG] | Bruster | Помощь студентам | 1 | 24.12.2009 09:55 |