![]() |
|
|
Регистрация Восстановить пароль |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
![]() |
|
Опции темы | Поиск в этой теме |
![]() |
#1 |
Регистрация: 10.05.2014
Сообщений: 3
|
![]()
Здравствуйте. Имеется массив 1 столбца с 1-2к слов. Дубликаты 1 к 1 удалить не сложно, просто нажав "удалить дубликаты". Но вот есть задача посложнее. Количество слов в документе - 10к. Остаются к примеру такие вот огрызки:
машина машины машиной квартира квартиры квартирой и тд... Хочется как-то или сразу удалить все дубликаты, чтобы осталось только 1 слово, или как-то отфильтровать. К примеру, если в слове подряд идут 3 одинаковые буквы, одно из этих слов удаляется. Заранее спасибо! |
![]() |
![]() |
![]() |
#2 | ||
Программист VBA
СуперМодератор
Регистрация: 13.07.2008
Сообщений: 6,858
|
![]() Цитата:
если требуется сделать это один раз - гораздо проще вручную Цитата:
|
||
![]() |
![]() |
![]() |
#3 |
Форумчанин
Регистрация: 05.07.2011
Сообщений: 208
|
![]()
найти машин*
заменить все на машина и т.д. удалить дубликаты при необходимости повторить |
![]() |
![]() |
![]() |
#4 |
Новичок
СтарожилДжуниор
Регистрация: 05.02.2008
Сообщений: 9,487
|
![]()
если совершенно не важно что будет на выходе, то можно и по 3-м одинаковым...
легко решить что делать с машинами а с этой парой будет сложнее: адреналин адрес тут даже 4 буквы совпадают, откройте любой словарь и взгляните, что Ваш ждет
Программисты - это люди, решающие проблемы, о существовании которых Вы не подозревали, методами, которых Вы не понимаете
|
![]() |
![]() |
![]() |
#5 |
Пользователь
Регистрация: 29.06.2012
Сообщений: 39
|
![]()
Как вариант, можно скопировать в файл словарь русского языка, порядка 100 000 слов будет достаточно. Дальше просто искать ваши слова в словаре, все огрызки тогда пойдут в корзину.
|
![]() |
![]() |
![]() |
#6 |
Регистрация: 10.05.2014
Сообщений: 3
|
![]()
Всем спасибо за участие)
какой объём работы необходимо выполнить и сколько времени у excel займёт прогнать 3000 слов по словарю, скажем, как вы и предлагаете, 100к слов? |
![]() |
![]() |
![]() |
#7 |
Пользователь
Регистрация: 22.04.2013
Сообщений: 17
|
![]()
Как я понимаю, обычной функцией ВПР() можно прогнать с точным совпадением. Потом удалить ошибки.
|
![]() |
![]() |
![]() |
#8 | |
Пользователь
Регистрация: 29.06.2012
Сообщений: 39
|
![]() Цитата:
А ещё больше - от того, как будет реализовано. Я не специалист, но кажется есть там инструменты типа Dictionary, возможно придётся применить алгоритмы быстрого поиска и скорее всего они уже разработаны, надо просто их найти . |
|
![]() |
![]() |
![]() |
#9 |
Старожил
Регистрация: 11.05.2010
Сообщений: 5,170
|
![]()
Заполнить словарь на 100к ключей - секунд 5.
Проверить по словарю 3к слов и вывести результат - секунда, может 2. Итого на всё 10 секунд, скорее всего меньше. Если конечно использовать dictionary и массивы.
webmoney: E265281470651 Z422237915069 R418926282008
|
![]() |
![]() |
![]() |
![]() |
||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
дубликаты в коде | alimov7 | Помощь студентам | 9 | 23.10.2012 22:05 |
убрать дубликаты | Nasten'ka7 | Microsoft Office Excel | 1 | 21.03.2011 18:49 |
окрасить дубликаты | Romuald | Microsoft Office Excel | 5 | 07.03.2011 16:33 |
матрица и дубликаты... | xakkkkker | Помощь студентам | 3 | 05.12.2010 20:11 |