|
|
Регистрация Восстановить пароль |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
Опции темы | Поиск в этой теме |
23.03.2012, 23:25 | #1 |
Новичок
Джуниор
Регистрация: 21.05.2010
Сообщений: 1
|
Поиск слов в файле
Здравствуйте, мне надо найти порядка 300 000 000 слов(по 5 байт) в случайном 1-5 гб бинарном файле. Подскажите, пожалуйста, какие алгоритмы поиска самые подходящие и быстрые?
На одном форуме мне предложили проиндексировать файл, подскажите как? Просто перебором он лет 10 копать будет) И, примерно, в лучшем случае, сколько по времени такой поиск займет? |
08.04.2012, 12:44 | #2 |
Старожил
Регистрация: 08.04.2012
Сообщений: 3,229
|
Не совсем понятно, что нужно сделать.
- Что такое "слово"? Почему именно 5 байт? Как определяются границы слова? - Что Вы подразумеваете под "бинарным" файлом? Я, например, при работе с большими текстовыми файлами ВСЕГДА загружаю их в память как бинарные. Так намного быстрее. Но от этого файлы не перестают быть текстовыми. - Что Вы подразумеваете под словом "найти"? Т.е. пусть у нас на входе два файла: с 300 млн. имен и "бинарный", что хочется иметь на выходе? Индексация - правильная идея, но в зависимости от задачи следует решить, что именно нужно индексировать. Последний раз редактировалось s-andriano; 08.04.2012 в 14:16. |
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
поиск слов в файле-словаре php | nuevegramodelamor | Помощь студентам | 0 | 21.11.2010 18:46 |
Поиск данных в текстовом файле (в самом файле! а не в Memo и не загружая всю инфу из файла в одну строку | glagoff | Помощь студентам | 1 | 05.05.2010 13:00 |
Поиск слов в текстовом файле | svt | Помощь студентам | 8 | 07.11.2009 19:56 |
Поиск русских слов в файле | getUp | Общие вопросы C/C++ | 3 | 23.10.2009 16:20 |