![]() |
|
|
Регистрация Восстановить пароль |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
![]() |
|
|
Опции темы | Поиск в этой теме |
![]() |
#11 | |
Участник клуба
Регистрация: 14.06.2011
Сообщений: 1,138
|
![]() Цитата:
Объем словаря обычного человека - под сотню тысяч слов, которые он понимает и использует. Хотя тут конечно есть деление на активный словарный запас и на словарный запас вообще. Слово в среднем, действительно, длиной в 10 букв. 8-12 буквенные слова - их максимальное количество. 25-буквенных слов - всего семнадцать штук в вышеупомянутой базе)) Так что выходит, что наш с вами мозг способен распознавать и определять 1 700 000 отдельных слов (офигеть, не правда ли?). Умножая на 10 и кодируя в cp1251, получается 17 метров. |
|
![]() |
![]() |
![]() |
#12 |
Пользователь
Регистрация: 28.10.2011
Сообщений: 13
|
![]()
Если считать словом непрерывную последовательность русских букв различая большие и маленькие то в ~100 Gb текста (Traum Library) было найдено 7928830 уникальных слов. Встречались более 1000 раз 148788 слова. Длина от 1 до 35 букв, в среднем 5.5.
http://www.programmersclub.ru/словар...усского-языка/ |
![]() |
![]() |
![]() |
#13 |
Участник клуба
Регистрация: 14.06.2011
Сообщений: 1,138
|
![]()
Bob256, Спасибо)
А за частотность - особенно. UPD Кстати, никто не подскажет, как Ворд заставить удалить подчеркнутые красным слова? Последний раз редактировалось Smogg; 19.01.2013 в 02:01. |
![]() |
![]() |
![]() |
|
Опции темы | Поиск в этой теме |
![]() |
||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
некорректное отображение русского языка | zlo_999 | HTML и CSS | 11 | 10.02.2015 13:19 |
Windows 8 - кракозябры русского языка | tatianak99 | Windows | 0 | 24.11.2012 15:25 |
проблема русского языка в vcf | malloy84 | Свободное общение | 1 | 14.01.2011 10:43 |
Словарь служебных слов языка delphi | Kate68 | Помощь студентам | 1 | 09.11.2009 22:06 |