|
|
Регистрация Восстановить пароль |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
Опции темы | Поиск в этой теме |
26.02.2013, 11:54 | #1 |
Форумчанин
Регистрация: 08.11.2010
Сообщений: 593
|
стеммер Портера и проблема с русским языком
Добрый день, собственно использую стеммер Портера http://potapov.com.ua/library/31/
но возникла проблема в том, что проблема с русским языком, а именно, папример вводим привет, получаю пЀивеЂ собственно кодировка файла в UTF-8, так шлю хедеры: header("Content-type:text/html;charset=UTF-8"); как решить данную проблему, я не понимаю |
26.02.2013, 12:17 | #2 |
Старожил
Регистрация: 25.02.2007
Сообщений: 4,179
|
однозначно кодировки ... .почитайте на форуме полно тем по ним
|
26.02.2013, 12:45 | #3 |
Форумчанин
Регистрация: 08.11.2010
Сообщений: 593
|
да, вы оказались правы, кодировка нужна cp-1251 но понять я не могу почему, если кто может, поясните пожалуйста?
|
27.02.2013, 16:07 | #4 |
Пользователь
Регистрация: 29.03.2010
Сообщений: 35
|
Потому, что PHP не поддерживает UTF-8 (даже не UTF-8, а мультибайтовые кодировки) из коробки, вернее подерживает но на уровне ядра, чтоли. Функции для работы со строками же работают только с cp-1251 кодировкой. Если хотите использовать данный стиммер, то перед обработкой кодируйте строку в cp-1251, а после обработки, перед выводом, в UTF-8.
Можно воспользоваться библиотекой iconv, или mb_string. Код:
Детальнее о строках: http://php.net/manual/ru/language.types.string.php |
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Проблема с русским языком | Dimazzzzzz | Python | 0 | 06.05.2012 18:32 |
Проблема с армянским языком и юникодом!!! | artush1984 | Общие вопросы C/C++ | 3 | 19.08.2009 20:23 |
Проблема с русским | ponchikpk | Паскаль, Turbo Pascal, PascalABC.NET | 12 | 22.05.2009 18:39 |
Проблема с языком при использовании SQL | Yetiball | БД в Delphi | 4 | 20.05.2009 19:38 |
Ошибка с русским языком! | Liza | Общие вопросы Delphi | 6 | 02.04.2009 11:15 |