Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Низкоуровневое программирование > Win Api
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Закрытая тема
Ваша тема закрыта, почему это могло произойти? Возможно,
Нет наработок или кода, если нужно готовое решение - создайте тему в разделе Фриланс и оплатите работу.
Название темы включает слова - "Помогите", "Нужна помощь", "Срочно", "Пожалуйста".
Название темы слишком короткое или не отражает сути вашего вопроса.
Тема исчерпала себя, помните, один вопрос - одна тема
Прочитайте правила и заново правильно создайте тему.
 
Опции темы Поиск в этой теме
Внимание! Есть замечания модератора по теме: так точнее
Старый 02.04.2016, 17:21   #91
Alex11223
Старожил
 
Аватар для Alex11223
 
Регистрация: 12.01.2011
Сообщений: 19,500
По умолчанию

Цитата:
а как вы будете хранить в 8-ми разрядной переменной русскую букву А которая имеет код 1040 ?
Ну вот и будет два байта/два char.
Речь же о хранении?
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом.
Alex11223 вне форума
Старый 02.04.2016, 17:21   #92
Пепел Феникса
Старожил
 
Аватар для Пепел Феникса
 
Регистрация: 28.01.2009
Сообщений: 21,000
По умолчанию

а с какого перепугу это должно хранится в одном char?
с вашей хотелки?


занимает два байта.
D090
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
Программа делает то что написал программист, а не то что он хотел.
Функции/утилиты ждут в параметрах то что им надо, а не то что вы хотите.
Пепел Феникса вне форума
Старый 02.04.2016, 17:25   #93
RAFA91
Заблокирован
 
Регистрация: 06.02.2011
Сообщений: 1,999
По умолчанию

Цитата:
Сообщение от Пепел Феникса Посмотреть сообщение
а с какого перепугу это должно хранится в одном char?
с вашей хотелки?


0
ну и какой тогда тут выигрыш ?

для типа wchar_t есть свой строковый класс wstring;

начерта делить на два байта так и не понял .
RAFA91 вне форума
Старый 02.04.2016, 17:31   #94
Пепел Феникса
Старожил
 
Аватар для Пепел Феникса
 
Регистрация: 28.01.2009
Сообщений: 21,000
По умолчанию

английская a займет один байт в UTF8.

и наглядный пример.
имеем следующую xml
размер в UTF8 => 4*548 байт
размер в UTF16 => 9*096 байт
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
Программа делает то что написал программист, а не то что он хотел.
Функции/утилиты ждут в параметрах то что им надо, а не то что вы хотите.
Пепел Феникса вне форума
Старый 02.04.2016, 17:32   #95
Alex11223
Старожил
 
Аватар для Alex11223
 
Регистрация: 12.01.2011
Сообщений: 19,500
По умолчанию

Выигрыш чего? Вопрос был о хранении байтов юникодовских строк.

wchar_t не везде 2 байта. И символы в utf-8 не всегда кратны двум байтам.
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом.
Alex11223 вне форума
Старый 02.04.2016, 17:33   #96
Pavia
Лис
Старожил
 
Аватар для Pavia
 
Регистрация: 18.09.2015
Сообщений: 2,409
По умолчанию

UTF-8 это разработка Oracal
А Unicod - разработкак Microsoft
У этих фирм негласная конкуренция. Вот и выпендриваются друг перед другом.

Цитата:
плюс UTF8 не зависит от порядка байт целевой машины.
Это маркетинговый ход. Притом очень удачный! Для посимвольной обработки UTF-8 символы приходиться разбирать по байтно. А UNICOD только на одной из архитектур Big-Endian или Little-Endian.

Цитата:
UTF8 не применяют для работы в основном. а для хранения и передачи.
Опять таки это маркетинговый ход.
UTF8 давно и удачно используется как внутреннее представления строк. Но не у МС.

Преимущество UTF8 в том, что он короче. Наиболее частые операции: операция копирования и операции конкатенации, операция поиска выполняются быстрее!
Но самое главное регулярные выражения, которые очень популярны в UNIX-подобных системах. Так как их скорость зависит экспоненциально от длины строки.
Если бы они использовали 2-х байтовые кодировки, то скорость обработки упала бы не в 2 раза. А рас в 10-100!
И так медленной системе UNIX грозило стать черепахой.

Подсчитайте сколько на вашем диске текстовой информации. Когда я подсчитывал последний раз она составляла 90%. И это без исходников и репозитариев! А это значит, что если она хранится в UTF то вам требуется HDD в 2 раза меньше.
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
У дзен программиста программа делает то что он хотел, а не то что он написал .

Последний раз редактировалось Pavia; 02.04.2016 в 17:44.
Pavia вне форума
Старый 02.04.2016, 17:40   #97
RAFA91
Заблокирован
 
Регистрация: 06.02.2011
Сообщений: 1,999
По умолчанию

Цитата:
Сообщение от Пепел Феникса Посмотреть сообщение
английская a займет один байт в UTF8.

т

понятное дело. у нее старший байт 0.

я сейчас про русскую а говорю.

как вы ее загрузите в UTF-8 и какой она там будет иметь код
Цитата:
Сообщение от Alex11223 Посмотреть сообщение
В

wchar_t не везде 2 байта.
sizeof говорит 2

а не везде это где ?
RAFA91 вне форума
Старый 02.04.2016, 17:44   #98
Alex11223
Старожил
 
Аватар для Alex11223
 
Регистрация: 12.01.2011
Сообщений: 19,500
По умолчанию

Вы не видите разницу между "хранить байты юникод строк" и "выполнять с ними какие-то операции как с текстом (поиск символов, замена, конвертация в нижний/верхний регистр, ...)".

Цитата:
а не везде это где ?
на других платформах/в других компиляторах.
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом.

Последний раз редактировалось Alex11223; 02.04.2016 в 17:48.
Alex11223 вне форума
Старый 02.04.2016, 17:45   #99
Пепел Феникса
Старожил
 
Аватар для Пепел Феникса
 
Регистрация: 28.01.2009
Сообщений: 21,000
По умолчанию

куча бреда...
Цитата:
UTF-8 это разработка Oracal
А Unicod - разработкак Microsoft
ничего что U в UTF8 значит Unicode?
Microsoft тут скорее повлияли сильно на стандарт UTF, его по большей части брали чтоб не ломать все.
Цитата:
Для посимвольной обработки UTF-8 символы приходиться разбирать по байтно. А UNICOD только на одной из архитектур Big-Endian или Little-Endian.
ну да, побайтно, и при по-байтном разборе мы получим родной порядок байт, а не как прислали.
так что аргумент не ясен, маркетинга тут нет.
Цитата:
операция поиска выполняются быстрее!
Но самое главное регулярные выражения, которые очень популярны в UNIX-подобных системах. Так как их скорость зависит экспоненциально от длины строки.
а вот тут не уверен.
если для UTF16 мы может просто предположить что два байта и точна.
то для каждого байта UTF8 нужно декодировать, по одному. от этого проседания тоже есть.

вы бы хоть разобрались прежде чем писать все это, а уж тем более заявляя про маркетинг и тп.
Цитата:
понятное дело. у нее старший байт 0.
у одного байта нет старшего байта.
Цитата:
как вы ее загрузите в UTF-8 и какой она там будет иметь код
символьный код у нее остается тот же, меняется хранение этого кода.
я уже показал как оно будет.
Цитата:
Подсчитайте сколько на вашем диске текстовой информации. Когда я подсчитывал последний раз она составляла 90%. И это без исходников и репозитариев! А это значит, что если она хранится в UTF то вам требуется HDD в 2 раза меньше.
больше всего бинарной(графика, архивы, БД)
только вот это не имеет отношения к вопросу.
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
Программа делает то что написал программист, а не то что он хотел.
Функции/утилиты ждут в параметрах то что им надо, а не то что вы хотите.

Последний раз редактировалось Пепел Феникса; 02.04.2016 в 17:49.
Пепел Феникса вне форума
Старый 02.04.2016, 17:50   #100
Alex11223
Старожил
 
Аватар для Alex11223
 
Регистрация: 12.01.2011
Сообщений: 19,500
По умолчанию

Цитата:
куча бреда...
Гитлера в Аргентине еще не нашел?

Понятно ж, что это просто троллинг или пародия на автора темы была.
Ну или все совсем плохо и уже не помочь.
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом.
Alex11223 вне форума
Закрытая тема


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Мои фантазии про С++11 RAFA91 Общие вопросы C/C++ 265 18.07.2016 15:15
Проблема кодировок Anarios JavaScript, Ajax 2 25.12.2011 11:06
Стандартные средства = бесконечный полет фантазии. Alex Cones Софт 2 27.07.2009 17:10
Проблема кодировок!!! chekanoff Общие вопросы Delphi 4 04.12.2007 00:03