Qt и кодировки.. Страница 1. Раздел «Общий». Форум программистов «Весельчак У»

Aether

Специалист

Offline
Пол: Мужской

Qt и кодировки.

« : 05-07-2016 13:00 »

Добрый день.

Хочу получить ликбез вот по какому вопросу: сейчас пользуюсь Qt Creator, кодировка в редакторе стоит UTF-8, компилирую под Windows, который, как я понимаю использует cp1251. Соответственно, в консольном приложении текст на русском не выводится. Переключать кодировку редактора не вижу смысла, так как помимо Windows хотелось бы сохранить возможность безпроблемной компиляции под Linux с кодировками, как UTF-8, так и ISO 8859.
Переключение локали нужный результат не даёт или я это неверно понимаю.

В целом я хотел бы понять, как необходимо оформить приложение, чтобы изначальный текст, написанный в UTF-8 правильно портировался на разные платформы.


	Записан

RXL

Технический
Администратор

Offline
Пол: Мужской

Re: Qt и кодировки.

« Ответ #1 : 05-07-2016 14:51 »

В GUI, я так понимаю, проблемы кодировок нет? Т.е. проблема чисто виндовой консоли, а не приложения. Пример решения: http://anvarichn.livejournal.com/43752.html
Если очень хочется без chcp, то напиши обертку вывода в консоль, где будешь перекодировать в OEM (для кириллицы это cp866, а не cp1251!). Но, черт побери, это каменный век!


« Последнее редактирование: 05-07-2016 14:53 от RXL »	Записан

... мы преодолеваем эту трудность без синтеза распределенных прототипов. (с) Жуков М.С.

Aether

Специалист

Offline
Пол: Мужской

Re: Qt и кодировки.

« Ответ #2 : 05-07-2016 15:43 »

Цитата: RXL от 05-07-2016 14:51

В GUI, я так понимаю, проблемы кодировок нет? Т.е. проблема чисто виндовой консоли, а не приложения.

Я так понял, да, хотя серьёзного тестирования по этой теме не делал - по умолчанию многое пишу на английском, чтобы избежать возможных проблем.

Кстати, вот, специально пишу в блокноте Windows 10:

Код:

#include <locale.h>
#include <stdio.h>

int main (void)
{
printf("123 Text Текст\n");
char* p_locale = setlocale(LC_ALL, "");
printf("123 Text Текст\n");
printf("%s", p_locale);
return 0;
}

Компиляция в tcc, вывод в консоли:

123 Text ╥хъёЄ
123 Text Текст
Russian_Russia.1251

Результат: получается блокнот работает в cp1251, консоль изначально в cp866, после вызова setlocale переключает консоль в cp1251? Хотя вызов без параметра по идее должен возвращать текущую системную локаль, а не изменять её.

Хорошо, а если кириллицей не ограничиваться? Возможно есть более прямой путь?


	Записан

Finch

Спокойный
Администратор

Offline
Пол: Мужской

Пролетал мимо

Re: Qt и кодировки.

« Ответ #3 : 05-07-2016 16:10 » new

Насколько Я помню, в Qt была возможность перевода строк. Можно наверно ее использовать. Т.е. один вариант пишеш в одной кодировке. Второй вариант в другой.


	Записан

Не будите спашяго дракона.
Джаффар (Коша)

Алексей++

глобальный и пушистый
Глобальный модератор

Offline

Сообщений: 13

Re: Qt и кодировки.

« Ответ #4 : 06-07-2016 05:00 »

у меня редактор использует utf8, все исходники тоже на utf8 делаю (единственное, что компилятор почему-то желает в ansi - это *.pri , там комментарии особо не парясь транслитом пишу Отлично

)

QString использует юникод, поэтому через него можно делать преобразования кодировок (X->unicode->Y)

например, работаем с 1251

Код:

#include <QTextCodec>
...
//кодек Windows-1251
const QTextCodec* p=QTextCodec::codecForName("Windows-1251");

...  =  p->toUnicode(...)
...  =  p->fromUnicode(...)

Добавлено через 3 минуты и 10 секунд:
или, наверное, нужно будет использовать вызов

Код:

void QTextCodec::setCodecForLocale(QTextCodec * c)

сам я с этой функцией не разбирался, пробуй


« Последнее редактирование: 06-07-2016 05:04 от Алексей1153 »	Записан

>FAQ ПО ПРОГР.
>ССЫЛКИ ПО ПРОГР.
>Правила"Неотложки"

darkelf

Молодой специалист

Offline

Re: Qt и кодировки.

« Ответ #5 : 06-07-2016 05:34 »

Если не совсем Qt, ну и плюс - использование microsoft-специфичных расширений и только для кириллицы, то можно что-то типа такого:

Код: (C)

#include <stdio.h>
#include <locale.h>

#pragma setlocale(".1251")

int main(int argc, char* argv[])
{
setlocale(LC_ALL, ".OCP");
wprintf(L"%s", L"Здравствуй, мир!\n");

return 0;
}

Сам исходник набран в кодировке 1251, но корректно отображает сообщения в консоли.

Более правильным, имхо, будет использование средств переводов Qt.


	Записан

Aether

Специалист

Offline
Пол: Мужской

Re: Qt и кодировки.

« Ответ #6 : 06-07-2016 17:50 »

Цитата: Finch от 05-07-2016 16:10

Насколько Я помню, в Qt была возможность перевода строк.

Как я понял tr - это языковая интернализация, то есть всё в рамках кодировки utf-8, но к проекту прибавляется файл с переводами, в итоге можно сделать быстрый перевод приложения на нужный язык.

Цитата: Алексей++ от 06-07-2016 05:00

QString использует юникод, поэтому через него можно делать преобразования кодировок (X->unicode->Y)

Посмотрел, странно, но не работает? Хотя должно, вроде как с третьей версии присутствует. Попробую ещё вывод в файл потестить через эти функции в разных кодировках, возможно у потоков вывода в консоль есть свои нюансы.

Цитата: darkelf от 06-07-2016 05:34

Код: (C)

...
int main(int argc, char* argv[])
{
setlocale(LC_ALL, ".OCP");
wprintf(L"%s", L"Здравствуй, мир!\n");

return 0;
}

Сам исходник набран в кодировке 1251, но корректно отображает сообщения в консоли.

Интересно, 1251, если я правильно помню однобайтная кодировка, как и 866. Как в этом случае её переводят в wchar_t? Обычно под ним скрывается ushort, значит старший байт заполняется нулём. Как в этом случае работает L?


	Записан

darkelf

Молодой специалист

Offline

Re: Qt и кодировки.

« Ответ #7 : 07-07-2016 05:24 »

Цитата: Aether от 06-07-2016 17:50

За счёт #pragma setlocale() компилятор может правильно преобразовать текст в кодировке 1251 в UTF-16. В gcc есть нечто подобное, но задающееся через ключ командной строки -finput-charset=. По поводу tcc к сожалению ничего сказать не могу.


	Записан

Вад

Модератор

Offline
Пол: Мужской

Re: Qt и кодировки.

« Ответ #8 : 07-07-2016 08:41 »

Цитата: Aether от 06-07-2016 17:50

L должно работать как написано: делать wchar_t сразу, на этапе компиляции. В зависимости от компилятора, получается UTF-16 (Visual Studio и иные Win-компиляторы) или UTF-32 (GCC). Cтарший байт (или три байта, в Linux&Co) не обязательно будет нулём - это верно только для части основных символов типа латиницы и цифр.
Соответственно, кодируется всё из одной таблицы в другую: в WinAPI, скажем, есть функции MultiByteToWideChar и обратно, а в стандартной библиотеке есть свои методы.


« Последнее редактирование: 07-07-2016 08:54 от Вад »	Записан

Aether

Специалист

Offline
Пол: Мужской

Re: Qt и кодировки.

« Ответ #9 : 07-07-2016 19:23 »

Спасибо, понимание появляется.


	Записан

Страниц: [1] Вверх

Печать

« предыдущая тема следующая тема »

Форум программистов «Весельчак У» > Программирование > Общий (Модератор: Вад) > Тема: Qt и кодировки.

	Автор	Тема: Qt и кодировки. (Прочитано 19152 раз)
0 Пользователей и 1 Гость смотрят эту тему.