Форум программистов «Весельчак У»
  *
Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.
Вам не пришло письмо с кодом активации?

  • Рекомендуем проверить настройки временной зоны в вашем профиле (страница "Внешний вид форума", пункт "Часовой пояс:").
  • У нас больше нет рассылок. Если вам приходят письма от наших бывших рассылок mail.ru и subscribe.ru, то знайте, что это не мы рассылаем.
   Начало  
Наши сайты
Помощь Поиск Календарь Почта Войти Регистрация  
 
Страниц: [1]   Вниз
  Печать  
Автор Тема: Какой-то мусор вначале файла Unicode  (Прочитано 4404 раз)
0 Пользователей и 1 Гость смотрят эту тему.
Aveic
Постоялец

ru
Offline Offline
Пол: Мужской
Yellow


« : 05-01-2008 16:40 » 

в общем читаю файл, сохраненный в UTF-8 с помощью std::wifstream. Почему то вначале три символа - какой-то мусор перед контентом файла? Откуда он берется?  А черт его знает... Просто тупо прочитать три символа и забыть про них это ведь не хорошее лекарство... в общем, как с этим бороться?
Записан
RXL
Технический
Администратор

ru
Offline Offline
Пол: Мужской

WWW
« Ответ #1 : 05-01-2008 19:25 » 

Коды "EF BB BF" - это "BOM" - сигнатура для автоопределения кодировки.
Записан

... мы преодолеваем эту трудность без синтеза распределенных прототипов. (с) Жуков М.С.
Aveic
Постоялец

ru
Offline Offline
Пол: Мужской
Yellow


« Ответ #2 : 06-01-2008 11:34 » 

Спс, RXL!
« Последнее редактирование: 06-01-2008 12:02 от Aveic » Записан
Артем
Опытный

nz
Offline Offline
Пол: Мужской
Beware the wolf in sheep's clothing.


« Ответ #3 : 30-01-2008 14:47 » 

Заголовок

UTF-8    EF BB BF
UTF-16BE FE FF
UTF-16LE FF FE
UTF-32BE 00 00 FE FF
UTF-32LE FF FE 00 00

http://ru.wikipedia.org/wiki/%D0%AE%D0%BD%D0%B8%D0%BA%D0%BE%D0%B4#.D0.92.D0.B5.D1.80.D1.81.D0.B8.D0.B8_.D0.AE.D0.BD.D0.B8.D0.BA.D0.BE.D0.B4.D0.B0
Записан
Страниц: [1]   Вверх
  Печать  
 

Powered by SMF 1.1.21 | SMF © 2015, Simple Machines