Форум программистов CodeGuru
13 Декабрь 2017, 07:26:45 *
Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.

Войти
Новости:
 
   Начало   Помощь Войти Регистрация  
Страниц: [1]   Вниз
  Печать  
Автор Тема: Перекодировка текста Windows 1251 -> KOI8-R, DOS и обратно  (Прочитано 17221 раз)
0 Пользователей и 1 Гость смотрят эту тему.
Expire
Новичок
*
Офлайн Офлайн

Сообщений: 1


Просмотр профиля
« : 09 Март 2013, 14:27:57 »

Здравствуйте всем.
Не могли бы вы помочь разобраться как работает следующий код (взят с вашего форума) ?
Код:
BOOL TextKOI8RToASCII(BYTE *pbKOI8R, UINT nSizeKOI8R, LPSTR lpszASCII,  UINT nSizeASCII, unsigned char chVoidChar)
{
       if(nSizeKOI8R > (nSizeASCII - 1))
               return FALSE;

       // Таблица отображения кода DOS в код ASCII
       // 01 - символ-признак несуществующего в DOS символа

       static unsigned char ubArrKOI8RToASCII[256] =
       {
               0x00, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x07,
               0x08, 0x09, 0x0A, 0x0B, 0x0C, 0x0D, 0x0E, 0x0F,
               0x01, 0x11, 0x12, 0x13, 0x14, 0x01, 0x01, 0x01,
               0x18, 0x19, 0x01, 0x1B, 0x01, 0x01, 0x01, 0x01,
               0x20, 0x21, 0x22, 0x23, 0x24, 0x25, 0x26, 0x27,
               0x28, 0x29, 0x2A, 0x2B, 0x2C, 0x2D, 0x2E, 0x2F,
               0x30, 0x31, 0x32, 0x33, 0x34, 0x35, 0x36, 0x37,
               0x38, 0x39, 0x3A, 0x3B, 0x3C, 0x3D, 0x3E, 0x3F,
               0x40, 0x41, 0x42, 0x43, 0x44, 0x45, 0x46, 0x47,
               0x48, 0x49, 0x4A, 0x4B, 0x4C, 0x4D, 0x4E, 0x4F,
               0x50, 0x51, 0x52, 0x53, 0x54, 0x55, 0x56, 0x57,
               0x58, 0x59, 0x5A, 0x5B, 0x5C, 0x5D, 0x5E, 0x5F,
               0x60, 0x61, 0x62, 0x63, 0x64, 0x65, 0x66, 0x67,
               0x68, 0x69, 0x6A, 0x6B, 0x6C, 0x6D, 0x6E, 0x6F,
               0x70, 0x71, 0x72, 0x73, 0x74, 0x75, 0x76, 0x77,
               0x78, 0x79, 0x7A, 0x7B, 0x7C, 0x7D, 0x7E, 0x7F,
               0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01,
               0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01,
               0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01,
               0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01,
               0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01,
               0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01,
               0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01,
               0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01, 0x01,
               0xFE, 0xE0, 0xE1, 0xF6, 0xE4, 0xE5, 0xF4, 0xE3,
               0xF5, 0xE8, 0xE9, 0xEA, 0xEB, 0xEC, 0xED, 0xEE,
               0xEF, 0xFF, 0xF0, 0xF1, 0xF2, 0xF3, 0xE6, 0xE2,
               0xFC, 0xFB, 0xE7, 0xF8, 0xFD, 0xF9, 0xF7, 0xFA,
               0xDE, 0xC0, 0xC1, 0xD6, 0xC4, 0xC5, 0xD4, 0xC3,
               0xD5, 0xC8, 0xC9, 0xCA, 0xCB, 0xCC, 0xCD, 0xCE,
               0xCF, 0xDF, 0xD0, 0xD1, 0xD2, 0xD3, 0xC6, 0xC2,
               0xDC, 0xDB, 0xC7, 0xD8, 0xDD, 0xD9, 0xD7, 0xDA
       };

       for(UINT i = 0; i < nSizeKOI8R; i++)
       {
               unsigned char ch = ubArrKOI8RToASCII[pbKOI8R[i]];

               if((ch == 0x01) || (ch == 0x00))
                       ch = chVoidChar;

               lpszASCII[i] = ch;
       }

       lpszASCII[i] = 0;

   return TRUE;
}

Насколько я понял тут создается таблица кодов символов которые соответствую кодировке KOI8-R .
Только не понятно каким образом символ одной кодировки заменяется на символ из другой?
И как это должно выглядеть если, например имеется два Memo : В одном текст с кодировкой KOI8-R, а в другом Windows 1251?
Записан
3V
Администратор
Ветеран
*****
Офлайн Офлайн

Сообщений: 1347



Просмотр профиля WWW
« Ответ #1 : 20 Март 2013, 21:19:37 »

Не могли бы вы помочь разобраться как работает следующий код (взят с вашего форума) ?
Насколько я понял тут создается таблица кодов символов которые соответствую кодировке KOI8-R .
Только не понятно каким образом символ одной кодировки заменяется на символ из другой?

Обычное табличное преобразование.
Таблица из 256 элементов. Индексом таблицы является код транслируемого символа. По этому индексу в таблице берем код символа целевой кодировки.

И как это должно выглядеть если, например имеется два Memo : В одном текст с кодировкой KOI8-R, а в другом Windows 1251?

Наверно так же должно выглядеть. Надо взять текст из одного Memo, прогнать через подобную функцию и запихнуть в другой.
Записан

Страниц: [1]   Вверх
  Печать  
 
Перейти в:  

Powered by MySQL Powered by PHP Powered by SMF 1.1.21 | SMF © 2015, Simple Machines Valid XHTML 1.0! Valid CSS!