Comment 19 for bug 1411404

Revision history for this message
Laimonas Vėbra (laimis) wrote :

Na, taip, esu neteisus, pagaliau supratau: substrings.pl utf-8 kodas naudojamas skaičiuojant eilutės simbolines pozicijas ir ilgį, kai pattern'ai yra utf-8 koduotėje ir kai jie verčiami į hyphen formatą. T.y. įrankiui reikia žinoti, kad tai multibaitinės eilutės ir atitinkamai skaičiuoti eilutės simbolių pozicijas ir ilgį. Jei turime jau galutinį hyphen'o formatą, tai nieko skaičiuoti tiesiog nebereikia (jau suskaičiuota) ir galima jį tiesiog perkoduoti (iso <-> utf8).
Taip, tikrai galime perkoduoti, nors vis tiek manau, kad kurį laiką geriau būtų platinti/laikyti abu failus (dėl jau minėtos priežasties, kad senesniuose OO su utf-8 gali veikti nekorektiškai). Kita vertus, turėti du galutinius failus yra neblogai ir dėl vieno praktinio aspektėlio: nesigauna tiesmukiškai perkoduoti failą, nes antraštėje įrašyta koduotė. Reikėtų ją perrašyti, tad negali readme tiesiog paprastai nurodyti, kad „jei netinka utf-8, tai iconv it“.