Comment 4 for bug 531816

Revision history for this message
Laimonas Vėbra (laimis) wrote : Re: [Bug 531816] [NEW]sutrauka.py:priešdėliniai veiksmažodžiaipraranda kelias formas

Albertas Agejevas rašė:
> On Thu, Mar 04, 2010 at 10:11:35AM -0000, Laimonas Vėbra wrote:
>> Reziumuojant:
>>
>> Susitaikius su ir taip DABAR vykstančiu priešdėlinių darinių/formų:
>>
>> {tebe, be, te, nebe} |priešdėlis| žodis
>>
>> praradimu, ir nebetikrinant ar afiksų žymų aibės persidengia, žodyną būtų galima
>> suglaudinti dar virš 50 kB,
>>
>> ARBA atvirkščiai -- siekiant, kad nebūtų praradimų, kaip tik nereikėtų tokių žodžių
>> (jei priešdėlinis žodis turi /X, /N žymas) glaudinti; žodynas tikrai padidėtų virš 300 kB.
>>
>> Reikia apsispręsti, laukiu pasvarstymų.
>
> Teisingas sprendimas -- pereiti prie hunspello kaip pagrindinio
> formato ir pasinaudojus jo galimybėmis pasiekti ir žodyno
> kompaktiškumą ir korektiškumą.

Būtų teisinga apie tai kalbėti ne čia... ;-)

Kad jau užsiminei, tai (trumpai ir nepamirštant topic'o):
Sprendimas teisingas, bet ilgas ir sudėtingas. Nepadaroma per mėnesį ir
per tris, bet tarkime jau pradėjom...
Ypač kalbant apie žodyno kompaktiškumą ir korektiškumą. Ir tai abejo
reiškia atskirą projektą (arba bent jau jų atsiejimą viduje), nes iš
kompaktiško ir korektiško hunspell generuoti bent jau tokį koks dabar
ispell-lt variantą būtų, manau, per daug kompleksiška. Ar verta eiti tuo
keliu? Gal tegu būna tas hunspell-lt laisvas nuo ispell-lt ir myspell
uodegų bent jau ta prasme, kad jų trūkumai ir jų pačių buvimas niekaip
neįtakotų hunspell-lt ir jo tobulinimo; nereikėtų prie jų derintis (pvz.
nebūtų galima laisvai kaitalioti afiksų taisyklių, žodynų, nes tai
reikštų sinchronišką hunspell->ispell|myspell transformatorių perdarymą?)

Kol kas (ispell-lt) palieku beveik taip kaip buvo (dar truputis
suglaudintų priešdėlių; -50 kB prie dabartinių -300 kB ir jų praradimų).
Beje, dar turime laisvų žymų rezerve ir dar būtų galima pridėti
„priešdėlių su dalelytėmis rinkinį“ (/f > [te, tebe, ne, nebe, be] pxf)
žodyno kompaktiškumui ir korektiškumui pagerinti, bet nežinau ar verta...?