klaida „prisijunges“ netaisoma

Bug #526414 reported by Rimas Kudelis
14
This bug affects 2 people
Affects Status Importance Assigned to Milestone
Ispell-LT (MOVED TO GITHUB)
Fix Released
Medium
Laimonas Vėbra

Bug Description

Parašius „prisijunges“, šis žodis nepabraukiamas (bent jau „Firefox“, naudojančioje MySpell žodyną). Įtariu, kad gal čia susiplaka daiktavardžio ir veiksmažodžio „jungės“ požymiai? Reikėtų kažkaip išspręsti.

Related branches

Revision history for this message
Rimas Kudelis (rq) wrote :

tiksliau ne „jungės“, o „jungė“

Revision history for this message
Rimas Kudelis (rq) wrote :

beje, taip pat netaisomas žodis „prisijungės“, kuris irgi yra klaida.

Revision history for this message
Rimas Kudelis (rq) wrote :

Dar: netaisomos ir tokios klaidos, kaip susijunge, atsijunge, sujunge, atjunge ir pan.

Kaip suprantu, šie žodžiai yra linksniuojami kaip daiktavardžiai, dėl to taip ir gaunasi.

Revision history for this message
Albertas Agejevas (alga) wrote :

Bugo priežastis yra ta, kad sutrauka.py skriptas sutraukia jungė/D ir jungė/PNX ir į lietuviu.dict išmeta:
jungė/DNPSXabcdfhjkmnoprtvw

Taip jad susikombinuoja /D ir /p, ir išeina prisijungės, prisijungių, prisijungėms, prisijunges, prisijungėmis, prisijungėse.

Reikia taisyti sutraukos skriptą, kad priešdėlius sutraukinėtų tik veiksmažodžiams. Šiaip tas skriptas yra tik optimizacija. Galima būtų išjungti, bet žodynų dydis gerokai išaugs.

Revision history for this message
Rimas Kudelis (rq) wrote :

Gal galima tą skriptą kažkaip pamodifikuoti, kad nejungtų skirtingų kalbos dalių tarpusavyje (ar bent jau veiksmažodžių su daiktavardžiais)? Ar nėra kaip jas atpažinti?

Revision history for this message
Albertas Agejevas (alga) wrote :

Aišku, galima.

Revision history for this message
Rimas Kudelis (rq) wrote :

Kas galėtų pataisyti? :)

Revision history for this message
Rimas Kudelis (rq) wrote :

Pažiūrėjau komentarą sutrauka.py antraštėje:

  Sutraukia skirtingus afiksus prie vieno žodžio:
  baigtis/D
  baigtis/T ----> baigtis/DT

  Be šito MySpell varikliukas pamiršta vieną iš formų.

Įdomu, ar šita problema MySpell'e vis dar yra? Ir ar ji yra HunSpell'e? Galbūt šis skriptas realiai išvis nebereikalingas?

Revision history for this message
Laimonas Vėbra (laimis) wrote : Re: [Bug 526414] Re: klaida„prisijunges“ netaisoma

Rimas Kudelis rašė:
> Pažiūrėjau komentarą sutrauka.py antraštėje:
>
> Sutraukia skirtingus afiksus prie vieno žodžio:
> baigtis/D
> baigtis/T ----> baigtis/DT
>
> Be šito MySpell varikliukas pamiršta vieną iš formų.
>
> Įdomu, ar šita problema MySpell'e vis dar yra? Ir ar ji yra HunSpell'e?

> Galbūt šis skriptas realiai išvis nebereikalingas?

Tik tiek, kad kaip jau minėjo Albertas, (kiek) išsipučia žodynas.
Aš ruošiuosi pekratyti visus priešdėlinius veiksmažodžius (sutrauka.py
nėra tokia gudri; dar galima žodyną suspausti virš 100 kB).
Kol kas (ar apskritai), manau, tegu būna.
Galiu pataisyti, nors geriau, jei tai padarytų pats autorius. O gal jau
daro, ruošiasi? Jei ne -- tegu užsimena, pataisysiu.

Revision history for this message
Rimas Kudelis (rq) wrote :

Ką konkrečiai čia vadini autoriumi?

Revision history for this message
Laimonas Vėbra (laimis) wrote :

Rimas Kudelis rašė:
> Ką konkrečiai čia vadini autoriumi?

Hmm, buvau įsitikinęs, kad tai Alberto darbo vaisius, dabar matau kebil
pėdsakus, tai, sakykime, vienas jų.

Revision history for this message
Albertas Agejevas (alga) wrote : Re: [Bug 526414] Re:klaida„prisijunges“netaisoma

On Tue, Feb 23, 2010 at 07:40:09PM -0000, Laimonas Vėbra wrote:
> Rimas Kudelis rašė:
> > Ką konkrečiai čia vadini autoriumi?
>
> Hmm, buvau įsitikinęs, kad tai Alberto darbo vaisius, dabar matau kebil
> pėdsakus, tai, sakykime, vienas jų.

Mano, mano darbas. Galiu pataisyti. Bet, spėju, ir Rimas gali :-D

Matyt, reiks paeksperimentuoti su OOo, ar atskyrus /D ir /P nepames
vieno iš jų. Jei pames, sprendimas bus tokius variantus palikt kaip
/DP, bet išskleisti visus veiksmažodžių priešdėlius.

Albertas

Revision history for this message
Rimas Kudelis (rq) wrote : Re: [Bug 526414]Re:klaida„prisijunges“netaisoma

2010.02.24 09:50, Albertas Agejevas rašė:
> On Tue, Feb 23, 2010 at 07:40:09PM -0000, Laimonas Vėbra wrote:
>
>> Rimas Kudelis rašė:
>>
>>> Ką konkrečiai čia vadini autoriumi?
>>>
>> Hmm, buvau įsitikinęs, kad tai Alberto darbo vaisius, dabar matau kebil
>> pėdsakus, tai, sakykime, vienas jų.
>>
> Mano, mano darbas. Galiu pataisyti. Bet, spėju, ir Rimas gali :-D
>

Abejoju. :)

> Matyt, reiks paeksperimentuoti su OOo, ar atskyrus /D ir /P nepames
> vieno iš jų. Jei pames, sprendimas bus tokius variantus palikt kaip
> /DP, bet išskleisti visus veiksmažodžių priešdėlius.
>

Jo, gal naudingiausia būtų. Beje, aš jau porą kartų bandžiau ieškoti,
kuo MySpell žodynai skiriasi nuo HunSpell, bet taip ir nesugebu apie tai
jokios konkrečios info rasti (išskyrus tai, kad HunSpell leidžia juos
unikodu pateikti). Albertai, gal ir apie tai ką nors žinai? Aš čia
svarstau, gal vietoj (ar greta) MySpell žodynų verta pradėti ir HunSpell
daryti...

Rimas

Revision history for this message
Kęstutis Biliūnas (kebil) wrote : Re: [Bug526414]Re:klaida„prisijunges“netaisoma

Tr, 2010 02 24 08:05 +0000, Rimas Kudelis rašė:

> kuo MySpell žodynai skiriasi nuo HunSpell, bet taip ir nesugebu apie tai
> jokios konkrečios info rasti (išskyrus tai, kad HunSpell leidžia juos
> unikodu pateikti). Albertai, gal ir apie tai ką nors žinai? Aš čia
> svarstau, gal vietoj (ar greta) MySpell žodynų verta pradėti ir HunSpell

Kaip aš suprantu, tokio dalyko kaip MySpell, nebelieka (nebenaudojama).
Rašybos tikrinimui bus naudojama HunSpell, tačiau visi myspell žodynai
tinka ir tas žodyno vardas su "myspell" dalimi reiškia, kad naudojamos
ne visos HunSpell galimybės (features).

O tos papildomos HunSpell features labiausiai domina tas kalbas, kuriose
yra naudojama daug sudurtinių žodžių. Apie kitus HunSpell privalumus
nieko nežinau.

--
Kęstutis Biliūnas <email address hidden>
http://kebil.ghost.lt | GnuPG-Key ID: F6E7A452

Revision history for this message
Laimonas Vėbra (laimis) wrote :

Rimas Kudelis rašė:

>> Mano, mano darbas. Galiu pataisyti. Bet, spėju, ir Rimas gali :-D
>>
>
> Abejoju. :)

Taisau.

>
>> Matyt, reiks paeksperimentuoti su OOo, ar atskyrus /D ir /P nepames
>> vieno iš jų. Jei pames, sprendimas bus tokius variantus palikt kaip
>> /DP, bet išskleisti visus veiksmažodžių priešdėlius.

Ten, rodos, buvo labai senas *myspell'o* bug'as. Dabar to myspell'o
(oo2+, ff3+) kaip ir nebeliko...

> Jo, gal naudingiausia būtų. Beje, aš jau porą kartų bandžiau ieškoti,
> kuo MySpell žodynai skiriasi nuo HunSpell, bet taip ir nesugebu apie tai
> jokios konkrečios info rasti (išskyrus tai, kad HunSpell leidžia juos
> unikodu pateikti). Albertai, gal ir apie tai ką nors žinai? Aš čia
> svarstau, gal vietoj (ar greta) MySpell žodynų verta pradėti ir HunSpell
> daryti...

Na hunspell'as tai iš esmės pažangesnis myspell'o palikuonis, nors
žodynai yra suderinami. Manau, kad verta būtų pradėti daryti
hunspell-lt, TAČIAU TIK atskirai (įmanoma efektyviau, lanksčiau aprašyti
afiksų taisykles, nei tik transformuoti ispell->myspell), nes dabartinis
generuojamas myspell'o žodynas tinka hunspell'ui.
Kitaip tariant, tai atskiras ir sudėtingesnis už ispell-lt projektas
(ypač jei pasinaudoti išskirtinėmis hunspell'o savybėmis); jam tikrai
nėra prasmės ir galimybių glaustis po ispell-lt skėčiu.

Revision history for this message
Albertas Agejevas (alga) wrote :

Rimai, Kęstuti, Laimi, čia ne vieta aptarinėti hunspell formato ypatybes. Atsakiau į ispell-lt listą, prašom tęsti ten. https://lists.akl.lt/pipermail/ispell-lt/2010-February/000478.html

Laimonas Vėbra (laimis)
Changed in ispell-lt:
importance: Undecided → Medium
assignee: nobody → Laimonas Vėbra (laimis)
status: New → In Progress
Revision history for this message
Laimonas Vėbra (laimis) wrote :

Pataisyta 83 revizijoje. Žodynas padidėjo nežymiai (~ 6kB).
Pati sutrauka sumažina žodyną virš 460 kB (solidžiai).

Changed in ispell-lt:
status: In Progress → Fix Committed
Laimonas Vėbra (laimis)
Changed in ispell-lt:
status: Fix Committed → Fix Released
To post a comment you must log in.
This report contains Public information  
Everyone can see this information.

Other bug subscribers

Remote bug watches

Bug watches keep track of this bug in other bug trackers.