Re: Kontroll drejtshkrimi dhe fjalor për Shqipen. Tastierë Shqip
bscemscs,
Nuk propozova dhe as ngula këmbë në njërën mënyrë apo në një tjetër për zgjidhjen e problemit. Pyetja ime ishte e thjeshtë dhe konkrete:
"A ka mundësi të përdoret kjo pjesë e programit apo moduli përkatës si një ndihmë për krijimin e një fjalori "spellchecker" për Shqipen?
Më tej, a ka dije ndokush nëse ekziston ndonjë variant "spellchecker" për Shqipen diku?"
Nuk vura në dyshim aftësitë profesionale të askujt, as nuk mund të marr me mend se një dikush konkret, me kualifikime dhe i përshtatshëm për temën, ekziston diku. Në fakt, po të ishte ndryshe, s'kisha pse i drejtohesha forumit: mund të të nisja ty një mesazh dhe e mbyllnim këtë kapitull.
Mendimi im: është e panevojshme të diskutojmë për hierarki dhe aftësi vetiake të njërit apo tjetrit. Nuk jam i interesuar për këtë, nuk më bëhet vonë se në cilën kategori më klasifikojnë.
Ajo që më bën të mendohem është vetëm mungesa, (e papërligjur që nga dalja e programeve "opensource"), e programeve që flasin shqip. Ndërkohë kanë kaluar rreth 20 vjet nga koha kur kompjuteri filloi të bëhet pjesë e së përditshmes. Dhe në shqip, nuk ka pothuaj asnjë program që komunikon shqip me përdoruesin. Im atë nuk mund të mësojë Anglisht në moshën 60 vjecare.
Mbrapsht në anën teknike të problemit nga ku zumë fill: nuk këshillova aspak shkrimin e çdo fjale, një nga një, deri sa ti dalë fundi Shqipes! Pyeta nëse do ishte e mundur që modulin që përdoret për spellchecking tek OO ta përdornim për të filluar dicka. Kjo është krejt e ndryshme nga hartimi i një liste të thjeshtë fjalësh duke kopjuar me dorë një fjalor cfarëdo.
Nuk diskutoj se kush e ka bërë Linux dhe sa vjet shkollë kishte!
Pse shpërdorojmë kohën me gomarllëqe si këto. Në vend që të merremi me atë që na mungon, atë që i mungon pjesës më të madhe tonës, merremi me dicka krejt boshe: bëhet, nuk bëhet...
Ndërkohë që për gjuhë të tjera është bërë! Atëherë pse jo për Shqipen? Sepse shqiptarët s'duan të lodhen apo të provojnë? E kanë më kollaj të mburren dhe të shqyejnë njëri tjetrin sesa të ulen dhe të shkruajnë me dorë 60 apo 100 mijë fjalë, (po marrim rastin më të keq të realizimit). Po po nuk e bëmë ne shqiptarët, cilin presim ta bëjë? MS? Të na e shesë pastaj
500 e kusur Euro për përdorues në trajtën e një “MS Office Albanian language support included”? Dhe ti luajmë fenë me të kopjuar ilegalisht, sic u mësuam të gjejmë zgjidhje të rehatshme por dritëshkurtra, që çojnë paranë atje ku nuk duhet?
Ne nuk kemi nevojë vetëm për një "notepad" në Shqip: kemi nevojë për sa më tepër programe në Shqip, sepse jo të gjithë kanë dhuntinë e gjuhëve të huaja, por të gjithë do kenë nevojë të përdorin kompjuterin. Që të mos bëjnë sherr pas 300 vjetësh " se pse shqiptarët nuk patën një "interface" të tyren që në fillimet e erës së kompjuterit, se mbetën prapa botës, se nuk i do njeri, se nuk i ndihmon kush?"
Kompjuteri asnjëherë nuk do të zëvendësojë logjikën e përdoruesit, ndaj nuk duhet synuar në krijimin e një spellchecker-i që do të zëvendësonte mendjen e përdoruesit. Por çfarëdo realizim tjetër, i afërt për nga funksionet me trurin e njeriut, do ishte më i vlefshëm se sa hiçi i tanishëm (me kaq sa dimë).
Edhe sikur 20 fjalë të ndryshme të së njëjtës rrënjë të na duhet të shkruajmë, nuk ka arsye logjike pse të ngurrojmë.
Një listë që të shfaqë:
punoj,
punon,
punojmë,
punoni,
punojnë,
duke punuar,
punova,
punuan,
punuat,
punuam,
si mundësi zgjedhjeje kur dikush ka shkruajtur gabimisht "ounoj", nuk ndryshon aspak në thelb nga një listë:
work
works
working
worked
që shfaqet kur dikush shkruan gabimisht "vorked".
Ndryshimi i vetëm është që ky i fundit mund të jetë banues i Redmond-it dhe i pari banues i Memaliajt.
Por që të dy kanë të njëjtën të drejtë të përdorin gjuhën e nënës në jetën e përditshme.
Vijon një përgjigje nga dikush i pyetur rreth temës:
From :
Geoff Kuenning <geoff@cs.hmc.edu>
> I'm trying to find out how could I make a spellchecker for the Albanian
> language, or any xxxxxx.hash dictionnary file which could work with AbiWord
> or OpenOffice programs...
The first thing you will need is a word list. The best way to get one
is to take a lot of published documents, extract the correct words,
and turn them into a list. The hard part is that you want to avoid
having any incorrect words.
Once you have a word list, you need an affix file. That gives you two
things: the character set, and the affixes. At first, you don't have
to have affixes. You can use another language file to start with (do
you use ISO 8859-1 for Albanian?), and just delete all the affix
definitions (after "prefixes" and "suffixes" -- see the ispell(4)
manual page). Run your dictionary file through munchlist to make sure
it is ready to be used, and then use buildhash to make a trial
dictionary.
After that, you can start building a real affix file. Use the
"findaffix" and "tryaffix" scripts to get suggestions for affixes.
Then write entries in the "prefixes" and "suffixes" sections. You can
use affix files from other languages as a guide. Whenever you improve
the affixes, run the original word list through munchlist.
Building a dictionary is an iterative process. It takes quite a while
to build up a word list. One thing I do is to use the "I" command to
insert words into my personal dictionary when I'm working on
documents, and then I later add those words to the main dictionary.
Another technique is to fix up a few words every day, adding forms
that aren't already there.
Please let me know if you have more questions.
--
Ja një nga rrugët për të filluar, (Thanks Geoff!), që ne në inat e sipër me njëri tjetrin nuk patëm rastin ta kalonim nëpër mend: në vend të futjes së fjalëve me dorë, një nga një, mbledhja e sa më tepër materiali nga faqet Shqip në rrjet dhe shpërbërja e tyre në një listë fjalësh që do duhet përpunuar më pas.
Një nga ju programuesët ose cilido me njohuri programimi, e ka rradhën tani.
Ëndërr,
Për të patur funksionin që kam përmendur tek OO, futu në Tools==>AutoCorrect/Autoformat dhe aty, pasi të kesh punuar për pak kohë me tekste Shqip do shohësh edhe fjalë në Shqip. Tek “Max Entries” vendos “10,000” që të mundet OO të rregjistrojë më tepër fjalë. Deri sa të mbushen 10 mijë, do kemi gjetur mënyrën se si të zmadhojmë këtë kufi.
besnik