Évente hatalmas mennyiségű fát, vagyis erdőt vág ki az emberiség, pontosabban a papíripart kiszolgáló erdőgazdaság. E mennyiség egy része regenerálódik, másik része nem. Hogy mennyi, az most nem fontos. Nem idézek be számokat, akit ezek érdekelnek, nézzen utána, én most a lényegre fogok összpontosítani.
Nyilvánvaló tény, hogy a papíripart vissza fel fogni, az erdőket kímélni kell.
Az erdők óvásának egyik módja az, hogy minél kevesebb papírt használunk. E célból mondtam le én a postán keresztül kézbesített bankszámla-kivonatokról, illetve közüzemi számlákról, hisz teljesen értelmetlen ezek papírformában való kipostázása, amikor tartalmukat könnyen meg lehet nézni az interneten, és a kifizetésük is nálam már évek óta az interneten keresztül történik.
A probléma ezzel csak az, hogy a bankok általában nem teszik elérhetővé ezeket a bankszámla-kivonatokat hosszú ideig. Általában hat hónapig, egy évig van lehetőségük az ügyfeleknek arra, hogy bankszámlatörténetüket lekérdezzék, a bankszámla-kivonatot letöltsék. Ez főleg akkor okoz problémát, ha például valakinek utólag kell bebizonyítania, hogy egy közüzemi számlát vagy társasházi közös költséget befizetett, és tartozásának nem ő az oka, hanem mondjuk a másik fél könyvelője. De van egy másik, komolyabb eset is: ha valaki egyéni vállalkozó, akkor köteles a számlákat 6 évig megőrizni, mert az adóhatóság egy ellenőrzés során szinte biztosan kérni fogja ezek bemutatását. A bankok természetesen tudnak segíteni, sok utánajárás és borsos díj ellenében készítenek számlakivonatot, vagyis drága szolgáltatásként nyújtják azt, amit ingyenesen kellene adniuk.
A bankok nem hivatkozhatnak semmilyen kifogásra. A bankszámlaadatok tárolása évtizedekig, sőt akár évszázadokig biztosítva kell, hogy legyen. Ez így is van, és nem csak a patinás svájci bankok, hanem a hazai bankok esetében is. Ez után már csak egyszerű műszaki kérdés, hogy az ügyfél kérésére ezek az adatok mindenféle pluszköltség nélkül bármikor lekérdezhetőek és letölthetőek legyenek.
A bevezetőmben azt írtam, hogy nem akarok most számokkal dobálózni, de a végére mégis megteszem.
A Google on-line levelezőrendszere, a Gmail 7540 MB tárhelyet biztosít bárkinek a világon. Ingyen és bérmentve. Egy OTP havi bankszámlakivonat mérete PDF formátumban 250 kB-nál nem nagyon szokott nagyobb lenni, tehát ez évi 12×0,250 = 3 MB adat tárolását jelenti.
Tovább menve: 1 GB tárhely (vagyis a Gmail által ingyen adott tárhelynél kb. 7,5-szer kevesebb) 1.000.000.000 / 3 = kb. 333.333.333 év adatainak tárolását biztosítja.
(Most tekintsünk el attól hogy a számítástechnikában 1000 helyett 1024-gyel kell számolni.) Természetesen felesleges a cég szerverén tárolni a havi adatokat akár PDF formában is, ugyanis az amúgy is meglévő adatbázisból, a szűrőfeltételek megadása után ezek az adatok ezredmásodperc alatt generálódnak, és jeleníthetők meg a felhasználó böngészőjében. (Igazából még PFD-re sem kell konvertálni őket, maradhatnak egyszerű szöveges formátumban.) Természetesen az internetfelhasználóknak nem lehet hozzáférést adni az adatbázisokhoz még jelszóval sem, vagyis itt - biztonsági megfontolásokból - átmeneti tárolást (pufferzónát) kell kialakítani, de ez legyen az informatikusok dolga.
Magyarán: az on-line számlázási és internetes bankolási rendszereket üzemeltető cégeknek és bankoknak nincs semmilyen mentségük. Az, hogy ez a szolgáltatás nem biztosított az ügyfeleknek már most és ingyenesen, az az ő szégyenük.
2011. január 15., szombat
2010. december 14., kedd
Levél a magyar Országos Nyugdíjbiztosítási Főigazgatóságnak
Tisztelt Főigazgató úr!
1990 óta élek Magyarországon, Erdélyből települtem át, ahol 9 évet dolgoztam. 2008-ban érdekes dolog történt: a román Nyugdíjigazgatóság - egy kormányrendelet alapján - felszólított mindenkit, hogy a (régi) munkakönyvét adja le a megyei nyugdíjigazgatóságon, ahol beszkennelik, és az adatokat elektronikus adatbázisba veszik fel. Én ezért Budapestről Csíkszeredába utaztam, ahol leadtam a román munkakönyvem, amelyet kb. egy hónap múlva a bátyám juttatott vissza nekem.
Az intézkedés indoka az volt, hogy így amikor valaki nyugdíjra jogosulttá válik, gyorsabb lesz ügyének elbírálása. Azt nem írták le sehol, hogy a korszerűsítés mellett a számítógépes adatrögzítés nyilvánvaló célja az, hogy az állami nyugdíjrendszer költségvetését évekkel, évtizedekkel előre tervezni lehessen, ne érje meglepetés a román állami költségvetést.
Két kérdésem van:
- A magyar állam, a magyar nyugdíjigazgatóság miért nem előrelátó? Miért nem követi a román példát? Ugyanis az én magyar munkakönyvem soha senki nem kérte be azért, hogy az adatokat felvegyék a számítógépes nyilvántartásba. Pedig ez nekem is jó lenne, mert ha elkallódik a munkakönyvem, az sok problémát okozna.
- Miért egy, néhány anyaországi által „románnak” gúnyolt személy kell, hogy megkérdezze ezt Önöktől? Nincsenek a Nyugdíjigazgatóságon stratégiai tervezők?
Tófalvi Péter
2010. december 14.
Címkék:
bürokrácia,
előrelátás,
nyugdíj
2010. október 28., csütörtök
Egy régi álmom: a repülő autó
Régóta álmodom egy olyan személyi közlekedési eszközről, amely nagyobb mozgási szabadságot biztosítana, emellett biztonságos és olcsó lenne.
Az igazi megoldás természetesen az, amit a Steven Spielberg által rendezett E.T. c. sci-fi filmben láttunk, de én ilyennel nem tudok szolgálni. Azért érdemes belenézni a filmbe (7:40-től válik érdekessé):
Nos, a földönkívüli lény által nyújtott repülési élmény után térjünk vissza a földre.
Az én ötletem, sajnos, nem működne árkon-bokron át, hanem elsősorban csak autópályákon.
A mágneses levitáció elvét alkalmaznám, ami azt jelenti, hogy az autópálya szerkezetébe:
A gépjárművek alváza olyan anyagokból készülne, amely taszítóerőt hozna létre az autópálya felületéhez képest. A taszítóerő nem lenne olyan erős, hogy az autó lebegjen, hanem csak a súlyát csökkentené. A lebegés azért nem lenne jó, mert akkor az előrehaladás nem lenne megoldva (bár a maglev vonatoknál alkalmazott elv alkalmazható lenne itt is, de sokkal egyszerűbb ha ezt másként oldjuk meg). A gépkocsikon tehát maradna a kerék, az előrehaladást a kerekek és az útfelület közötti súrlódás biztosítaná. Ha egy 1000 kg-os jármű súlya felére csökkenne, már az is hatalmas üzemanyag megtakarítást jelentene.
Az én repülő autóm tehát nem repülne, még csak nem is lebegne, hanem kevésbé nehezedne az úttestre. Ez is valami?
:-)
Nos, a földönkívüli lény által nyújtott repülési élmény után térjünk vissza a földre.
Az én ötletem, sajnos, nem működne árkon-bokron át, hanem elsősorban csak autópályákon.
A mágneses levitáció elvét alkalmaznám, ami azt jelenti, hogy az autópálya szerkezetébe:
- szigetelt fémvezetékeket helyeznék el, bennük magasfeszültségű árammal, amely mágneses teret generálna, vagy
- állómágnesek lennének elhelyezve, vagy
- maga az autópálya szerkezete mágneses vagy diamágneses tulajdonságú anyagokból készülne.
A gépjárművek alváza olyan anyagokból készülne, amely taszítóerőt hozna létre az autópálya felületéhez képest. A taszítóerő nem lenne olyan erős, hogy az autó lebegjen, hanem csak a súlyát csökkentené. A lebegés azért nem lenne jó, mert akkor az előrehaladás nem lenne megoldva (bár a maglev vonatoknál alkalmazott elv alkalmazható lenne itt is, de sokkal egyszerűbb ha ezt másként oldjuk meg). A gépkocsikon tehát maradna a kerék, az előrehaladást a kerekek és az útfelület közötti súrlódás biztosítaná. Ha egy 1000 kg-os jármű súlya felére csökkenne, már az is hatalmas üzemanyag megtakarítást jelentene.
Az én repülő autóm tehát nem repülne, még csak nem is lebegne, hanem kevésbé nehezedne az úttestre. Ez is valami?
:-)
2010. szeptember 14., kedd
Új helyre költözött a magyar-román on-line szótáram
Új helyre költöztettem, és egyúttal fizetőssé tettem on-line magyar-román internetes szótáram.
Négy év, ebből 2 év ingyenes on-line jelenlét után erre azért volt szükség, mert a szótárkezelő szoftvert kifejlesztő szakember, Olosz Andor, teljesen természetes módon nem várhatta el tőlem, hogy örök időkig ingyenesen biztosítsa a tárhelyet, emellett a szótár nem rekedhet meg jelenlegi formájában, bővíteni kell a szókincset, esetleg pontosítani kell egyes bejegyzéseket, ennek pedig ára van. Ahogy a közmondás tartja: Krisztus koporsóját sem ingyen őrizték.
Bevallom, körülbelül 17 év internetezés után lassan bennem is tudatosul, hogy igazi internetes tartalmat háromféleképpen lehet nyújtani:
Négy év, ebből 2 év ingyenes on-line jelenlét után erre azért volt szükség, mert a szótárkezelő szoftvert kifejlesztő szakember, Olosz Andor, teljesen természetes módon nem várhatta el tőlem, hogy örök időkig ingyenesen biztosítsa a tárhelyet, emellett a szótár nem rekedhet meg jelenlegi formájában, bővíteni kell a szókincset, esetleg pontosítani kell egyes bejegyzéseket, ennek pedig ára van. Ahogy a közmondás tartja: Krisztus koporsóját sem ingyen őrizték.
Bevallom, körülbelül 17 év internetezés után lassan bennem is tudatosul, hogy igazi internetes tartalmat háromféleképpen lehet nyújtani:
- valamilyen szponzort, mentort kell keresni, legyen az állami vagy önkormányzati szerv, non-profit szervezet, alapítvány stb.;
- közösségi munka keretében kell biztosítani a fejlődést, mint például a Wikipédia esetében (de az utóbbi időben ott is gondok vannak a sok vita, a szakmailag nem mindig helytálló szerkesztések miatt!);
- egyszeri díj vagy előfizetés alapján kell nyújtani a hozzáférést, a szolgáltatást.
Én mindhárom lehetőséget mérlegeltem, és végül a harmadik pontot választottam.
Tudom, hogy emiatt sok olyan ember nem fogja tudni használni a szótáram, akiknek szüksége lenne rá, gondolok itt elsősorban a diákokra. Ez nagy fájdalom számomra, és igazából nem is adtam fel még a reményt, hogy eredeti ötletem - mely arról szólt, hogy külső finanszírozás mellett (ez lehetett volna akár Magyarország és Románia oktatási vagy kulturális minisztériuma is) minden erdélyi és magyarországi iskola és könyvtár számára ingyenes hozzáférést adjak. Ennek éves költségvonzata országonként, előzetes becslésem szerint kb. 2500 euró lett volna, figyelembe véve azt is, hogy a megnövekedett forgalom miatt a tárhelyszolgáltató magasabb árkategóriába sorolna át. 2500 euró mai árfolyamon kb. 700 ezer ft, illetve 10 600 új román lej. Döntse el mindenki, hogy megér-e ennyit egy éves hozzáférés az adatbázisomhoz, figyelembe véve, hogy gyakran egyetlen, 3-4 órás táncos-zenés mulatság, szórakoztató műsor támogatására akár ennek többszörösét is odaítélik.
Blogbejegyzésem egy kis eszmefuttatással és anekdotikus történetecskével zárom.
A magyar-román szótár könnyű elérhetőségét azért tartom fontosnak, mert az erdélyi magyarok számára alapvető követelmény, hogy a román nyelvi közegben is magabiztosan mozogjanak. Most a hétköznapi érintkezésekről nem beszélve, másként tárgyalok egy román üzleti partneremmel vagy ügyfelemmel, ha pontosan és azonnal értem a mondanivalóját, és másként, ha nem. Román nyelvű internetes fórumon jegyeztem meg, hogy régen az volt az álláspontunk, hogy ne hagyjuk a megszálló románokat, hogy ránk kényszerítsék a nyelvüket. Ezt őseink az elrománosodástól való félelem miatt mondták. Én 7 évig éltem és tanultam Bukarestben a 80-as években, és teljes mértékben megőriztem magyar öntudatomat, azzal együtt, hogy őseim között valószínűleg románok is voltak. Tehát, a kétnyelvűség nem probléma, sőt, - tettem hozzá ironikusan a fórumon -, nekünk, magyaroknak az az érdekünk, hogy jól ismerjük a románok minden gondolatát, hogy időben fel tudjunk készülni a lépéseikre, és megfelelően ki tudjuk védeni a minket érő támadásokat. Erre az egyik román fórumozó is viccesen hozzátette, hogy hát akkor a románoknak tulajdonképpen az az érdekük, hogy mi ne is tanuljuk meg jól az ő nyelvüket. :-)
Nyilván a szótárak használata, főleg írott formában, ki fog menni a divatból, tehát az én adatbázisom sem örökéletű, de erről a témáról külön Power Point bemutatóm van ("A fordítás és a tolmácsolás jövője"), és valószínűleg írok majd erről is egy későbbi blogbejegyzésemben.
Jelenleg kisebb-nagyobb on-line szótár ebben a nyelvpárban elérhető még a következő helyeken:
***
A teljes tájékoztatás végett közlöm, hogy mind bármely más területen, a magyar-román szótárkészítés terén sem én vagyok az egyedüli szereplő, sőt, vannak olyan szakemberek, akik a nyomtatott szótárkészítés terén az enyémnél nagyobb tapasztalattal rendelkeznek, de az ő szótáraik majdnem kizárólag csak nyomtatásban érhetők el.Jelenleg kisebb-nagyobb on-line szótár ebben a nyelvpárban elérhető még a következő helyeken:
- http://www.dictionar.info/ (az USA-ban élő Ferencz Levente szponzorálásában)
- http://dictzone.com/roman-magyar-szotar/ (szerkesztő: Sárváry Pál, programozói háttér: Jómagam)
- http://www.langtolang.com/
- http://romanmagyar.dicfor.com/hun
- http://www.szotar.ro/?szotar=rohu (egyelőre csak a román->magyar nyelvpárban)
- IATE (az EU többnyelvű terminológiai adatbázisa)
... és biztos vannak vagy lesznek még mások is. A verseny és a változatosság e téren is jó, és szükség van rá, mert fejlődésre serkent.
___________________________
2012. december 14-i frissítés:
Mivel a fizetős módszer nem vált be (az erdélyiek, de mások is hozzászoktak, hogy ilyen tartalmakért nem fizetnek), a szótárat ingyen elérhetővé tettem a Proz.com portálon itt.
2012. december 14-i frissítés:
Mivel a fizetős módszer nem vált be (az erdélyiek, de mások is hozzászoktak, hogy ilyen tartalmakért nem fizetnek), a szótárat ingyen elérhetővé tettem a Proz.com portálon itt.
2010. szeptember 9., csütörtök
Pendrive-ok réme: McRegWizz.exe
A számítógépes adatlopások elkövetői és az IT szakemberek között folyamatos a macska-egér harc, újabb és újabb kártékony programok jelennek meg, amelyekre a védelmi rendszerek fejlesztői próbálnak minél gyorsabban reagálni. A vírusok és trójai falovak a 90-es évek elején többnyire floppy lemezeken terjedtek, de az internet felfutásával a fertőzések terjedésének útvonala kb. 90%-ban a világháló lett. Ezt kivédendő, a különböző szervezetek teljesen logikusan megpróbálták minél inkább elszigetelni érzékeny adataikat az internettől, végső esetben a védeni kívánt gép vagy belső hálózat (intranet) semmilyen kapcsolatban nincs a nyilvános, tehát mindenki által hozzáférhető világhálóval. Persze ezek az elszigetelt gépek is általában rendelkeznek hordozható adattárolók olvasására szolgáló portokkal, ugyanis az adatokat egyik gépről - például a beosztott gépéről a főnök gépére - át kell vinni, és bár szerintem erre teljes mértékben megfelelne az intranet, de mégis a konfigurációk így készültek, kiskaput nyitva ezzel a rosszfiúknak.
A hekkerek következő húzása is logikus volt: olyan trójait („férget”) kell készíteni, amely feltelepül egy internetre csatlakoztatott pendrive-ra, majd amikor ezt a pendrive-ot az internetre nem csatlakoztatott számítógépbe bedugják, átmásolja magát annak memóriájába és adattárolóira. Utána elkezdheti felleltározni, hogy milyen hasznosítható adatok vannak az adott gépen, és már csak arra kell várnia, hogy ugyanazt vagy másik pendrive-ot csatlakoztassanak megint a gépre, és ekkor az összegyűjtött adatokkal meg lehet tenni a visszautat az internet és a végső célpont, az adathalászat kitervelője (pl. egy katonai vagy gazdasági kémszervezet vagy pénzéhes hekker) felé. Természetesen nem csak a nemzetbiztonság és gazdaság van veszélyben, ilyen férgekkel az otthoni felhasználók személyes adatai, bankszámlák, jelszavak stb. is ellophatók.
Valószínűleg több ilyen féreg köröz ma az interneten, és egy az én gépembe is beférkőzött.
A fájl önmaga másolása mellett, szintén a Windows/System32 mappában, elhelyez egy autorun.inf fájlt a következő tartalommal:
[AutoRun]
open=McRegWizz.exe e
shellexecute=McRegWizz.exe e
shell\Auto\command=McRegWizz.exe e
shell=Auto
Nem sok információ van róla az interneten, a Google is keveset tud róla, nincs semmilyen leírás, hogy tulajdonképpen mit tesz, okozott-e már kárt, de biztos, ami biztos, ki kell irtani a PC-ről és a pendrive-okról. Amit én tapasztaltam: felmásolta magát a mobiltelefonom memóriakáryájára is, és folyamatosan próbált rácsatlakozni az internetre. Mivel épp nincs mobilinternetem ez nem sikerült, de az akkumulátort egy-két órán belül teljesen lemerítette.
Most megtanítalak arra, hogy miként teheted meg ezt Windowsban.
***
Egy érdekes, témába vágó cikk.
A hekkerek következő húzása is logikus volt: olyan trójait („férget”) kell készíteni, amely feltelepül egy internetre csatlakoztatott pendrive-ra, majd amikor ezt a pendrive-ot az internetre nem csatlakoztatott számítógépbe bedugják, átmásolja magát annak memóriájába és adattárolóira. Utána elkezdheti felleltározni, hogy milyen hasznosítható adatok vannak az adott gépen, és már csak arra kell várnia, hogy ugyanazt vagy másik pendrive-ot csatlakoztassanak megint a gépre, és ekkor az összegyűjtött adatokkal meg lehet tenni a visszautat az internet és a végső célpont, az adathalászat kitervelője (pl. egy katonai vagy gazdasági kémszervezet vagy pénzéhes hekker) felé. Természetesen nem csak a nemzetbiztonság és gazdaság van veszélyben, ilyen férgekkel az otthoni felhasználók személyes adatai, bankszámlák, jelszavak stb. is ellophatók.
Valószínűleg több ilyen féreg köröz ma az interneten, és egy az én gépembe is beférkőzött.
A kis féreg neve McRegWizz.exe.
[AutoRun]
open=McRegWizz.exe e
shellexecute=McRegWizz.exe e
shell\Auto\command=McRegWizz.exe e
shell=Auto
Nem sok információ van róla az interneten, a Google is keveset tud róla, nincs semmilyen leírás, hogy tulajdonképpen mit tesz, okozott-e már kárt, de biztos, ami biztos, ki kell irtani a PC-ről és a pendrive-okról. Amit én tapasztaltam: felmásolta magát a mobiltelefonom memóriakáryájára is, és folyamatosan próbált rácsatlakozni az internetre. Mivel épp nincs mobilinternetem ez nem sikerült, de az akkumulátort egy-két órán belül teljesen lemerítette.
Most megtanítalak arra, hogy miként teheted meg ezt Windowsban.
- Először is, indítsd el a Feladatkezelőt (Task Manager), lépj a Folyamatok (Tasks vagy Processes) fülre, és keresd meg a McRegWizz.exe bejegyzést (akár több példányban is futhat!) és állítsd le a megfelelő gombbal.
- Utána lépj be a Windows/System32 mappába, ott is keresd meg ezt a fájlt, és töröld kíméletlenül.
- Ezt követően futtasd a Windowsban a "regedit" (Beállítászerkesztő) alkalmazást (DOS parancssorból lehet futtatni), és a Szerkesztés menü Keresés parancsával keresd meg az összes olyan regisztrációs bejegyzést, amelyben szerepel a McRegWizz.exe. Töröld az összest a Del gombbal (kérdésre hagyd jóvá a műveletet minden alkalommal; az F3 funkcióbillentyűvel lehet folytatni a keresést, amíg a végére érsz).

- Ha ezzel kész vagy, futtass egy keresést a Windows Intézőben (File Explorer), és töröld mindenünnen a McRegWizz.exe fájlt, feltéve, hogy vannak bárhol a számítógépen másolatai.
- Ezt követően, át kell vizsgálnod az összes hordozható memóriakártyádat, beleértve a fényképezőgép és a mobiltelefon memóriakártyáját (xD, SD stb.), valamint az összes USB pendrive-ot is.
Amikor ezeket beteszed a kártyaolvasóba, a fertőzött tárolón lévő autorun.inf azonnal el fogja indítani a RegWizz.exe vírust, amelyet a még mindig futó Feladatkezelővel rögvest le kell lőni, az Intézőben meg törölni kell a hordozható memóriakártyáról úgy az autorun.inf-et, mint a McRegWizz.exe fájlt.
Sok sikert!
***
Egy érdekes, témába vágó cikk.
Címkék:
adatbiztonság,
McRegWizz.exe,
trójaiak,
vírusok
2010. augusztus 4., szerda
OFFI: Országos Fordító- és Fordításhitelesítő Iroda
Az alábbi levelet 2003-ban írtam az igazságügyminiszternek.
Azóta a helyzet nem változott, sőt, rosszabb lett. Még rosszabb.
Azóta a helyzet nem változott, sőt, rosszabb lett. Még rosszabb.
Címkék:
fordítás-hitelesítés,
offi
2010. július 6., kedd
Magyar ragozó program
Nemrég fejeztem be egy projektet, amelynek keretében kb. 40 ezer főnév és 4500 melléknév ragozott alakját állítottam elő egy C++ nyelven írt programmal. Az algoritmusok kidolgozása után, a program megírásában nagy segítségemre volt Lakatos Ferenc informatika szakos egyetemi hallgató. Ezúton is köszönet neki!
A magyar nyelv, mint tudjuk, erősen ragozós (agglutináló) nyelv, a szavakhoz háromféle toldalék járulhat: képző, jel vagy rag.
Egy ragozó program természetesen nem tud minden magyar főnevet és melléknevet helyesen ragozni, ugyanis rengeteg a kivétel, amelyeket külön kell kezelni. Ráadásul, a kivételek alól is vannak kivételek! A szavaknak nem csak a formáját kell figyelni, hanem a jelentését is, ehhez pedig emberi intelligencia kell. Például: a tó főnév töbesszáma tavak, de a kilátó többesszáma nem kilátavak, hanem kilátók. A kivételek és a kivételek kivételeinek kezelése után is akad még javítgatnivaló.
A projekt keretében én egészen pontosan 38.084 főnévvel és 4771 melléknévvel dolgoztam, amelyeket akapvetően az on-line magyar-román szótáramból exportáltam, majd ellenőriztem. A korrektúra tehát 38084x56 + 4771x20 = 2 228 124 szóalak ellenőrzését jelentette, amely önmagában is egy hatalmas munka. Ebben 2 munkatárs segített, akik ennek a mennyiségnek kb. 5%-át ellenőrizték, a többi 95% az én feladatom maradt.
A munka egy nagy internetes keresőszolgáltatónak készült, a projekt végső célja az internetes keresés optimalizálása (SEO). Konkrétabban: amikor a keresőben beírjuk például a „ház” szót, a keresés eredményei között ennek a szónak ragozott alakjai is (házam, házad, háza, házak stb.) jelenjenek meg. [Megj.: Ez a példa talán nem is a legjobb, hisz a „ház” kulcsszóra könnyű megtalálni a „házak” szót is, de például a „szerelem” szó esetében ez nem ilyen könnyű, mert többesszáma ”szerelmek”.] Tehát, aki mostantól az interneten keres, annak elvileg több és pontosabb találat adódik.
Részemről a munka menete a következő volt:
A projektért kapott díjazás természetesen nem fedezi a befektetett energiát, de ennek ellenére élveztem ezt a munkát, és szívesen dolgoznék a folytatásán. Ugyanis a 266 szóalaknak a negyede sem készült el.
A magyar nyelv, mint tudjuk, erősen ragozós (agglutináló) nyelv, a szavakhoz háromféle toldalék járulhat: képző, jel vagy rag.
- A képzők megváltoztatják a szó jelentését, gyakran szófaját is. A képzőkkel igéből igét, névszóból igét, igéből névszót és névszóból névszót tudunk alkotni. A szótárakban ezek általában önálló bejegyzésként szerepelnek, a projekt keretében ezekkel nem foglalkoztam.
- A ragok a szó mondatban betöltött szerepét jelölik, a jelentését nem módosítják, tehát nem alkotnak új szót. Példák: birtokos rag, tárgyrag, határozói ragok...
- A jelek sem alkotnak új szót, sőt, a szó mondatbeli szerepét sem változtatják meg. Példa a jelekre: többesszám jele, birtokos jel...
Egy ragozó program természetesen nem tud minden magyar főnevet és melléknevet helyesen ragozni, ugyanis rengeteg a kivétel, amelyeket külön kell kezelni. Ráadásul, a kivételek alól is vannak kivételek! A szavaknak nem csak a formáját kell figyelni, hanem a jelentését is, ehhez pedig emberi intelligencia kell. Például: a tó főnév töbesszáma tavak, de a kilátó többesszáma nem kilátavak, hanem kilátók. A kivételek és a kivételek kivételeinek kezelése után is akad még javítgatnivaló.
A projekt keretében én egészen pontosan 38.084 főnévvel és 4771 melléknévvel dolgoztam, amelyeket akapvetően az on-line magyar-román szótáramból exportáltam, majd ellenőriztem. A korrektúra tehát 38084x56 + 4771x20 = 2 228 124 szóalak ellenőrzését jelentette, amely önmagában is egy hatalmas munka. Ebben 2 munkatárs segített, akik ennek a mennyiségnek kb. 5%-át ellenőrizték, a többi 95% az én feladatom maradt.
A munka egy nagy internetes keresőszolgáltatónak készült, a projekt végső célja az internetes keresés optimalizálása (SEO). Konkrétabban: amikor a keresőben beírjuk például a „ház” szót, a keresés eredményei között ennek a szónak ragozott alakjai is (házam, házad, háza, házak stb.) jelenjenek meg. [Megj.: Ez a példa talán nem is a legjobb, hisz a „ház” kulcsszóra könnyű megtalálni a „házak” szót is, de például a „szerelem” szó esetében ez nem ilyen könnyű, mert többesszáma ”szerelmek”.] Tehát, aki mostantól az interneten keres, annak elvileg több és pontosabb találat adódik.
Részemről a munka menete a következő volt:
- a feladat felmérése, munkaterv kidolgozása: kb. 2 hét;
- szoftverfejlesztés: kb. 1 hónap;
- korrektúra: kb. 3 hét.
A projektért kapott díjazás természetesen nem fedezi a befektetett energiát, de ennek ellenére élveztem ezt a munkát, és szívesen dolgoznék a folytatásán. Ugyanis a 266 szóalaknak a negyede sem készült el.
Feliratkozás:
Bejegyzések (Atom)



