Ékezetes történetek a számítógépes nyelvészet hőskorából

A történet akár azzal is kezdődhetne, hogy Prószéky Gábor a hetvenes évek végén kapott egy jó tippet. Miszerint a Közgázon vannak azok a lyukkártyák, amelyek Papp Ferenc szóvégmutató szótárának anyagát tartalmazzák. El is ment az egyetemre – és meg is találta a lyukkártyákat. Olyan ládákban hevertek, amelyeken az egyetemi hallgatók üldögéltek. Alóluk mentette ki hát a felbecsülhetetlen értékű adattárat, amit taxin vitt el az MTA SZTAKI számítóközpontjába, ahol Kornai András vállalta el, hogy a KGST-régió akkori egyik legnagyobb teljesítményű számítógépén beolvassa.

A tíz év alatt kiszáradt lyukkártyáknál meg kellett várni, amíg egy kis nyirkosságot magukba szívnak. A lényeg az ilyen részletekben lakozik. Meg az egyesekben és a nullákban. Végül sikerült kiolvasni a fájlokat – ehhez igényelni kellett egy külön diszk csomagot, amely 120 megabájt volt.

A hátulról sorrendbe rakott szavak szótára óriási lökést adott a tudománynak – később, talán a nyolcvanas években Papp Ferenc is megkapta floppyn az anyagot, így folytathatta a kutatásait.

Ékezetes történetek a számítógépes nyelvészet hőskorábólTechnikatörténet? Igen. Tudománytörténet? Igen. A Neumann János Számítógép-tudományi Társaság (NJSZT) Informatikatörténeti Fóruma egészen szédítő és világformáló sztorikat hoz el az érdeklődő közönség számára: a Nagy Szakmai Műhelyek sorozatban évekkel ezelőtt még az első számítástechnikai kutatóintézetek munkatársait kértük fel előadásokra, ma már közvetlen közelmúltunkat és jelenünket formáló cégek is látókörünkbe kerültek. Ami még fontosabb: az előadásokat rögzítjük, az NJSZT-nek köszönhetően ezek a videók elérhetőek a kutatók számára, ahogy lassanként a személyek, intézmények és termékek adattára is szépen gyarapszik.

A legutóbbi, november 24-i alkalmon a MorphoLogic cég, a számítógépes nyelvészet hazai legismertebb szereplője kapott szót. Az estébe nyúló délutánt a cégalapító-vezető, Prószéky Gábor moderálta.

Ékezetes történetek a számítógépes nyelvészet hőskorábólNemcsak moderált, de több előadást is tartott a konferencia folyamán, szuggesztív előadóként könnyed szellemességgel kötötte át a korszakokat. Hiszen a gépi nyelvészet régebbi, mint a cég: az 50-es, 60-as években már voltak számítógépek, kísérleteztek az olykor hidegháborús jelentőségű gépi fordítással. A 60-as, 70-es években már olyan szakemberek, mint Dömölki Bálint matematikus, informatikus és Kiefer Ferenc nyelvész, egyre komolyabb kutatásokat kezdeményeztek. A 70-es, 80-as években megjelentek az ezekhez már valóban használható számítógépek (a 80-as években az asztali PC-k is elterjedtek) és megjelentek a nyelvészeti programok, amelyekből a 80-as, 90-es évekre termékek lettek. 

1990-től nyelvészeti technológiáról, 2000-től már külön iparágról beszélhetünk, 2010-től pedig az interneten terjedő megoldások és az ezeket kiérlelő szükségletek valóban forradalmasítják ezt a területet.

Pár hónapja volt hangos a net a valós időben fordító fülhallgatótól – engem még jobban meglepett, hogy a sci-fibe illő megoldáshoz hasonló, valós idejű, „beszélgetős” gépi fordítási kísérlet már évekkel ezelőtt lezajlott Magyarországon, a MorphoLogic egyik ünnepségén.

Ékezetes történetek a számítógépes nyelvészet hőskorábólA délután folyamán maga a legendás Kiefer Ferenc professzor engedett bepillantást a számítógépes nyelvészet születésébe (egyébként a tudományterületnek az 1931-ben született tudós a „keresztapja”), majd hallhattuk többek között Kis Ádámot, aki a SZÁMALK-nál és a SZAK kiadónál születő könyv-mérföldkövekről, nyomtatott és elektronikus kiadásokról is mesélt.

Más előadásokból megismerhettük a MorphoLogic születését (1991 nyarán egy balatoni kertben kezdték „összerakni” a helyesírás-ellenőrző programot),ahogy a cég központjait, dolgozóit, termékeit, sőt a rivális termékeket is.

A cég történelmileg szerencsés pillanatban született, amikor már lehetett újat alkotni egy magáncégnek (a politikai-gazdasági rendszerváltás után, de még abban a korban, amikor egy félperifériás ország kis cége is alkothatott nagyot: más se csinált a világon nagyobbat).

Ékezetes történetek a számítógépes nyelvészet hőskorábólGarázscégből nemzetközi műhely – erről szólt tehát ez a hangulatos, nagy érdeklődés övezte délután (és nem, nem az Apple-ről volt szó), no meg mondatelemző, szótani elemző, helyesírás-ellenőrző programokról, szoftverlokalizációról (ezt a szót a szövegszerkesztőm egyébként aláhúzza pirossal), nyelvtechnológiai fejlesztésekről, fordítóprogramokról, a cég és kutatóintézetek, egyetemek közötti, gyümölcsöző együttműködésről.

(Most egyébként „perszonálunió” van, mert Prószéky Gábor egyben a Nyelvtudományi Intézet igazgatója.)

Magyarország jól áll a nyelvtechnológiai kutatásokban, nem kis részt ennek a szakmai műhelynek köszönhetően. Nagyon is megérdemelte hát Prószéky Gábor és csapata, hogy bemutassuk a nagyok között.

Az esemény részletes programja: http://njszt.hu/neumann/esemeny/20171024/itf-meghivo-itf-rendezvenyre-a-morphologic-es-a-magyar-szamitogepes-nyelves
Hamarosan az előadások a neten is megtekinthetőek, addig is érdemes a korábbi konferenciák előadásaiba belekukkantani ITT.

Képes Gábor