Természetesen, itt van egy egyedibb változat a megadott szövegről: "A mentális konstrukciók adatorientált azonosítása egy korpuszban a Mozaik módszer és a kapcsolódó technikák alkalmazásával - Magyar Nyelvészeti Kutatóközpont." Ha szeretnél még több vál


Az emberi elme tele van különféle nyelvi struktúrákkal, amelyek tudatosan bővülnek a nyelvtanulás során, különféle explicit módszerek révén. Jelenleg két fő megközelítést alkalmaznak a nyelvi minták korpuszból való kinyerésére: az egyik az elméleti nyelvészek manuális kutatása, akik hipotéziseik alátámasztására gyűjtenek adatokat, míg a másik a nagy nyelvi modellek, amelyek statisztikai algoritmusok segítségével egyre inkább emberihez hasonló szövegeket generálnak. Azonban mindkét módszernek megvannak a maga korlátai. A nyelvmodellek tudása csupán statisztikai alapú, ami miatt nem értelmezhető a nyelvtudomány hagyományos eredményeivel, míg a manuális keresések eredményei gyakran a kutatók szubjektív intuícióját tükrözik, ami statisztikai szempontból nem mindig megbízható.

A Mozaik módszer kiterjesztéseként létrejött modell célja, hogy csökkentse a kutató intuíciójának szerepét és így a manuális munkát a korpuszbeli minták keresésekor. A megközelítés moduláris természete miatt nyelvi jelenségek széles skálája vizsgálható vele, és ezáltal a nagy nyelvmodellekhez hasonló képességekkel bíró, interpretálható modell jön létre, amely tovább tudja építeni a nyelvről alkotott ismereteinket, hidat képezve a két megközelítés között.

Az előadásomban a nyelvtudomány különböző irányzatait figyelembe véve tárgyalom a motivációs modellt. Részletesen bemutatom a rendszer alapját képező Mozaik módszer működését, és esettanulmányok segítségével ismertetem az eljárás jelenlegi állapotát, működését és jelentőségét. Végül egy szélesebb perspektívába helyezem a témát, felvázolva a jövőbeli fejlesztési és alkalmazási lehetőségeket.

Az előadó által javasolt olvasmányok listája

Bajzát Tímea, Indig Balázs és Kalivoda Ágnes (2024) munkájukban a Történeti Magánéleti Korpusz igei szerkezeteinek n-gram alapú elemzésével foglalkoznak, amely a "A fatens felelt pedig..." cím alatt jelent meg. A tanulmány a XX. Magyar Számítógépes Nyelvészeti Konferencián került bemutatásra, amelyet Berend Gábor, Gosztolya Gábor és Vincze Veronika szerkesztett. A kötet a Szegedi Tudományegyetem Informatikai Intézetének kiadásában jelent meg, és a 43-58. oldalon található.

Indig Balázs és Bajzát Tímea (2024) a "Compressing Noun Phrases to Discover Mental Constructions in Corpora - A Case Study for Auxiliaries in Hungarian" című tanulmányukban a magyar nyelv segédigéit vizsgálják, a névvel ellátott kifejezések tömörítésének módszerét alkalmazva. A kutatás a 9. Nemzetközi Workshop a Uralic Nyelvek Számítógépes Nyelvészetéről című konferencián kerül bemutatásra, amelyet Mika Hämäläinen, Flammie Pirinen, Melany Macias és Mario Crespo Avila szerkeszt. A tanulmány a Helsinki ACL kiadásában jelent meg, 96-103. oldalon.

Related posts