Труды КНЦ вып.9 (ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ вып. 10/2018(9))

« в е л и ч и н о й » п р и с у т с т в у е т п р и л а г а т е л ь н о е « н е ж е л а т е л ь н о й » , к о т о р о е с о о т в е т с т в у е т п а т т е р н у « S p a c e » . Ч и с л о N у с т а н а в л и в а е т с я р а в н ы м с р е д н е м у ч и с л у л е к с е м в п р е д л о ж е н и я х т е к с т а , т а к к а к п р е д п о л а г а е т с я , ч т о и с к о м а я ц е п о ч к а б у д е т в п р е д е л а х о д н о г о п р е д л о ж е н и я . Л е к с и к о - с и н т а к с и ч е с к и е п а т т е р н ы « C l a s s A » и « C l a s s B » о р и е н т и р о в а н ы н а о б н а р у ж е н и е л е к с е м , с о о т в е т с т в у ю щ и х в е р о я т н ы м э к з е м п л я р а м к л а с с о в . Э т о м о г у т б ы т ь с у щ е с т в и т е л ь н ы е ( N 1 , N 2 ) , м е с т о и м е н и я ( P n 1 , P n 2 ) и л и к о н к р е т н ы е с и н о н и м ы н а и м е н о в а н и й к л а с с о в ( N 1 < s y n o n y m A n > , N 2 < s y n o n y m B n > ) . Н а б о р с и н о н и м о в п р и г е н е р а ц и и л е к с и к о - с и н т а к с и ч е с к о г о п а т т е р н а б е р е т с я и з в н е ш н е г о с л о в а р я . Н а д а н н ы й м о м е н т и с п о л ь з у е т с я о н л а й н с л о в а р ь о т к о м п а н и и « Я н д е к с » Я н д е к с . С л о в а р ь , д о с т у п к к о т о р о м у о с у щ е с т в л я е т с я ч е р е з е г о п р о г р а м м н ы й и н т е р ф е й с ( A P I ) . П а т т е р н ы « R e l a t i o n » и « R e v R e l a t i o n » п о з в о л я ю т о б н а р у ж и т ь в т е к с т е г л а г о л , с о о т в е т с т в у ю щ и й о т н о ш е н и ю м е ж д у к л а с с а м и . О н д о л ж е н б ы т ь с о г л а с о в а н п о р о д у и ч и с л у ( у с л о в и я N 1 . n = V . n и N 1 . g = V . g ) с л е к с е м о й ( с у щ е с т в и т е л ь н ы м и л и м е с т о и м е н и е м ) , о б н а р у ж е н н о й с п о м о щ ь ю п а т т е р н а « C l a s s A » . П а т т е р н « R e v R e l a t i o n » о б н а р у ж и в а е т ц е п о ч к и с г л а г о л о м в с т р а д а т е л ь н о м з а л о г е ( у с л о в и е V . r = y e s ) . П а т т е р н ы и з в л е ч е н и я п о з в о л я ю т п о л у ч и т ь и з р а с п о з н а н н ы х ц е п о ч е к о т д е л ь н ы е л е к с е м ы , с о о т в е т с т в у ю щ и е в е р о я т н ы м э к з е м п л я р а м к л а с с о в и о т н о ш е н и я м . П о л у ч е н н ы й н а б о р л е к с и к о ­ с и н т а к с и ч е с к и х п а т т е р н о в , с о х р а н я е т с я в о н т о л о г и и т о г о C D P , п о к о т о р о м у п р о и з в о д и л а с ь е г о г е н е р а ц и я . Программная реализация технологии П р е д с т а в л е н н а я т е х н о л о г и я б ы л а р е а л и з о в а н а н а я з ы к е J a v a в в и д е н а с т о л ь н о г о п р и л о ж е н и я - г е н е р а т о р а л е к с и к о - с и н т а к с и ч е с к и х п а т т е р н о в L S P a t G e n . Д л я р а з р а б о т к и г р а ф и ч е с к о г о и н т е р ф е й с а и с п о л ь з о в а л а с ь п л а т ф о р м а J a v a F X . П р и л о ж е н и е с о с т о и т и з 2 о с н о в н ы х м о д у л е й : м о д у л я г е н е р а ц и и п а т т е р н о в и м о д у л я т е к с т о в о г о а н а л и з а . М о д у л ь г е н е р а ц и и п а т т е р н о в в к л ю ч а е т j a v a - к л а с с ы , р е а л и з у ю щ и е ф у н к ц и и а н а л и з а о н т о л о г и и и в ы я в л е н и я п о д х о д я щ и х д л я г е н е р а ц и и O W L - а к с и о м , н а с т р о й к и п а р а м е т р о в г е н е р а ц и и ( к о р р е к т и р о в к а л е к с е м , п о л у ч е н н ы х и з о н т о л о г и и , и х л е м м а т и з а ц и я и ф о р м и р о в а н и е с п и с к а и х с и н о н и м о в ) и ф о р м и р о в а н и я л е к с и ч е с к и х п а т т е р н о в . Л е м м а т и з а ц и я п р о и з в о д и т ь с я с п у т е м в ы з о в а п р о г р а м м ы m y s t e m - л е м м а т и з а т о р а о т к о м п а н и и Y a n d e x . С п и с о к с и н о н и м о в и с х о д н ы х л е к с е м д л я в к л ю ч е н и я в ф о р м и р у е м ы й л е к с и к о ­ с и н т а к с и ч е с к и й п а т т е р н ф о р м и р у е т с я п у т е м о б р а щ е н и я к в е б - с е р в и с у « Я н д е к с . С л о в а р ь » - h t t p s : / / d i c t i o n a r y . y a n d e x . n e t . М о д у л ь т е к с т о в о г о а н а л и з а в ы п о л н я е т ф у н к ц и и в ы з о в а в н е ш н е г о л е к с и к о - с и н т а к с и ч е с к о г о а н а л и з а т о р а L S P L д л я а н а л и з а у к а з а н н о г о п о л ь з о в а т е л е м т е к с т а с п р и м е н е н и е м с ф о р м и р о в а н н о г о п а т т е р н а , о б р а б о т к у п о л у ч е н н ы х р е з у л ь т а т о в и п р е д с т а в л е н и е н а й д е н н ы х т е к с т о в ы х ф р а г м е н т о в . Г р а ф и ч е с к и й и н т е р ф е й с в к л ю ч а е т 3 о к о н н ы е ф о р м ы , с о о т в е т с т в у ю щ и е э т а п а м ф о р м и р о в а н и я и и с п о л ь з о в а н и я л е к с и к о - с и н т а к с и ч е с к о г о п а т т е р н а . П е р в а я ф о р м а о т о б р а ж а е т с я п р и з а г р у з к е о н т о л о г и и и п о з в о л я е т в ы б р а т ь а к с и о м ы , к о т о р ы е н е о б х о д и м о и с п о л ь з о в а т ь п р и г е н е р а ц и и ( р и с . 1 ) . 125

RkJQdWJsaXNoZXIy MTUzNzYz