МІНІСТЭРСТВА АДУКАЦЫІ РЭСПУБЛІКІ БЕЛАРУСЬ
УСТАНОВА АДУКАЦЫІ
“ГРОДЗЕНСКІ ДЗЯРЖАЎНЫ УНІВЕРСІТЭТ ІМЯ ЯНКІ КУПАЛЫ”
Зацвярджаю
Дэкан філалагічнага
факультэта
_______В.К.Царлюкевіч
“__”__________2001 г.
Корпусная лінгвістыка
Навучальная праграма
спецкурса для студэнтаў спецыяльнасці
Г.02.01.03 “Беларуская мова і літаратура” са
спецыялізацыяй “Камп’ютарная лінгвістыка”
Абмеркавана и рэкамендавана да зацвярджэння:
на пасяджэнні кафедры агульнага і славянскага
мовазнаўства, пратакол № __ад “__”_____2001 г.;
на пасяджэнні савета філалагічнага факультэта,
пратакол № __ад “__”_____2001 г.
Гродна 2001
I. Моўны матэрыял у лінгвістычным даследаванні. Паняцці моўнага матэрыялу, матэрыялу лінгвістычнага даследавання, моўных дадзеных, моўных рэсурсаў. Традыцыйныя спосабы збору, захоўвання і апрацоўкі моўных дадзеных. Сувязь об’ёму моўных дадзеных са ступенню аб’ектыўнасці і даставернасці атрыманых вынікаў даследавання. Камп’ютарныя моўныя рэсурсы, іх віды. Машынныя фонды моў.
II. Зыходныя паняцці корпуснай лінгвістыкі. Праблемная галіна як вобласць рэалізацыі моўнай сістэмы. Корпус дадзеных як вынік адлюстравання праблемнай галіны. Адзінка захоўвання корпуса моўных дадзеных. Корпус тэкстаў як від корпусу моўных дадзеных. Тыпы корпусаў тэкстаў: даследчыя корпусы; ілюстрацыйныя корпусы; дынамічныя (маніторныя) і статычныя корпусы; паралельныя корпусы тэкстаў.
III. Спосабы фармавання і захавання корпусаў моўных дадзеных. Структураванне корпусаў. Парог адлюстравання як суадносіны паміж корпусам дадзеных і праблемнай галіной пры яе прапарцыянальным звужэнні. Параметрызацыя праблемнай галіны як аснова для звужэння, рэлевантнага для плануемага даследавання. Асаблівасці фармавання корпусаў тэкстаў. Індэксаванне зыходнага моўнага матэрыялу пры фармаванні корпусаў тэкстаў. Архіў, корпус, лінгвістычная база дадзеных.
IV. Патрабаванні да корпусаў моўных дадзеных з пункту гледжання карыстальніка. Рэпрэзентатыўнасць, паўната, эканамічнасць як агульныя характарыстыкі корпусаў дадзеных. Структурызацыя матэрыялу і крытэрый самадастатковасці. Камп’ютарная (праграмная) падтрымка корпусаў дадзеных. Спецыяльныя праграмныя сродкі для размёткі і апрацоўкі корпусаў тэкстаў.
V. Вопыт распрацоўкі корпусаў тэкстаў. Фундаментальныя корпусы тэкстаў і іх характарыстыка. Нацыянальныя корпусы тэкстаў. Корпусы размоўных (вусных) тэкстаў. Паняцце натацыі для спецыфічных відаў і тыпаў тэкстаў. Прыклады міжнародных праектаў у галіне корпуснай лінгвістыкі. Інтэрнет як корпус тэкстаў. Методыка пабудовы корпусаў беларускай мовы.
VI. Сферы ўжывання корпусаў моўных дадзеных. Аўтаматызацыя лінгвістычных даследаванняў і выкладання філалагічных дысцыплін. Распрацоўка сучасных методык навучання замежным мовам. Ужыванне корпусаў тэкстаў у сістэмах аўтаматычнай апрацоўкі тэкставай інфармацыі, у тым ліку ў сістэмах машыннага перакладу.
Літаратура
Корпусная лингвистика // Баранов А.Н. Введение в прикладную лингвистику. – М.: УРСС, 2001. – С.112-137.
Biber, D., Conrad, S., Reppen, R. Corpus linguistics. Investigating Language Structure and Use. – Cambridge University Press, 1998.
Kennedy, G. An Introduction to Corpus Linguistics. – Longman, L. & N.Y., 1998.