ІТ

Д.Кузьменко. До питання про створення електронного корпусу художніх текстів

Опубліковано: Кузьменко Д. До питання про створення електронного корпусу художніх текстів //  Studia Linguistica. Vol. IV. — К.: ВПЦ “Київський університет”, 2010. — С. 327-330.

Анотація: У статті розглядаються передумови створення електронного літературного корпусу, описується умовна модель такого корпусу, його необхідні складові, форма представлення інформації для кінцевого користувача, можлива взаємодія з лінгвістичними корпусами, його сфера застосування.
 
Ключові слова: корпусна лінгвістика, літературний корпус, лінгвістичний корпус, база даних, електронна бібліотека
 
Активний розвиток останніми роками корпусної лінгвістики засвідчує, що цей напрям стає одним з провідних серед прикладних мовознавчих досліджень. Основне завдання корпусної лінгвістики традиційно вбачають у створенні електронних лінгвістичних корпусів, на зразок «Британського національного корпусу» або «Національного корпусу російської мови» (www.ruscorpora.ru). Однак з корпусною лінгвістикою тісно пов’язане створення повнотекстових баз даних, на зразок «Thesaurus Linguae Graecae» (www.tlg.uci.edu) або проекту «Персей» (www.perseus.tufts.edu), що зазвичай є водночас лінгвістичними й літературними. Перспективність, необхідність та актуальність подібних повнотекстових корпусів є очевидною — дослідники літературознавці (чи представники інших наукових дисциплін) отримують увесь масив потрібних для досліджень художніх творів (чи інших текстів) з повним інструментарієм у вигляді систем пошуку і цитування, бібліографії, тезаурусів і глосаріїв, а у випадку поєднання з лінгвістичним корпусом — ще й повну лінгвістичну інформацію про тексти та їхні одиниці.

Still Life

Відеогра, 2005

Розробник: Microïds

Платформа: PC, Xbox

Жанр: квест

Сюжет: Дія гри починається у 2004 році. Головна героїня - агент ФБР Вікторія Макферсон (онука Густава Макферсона, детектива із відеогри "Post Mortem") розслідує серію кривавих вбивств повій в Чикаго. Відвідуючи батька на Різдво, Вікторія знаходить щоденник свого діда - Густава, який був приватним детективом і розслідував схожі вбивства в Празі у 20-х роках минулого століття. У процесі гри гравцеві належить перемикатися між цими двома епохами і грати поперемінно то за Густава, то за Вікторію, щоб з'ясувати зв'язок між подіями 70-річної давнини і сучасними злочинами.

Автоматичний синтез словоформ

Статус проекту: завершено
Період: 2002-2003
Автор: Дмитро Кузьменко
Науковий керівник: доц. Наталія Петрівна Дарчук
Наукові консультанти: Віктор М. Сорокін (програмування), доц. Тетяна О. Грязнухіна (теоретичні засади), к.т.н. Тетяна П. Любченко (організація матеріалу).
Установи: лабораторія комп'ютерної лінгвістики Інституту філології КНУ ім. Т.Шевченка; Мовно-інформаційний фонд АН України

Робота над цим проектом проводилась у рамках написання бакалаврської роботи. Проект включав загальне описання механізмів автоматичного (програмного) синтезу словоформ, створення діючої програми для такого синтезу та лінгвістичної бази даних для синтезу словоформ англійського іменника і дієслова.

Д.Кузьменко. Комп'ютерна лінгвістика і Web 2.0

Опубліковано: Studia Linguistica. Vol. II. — К.: ВПЦ “Київський університет”, 2009. — С.: 214-219.

УДК 81'33
Анотація: Теоретичні дослідження з комп’ютерної лінгвістики та їхнє прикладне втілення є обов’язковим елементом більшості сучасних Інтернет-проектів. У статті йдеться про роль прикладної лінгвістичної складової у принципово нових мережевих концептуальних та технологічних явищах, що умовно називаються мережею другого покоління або Web 2.0.
Ключові слова: комп’ютерна лінгвістика, прикладна лінгвістика, Web 2.0, Інтернет, інформаційні технології, обробка природної мови.
 
Комп’ютерна лінгвістика відіграє суттєву роль у всіх сферах розвитку та функціонування сучасних інформаційних технологій, зокрема у мережі Інтернет. Комунікативний аспект Інтернету є визначальним, а основним засобом комунікації була і залишається природна мова, тому автоматичне й автоматизоване комп’ютерне опрацювання природної мови є складовою більшості сучасних мережевих інформаційних технологій. Для визначення найбільш актуальних напрямків досліджень з прикладної лінгвістики у цій сфері на даний момент корисними є загальні огляди найновіших мережевих тенденцій та роль у них прикладних лінгвістичних компонентів. Подібних досліджень в українському прикладному мовознавстві ще не було, а Інтернет розвивається надзвичайно динамічно і швидко, тому є велика потреба у всебічному розгляді даного питання. Ми не претендуємо на вичерпність висвітлення теми, а маємо за мету звернути на неї увагу й охарактеризувати її у загальних рисах.

Д. Кузьменко. Формальна класифікація парадигм і синтез словоформ англійського іменника

Дмитро Кузьменко, студент IV курсу відділення української філології Інституту філології КНУ ім. Т.Шевченка

Повна назва статті: Формальна класифікація парадигм і синтез словоформ англійського іменника (для системи українсько-англійського автоматичного перекладу).

Опубліковано: Мовні і концептуальні картини світу. Випуск 9. - К.: ВПЦ "Київський університет", 2003. - 403 с. - С.: 142 - 144.

Частиною будь-якої системи автоматичного перекладу є формальне представлення парадигматики, тобто набору граматичних форм у межах граматичного класу. Це необхідно, по-перше, для укладання парадигматичних класів, що використовуються і в автоматичному морфологічному аналізі, і в синтезі. По-друге, щоб укласти класифікацію, позначивши кожну граматичну форму і граматичний клас певним кодом, що використовуватиметься протягом всього процесу перекладу.

Граматичний клас – це формальний аналог поняття "частина мови". Відмінність полягає у функціональному підході до їх виділення. Тому, наприклад, іменники поділятимуться на два граматичних класи – власні та загальні назви, а прикметники, дієприкметники, порядкові числівники складатимуть один граматичний клас – ад’єктивів.

Парадигматичний клас – це слова, парадигма яких містить однакову кількість граматичних форм, що утворюються за однаковим принципом стосовно синтетичних і аналітичних мовних засобів. Для синтетичних форм це буде однаковий набір флексій, однакові буквенні і позиційні зміни.

Syndicate content
Хостинг сайту: EOMY.NET