Статус проекту: поточний (програмна частина призупинена).
Період: з 2002 (версія 2.0 з 2005).
Автор: Дмитро Кузьменко.
Наукові консультанти: В.М. Сорокін (програмування).
Мета проекту — створити великий український мистецький (передовсім літературний) портал з детальною біобібліографічною інформацію про персоналій та їхні праці. Своєрідний аналог www.imdb.com, але для літератури (у перспективі і для інших видів мистецтва та науки). В основі такого проекту має знаходитись, як задумувалось спочатку, детально систематизована і параметризована база даних (у версії 1.0 це був Microsoft Access, у 2.0 — SQL). Потенційно проект мав включати можливість створення і повтотекстової бази даних текстів — оригіналів і перекладів (більшість з яких, утім, мала бути у закритому доступі через авторські права). Повнотекстова база даних задумувалась виключно для наукових цілей, з метою надання матеріалів для літературознавчих та лінгвістичних (лінгвостатика, теорія і практика перекладу, прикладна лінгвістика) досліджень. Програмна частина в обох версіях писалась на мові C# й реалізувалась у ASP.NET web-додатках. Версія 2.0 (альфа) доступна за адресою babylon.mova.info. Наповнювалась база даних через спеціально створені windows-додатки.
Уперше до цієї теми я почав звертатись на старших курсах університету, тоді ж була створена версія 1.0. Згодом, вже в рамках роботи в лабораторії комп'ютерної лінгвістики, я розпочав втілення версії 2.0, власне "Вавилону". Утім, з початком роботи над кандидатською дисертацією у 2006 році довелось "заморозити" цей проект з ряду причин. По-перше, не мав на нього достатньо часу у зв'язку з дисертацією. По-друге, виникла потреба брати участь у кількох інших проектах лабораторії, які були більш нагальними. По-третє, почав детальніше продумувати концепцію і зрозумів, що програмна реалізація має багато недоліків, відбирає дуже багато зусиль й швидко застаріває, і краще було б використати якусь з існуючих безкоштовних систем (наприклад, MediaWiki), зосередившись на філологічній та концептуальній частині роботи.
Після захисту дисертації я обов'язково повернулось до реалізації цього проекту, а поки що поступово збираю різну інформацію і детальніше розробляю концепцію.
Це чорновий опис проекту, пізніше зроблю більш детальний і науковий.
Статус проекту: завершено
Період: 2002-2003
Автор: Дмитро Кузьменко
Науковий керівник: доц. Наталія Петрівна Дарчук
Наукові консультанти: Віктор М. Сорокін (програмування), доц. Тетяна О. Грязнухіна (теоретичні засади), к.т.н. Тетяна П. Любченко (організація матеріалу).
Установи: лабораторія комп'ютерної лінгвістики Інституту філології КНУ ім. Т.Шевченка; Мовно-інформаційний фонд АН України
Робота над цим проектом проводилась у рамках написання бакалаврської роботи. Проект включав загальне описання механізмів автоматичного (програмного) синтезу словоформ, створення діючої програми для такого синтезу та лінгвістичної бази даних для синтезу словоформ англійського іменника і дієслова.