Статус проекту: поточний (програмна частина призупинена).
Період: з 2002 (версія 2.0 з 2005).
Автор: Дмитро Кузьменко.
Наукові консультанти: В.М. Сорокін (програмування).
Мета проекту — створити великий український мистецький (передовсім літературний) портал з детальною біобібліографічною інформацію про персоналій та їхні праці. Своєрідний аналог www.imdb.com, але для літератури (у перспективі і для інших видів мистецтва та науки). В основі такого проекту має знаходитись, як задумувалось спочатку, детально систематизована і параметризована база даних (у версії 1.0 це був Microsoft Access, у 2.0 — SQL). Потенційно проект мав включати можливість створення і повтотекстової бази даних текстів — оригіналів і перекладів (більшість з яких, утім, мала бути у закритому доступі через авторські права). Повнотекстова база даних задумувалась виключно для наукових цілей, з метою надання матеріалів для літературознавчих та лінгвістичних (лінгвостатика, теорія і практика перекладу, прикладна лінгвістика) досліджень. Програмна частина в обох версіях писалась на мові C# й реалізувалась у ASP.NET web-додатках. Версія 2.0 (альфа) доступна за адресою babylon.mova.info. Наповнювалась база даних через спеціально створені windows-додатки.
Уперше до цієї теми я почав звертатись на старших курсах університету, тоді ж була створена версія 1.0. Згодом, вже в рамках роботи в лабораторії комп'ютерної лінгвістики, я розпочав втілення версії 2.0, власне "Вавилону". Утім, з початком роботи над кандидатською дисертацією у 2006 році довелось "заморозити" цей проект з ряду причин. По-перше, не мав на нього достатньо часу у зв'язку з дисертацією. По-друге, виникла потреба брати участь у кількох інших проектах лабораторії, які були більш нагальними. По-третє, почав детальніше продумувати концепцію і зрозумів, що програмна реалізація має багато недоліків, відбирає дуже багато зусиль й швидко застаріває, і краще було б використати якусь з існуючих безкоштовних систем (наприклад, MediaWiki), зосередившись на філологічній та концептуальній частині роботи.
Після захисту дисертації я обов'язково повернулось до реалізації цього проекту, а поки що поступово збираю різну інформацію і детальніше розробляю концепцію.
Це чорновий опис проекту, пізніше зроблю більш детальний і науковий.
Історія світової літератури (а також кіно, мистецтва) завжди була предметом моїх наукових зацікавлень. Також я завди цікавився бібліографією, полюбляв енциклопедичний стиль організації матеріалу та мав хобі колекціонувати книги (спершу звичайні, а потім і електронні тексти). Усе це й призвело до появи ідей створення біографічно-бібліографічно-текстового Інтернет-проекту.
Перша версія проекту писалась на C# з використанням .NET, тобто це був aspx-сайт для windows-сервера. Оскільки безкоштовних серверів на цій операційній системі немає, а коштів на платний у мене не було, цей сайт так і залишився на моєму домашньому комп'ютері. Сайт, до того ж, містив велику кількість ілюстрацій (фони), що було відчутно для трафіку й робило б оплату хостінгу завеликою. Це була, швидше, тестова версія проекту, де я пробував реалізувати усе, що мені хотілось і як хотілось, безвідносно до доцільності. Багато що зробити не вдалось, багато що я просто не встиг, але загальний результат мене влаштував.
Уся інформація збергалась у базі даних Microsoft Access, розподілена за багатьма параметрами. Заповнювалась ця база через форми в Access.
Сайт містив більш або менш повну інформацію на трьох мовах (українська, англійська, російська) про 40 письменників і груп анонімних творів. Ось зміст сайту:
Для кожного письменника або групи анонімних творів ("Кельтський епос", "Ісландські саги") генерувалась сторінка з фото (ілюстрацією), коротким описом (1-2 абзаци) та повним списком праць. Це була бібліографічна сторінка, хоч і не в строгому сенсі слова, адже у список був за назвами творів, а не книжковими виданнями. Такі списки творів мені завжди здавались більш зручними і зрозумілими, ніж плутані бібліографії видань, де один твір міг багато разів перевидаватися, входити до різних збірок і т.д. У створенні такого списку я брав за основу принципи сайту www.fantasticfiction.co.uk. Цей список розподілявся за типами творів (серії, романи, повісті, оповідання, збірки тощо), містив мінімальну бібліографічну інформацію (назва в оригіналі, жанр, дата першої публікації, співавторство, входження до збірки тощо). У розділи "серії" твори групувались за тематичними серіями і підсеріями (особливо це поширено в белетристиці, але також сюди входили традиційні дилогії, трилогії та подібне), причому розгортання на підсерії могло бути безкінечним. Тут я зробив більш зручну систему, ніж на www.fantasticfiction.co.uk. Романи і оповідання, що входили в серії, потім додатково дублювались у розділах "романи", "оповідання" чи інших. Увесь список генерувався автоматично згідно порядку розділів, а в межах розділів за датою першої публікації (якщо невідомо, то за абеткою). Існувала також можливість відсортувати список за абеткою або хронологічно.
Окрім цієї головної сторінки персоналії, були три додаткові сторінки: біографія, критика та електронні тексти. На сторінці "Біографія" була розміщена біографія автора, а коли мова йшла про групу анонімних текстів тут розміщувалась історичні відомості про час і місце їхньої появи. На сторінці "Критика" розміщувався розгорнений загальний літературознавчий аналіз творчості автора. На сторінці "Електронні тексти" розміщувався перелік наявних в базі даних електронних текстів, що стосувались автора. Це були як оригінальні тексти, так і переклади. Електронних текстів для версії 1.0 було підготовлено лише кілька, просто для тестування системи.
Після цього у 2003 році розробка сайту була згорнена. Основна причина — неможливість його викладення в мережі Інтернет.
Після згортання aspx версії проекту, я долучився до створення однієї електронної бібліотеки. Її концепція в цілому була розроблена мною, також я підготував ряд текстів для неї. Навіть назву вона взяла з мого проекту, тільки скорочену — Ae Lib. Спільного з попереднім проектом було мало — це був статичний html сайт, який було легко розмістити в мережі на безкоштовному хостінгу. Що й було зроблено за адресою www.ae-lib.narod.ru. Бібіотека містила тексти оригіналів та українських перекладів світової літеартури, частково філософії та філологічні праці. Була зібрана досить повна колекція текстів античної і середньовічної літератури, дитячих книг, але згодом проект завмер і я цілковито відійшов від його участі. Нині він знаходиться за адресою www.ae-lib.org.ua і практично не оновлюється.
Основна причина згортання проекту — невизначеність з авторськими правами на тексти. Незважаючи на суто науково-освітню спрямованість проекту і те, що на сайті публікувались в основному тексти давніх літеартур, все одно їх перекладачі могли бути проти таких публікацій. До того ж, ми публікували і тексти сучасних літератур і белетристики, так що, зрештою, хтось з перекладачів чи видавництв подав скаргу і хостінг закрив сайт. Утім, це сталось вже через кілька років після того, як я відійшов від роботи над проектом.
Другою важливою причиною згортання стала його громіздкість і незручність. Те, що дозволяло легко розмістити сайт в мережі, робило неможливим зручне його поповнення, редагування, не кажучи вже за можливості пошуку і групування, які надають параметризовані бази даних. У резальтаті на сайті не було основного блоку попереднього проекту — біографій і бібліографій. Це була просто збірка текстів, більш-менш згрупована за періодами і авторами.
Утім, напрацювання цього сайту, як і його прорахунки, обов'язково будуть враховані при подальшій роботі над проектом "Вавилон".
Це відродження мого первісного проекту було здійснено вже в рамках моєї роботи в лабораторії комп'ютерної лінгвістики. Цей сайт теж створювався на aspx (бо це єдина програмна технологія, якою я достатньою мірою володію), але вже мав місце для розташування: окремий розділ на порталі www.mova.info. Проте довелось відмовитись від зображень на фонах сторінок й перейти з бази даних Microsoft Access та більш серйозну Microsoft SQL. До того ж на той момент у мене вже виникло більш деталізоване уявлення про дані проекту і принципи їх структурації, через що довелось створювати заново усю програмну частину і базу даних. Але зовні проект мало відрізнявся від попереднього.
Різниця були в наступному.
1. Я не став робити тематичне групуваня авторів за періодами і типами, відклавши створення цього об'ємного блоку на майбутнє, а обмежився простим алфавітним групуванням на механімом пошуку. Приципи тематичного групування авторів були теоретично розроблені, але програмно я їх втілити не встиг. У версії 1.0. це групування було зроблено дуже простим, недостатньо деталізованим і формалізованим способом, тому я прагнув цілковито переробити цей блок.
2. Була розроблена сторінка для генерації інформації про твір, чого не було в попередній версії.
3. Була більш формалізована інформація про авторів, за зразком www.imdb.com, з потенційною можливістю їх подальшого групування за місцем народження або смерті, датами народження або смерті, національністю, громадянством тощо.
4. Я не встиг реалізувати у другій версії систему генерування безкінечної вкладеності підциклів у серіях. Великої потреби у цьому не було, бо в дану версію для тестування вносились автори серйозної літератури, де безкінечні серії романів практично не зустрічаються.
5. Не була також реалізовний блок з електронними текстами. Хоч в теоретичній концепції він був передбачений, але за його реалізацію я навіть не брався, вирішивши зосередитись на біобібліографічній складовій порталу.
6. Була створена категоризація авторів за літературними преміями (у доступному в мережі варіанті цього немає, бо блок залишився трохи недоробленим).
Хоч портал був дуже детально розроблений концептуально, реалізувати я встиг лише невелику частину. Розробка була припинена, оскільки я усвідомив, що технічні принципи роботи сайту дуже швидко застарівають, їх потрібно постійно оновлювати і доповнювати, а мені було набагато важливіше займатись розробкою концепції сайту, безпосередньо його наповненням, структурацією матеріалів, на що в мене просто не вистачало часу після програмування. Я прийшов до думки, що найкраще буде використати якусь готову безкоштовну систему управління контектом, аніж створювати все самостійно з нуля. Звичайно, у традиційних CMS значно важче належним чином структурувати дані (що легше робити створенням власної оболонки для вже структурно розробленої бази даних), зате зводяться до мінімуму витрати часу на технічну роботу, а також робиться дуже зручним наповнення і редагування вмісту сайту, можливість залучення для цих завдань багатьох інших людей.
Додатковими причинами згортання робіт були поява більш нагальних проектів у лабораторії, де мені довелось брати участь, а також початок моєї роботи над дисертацією, який вимагав багато часу.
Сайт розміщено за адресою babylon.mova.info.
Згорнувши програмну реалізацію, я не залишив роботу над розробкою концепції та наповнення сайту.
Я вів тривалий пошук підходящої оболонки для сайту і, зрештою, зупинився на технологіях www.OpenLibrary.org або www.MediaWiki.org з певними змінами і доповненнями, чи, у крайньому випадку, на сильно видозміненому www.Drupal.org. Хоч усі три варіанти ще далекі від ідеалу.
Я уклав ряд оглядових статей про різні періоди розвитку світової літератури (від античності до початку 19 століття) за принципами "Історії світової літератури" РАН, тобто, з урахуванням літератур усіх регіонів світу на тому чи іншому історичному (хронологічному) етапі. При всіх недоліках такого підходу мені він здається найбільш правильним і зручним для створення електронної бази даних, оскільки єдиний є достатньо формалізованим. Статті були опубліковані мною у Вікіпедії.
Була більш детально розроблена концепція проекту, зокрема його бібліографічна частина. Я вирішив, що пріоритетним завданням у власне бібліографії (описі книжкових і журнальних публікацій) має бути створення повної бази даних усіх існуючих українських перекладів зарубіжної літератури. Через це я розпочав збирати існуючі бібліографічні списки на цю тему, що публікувались у різний час у журналі "Всесвіт".
Були приблизно розроблені принципи створення повтотекстової бази даних текстів. Питання дотримання авторського права я вирішив розв'язати шляхом створення суто наукової бази даних без прав загального доступу (окрім тих текстів, які не захищені авторським правом, або де автори дадуть дозвіл).
Активну роботу над проектом, зокрема і над його "видимою", програмною реалізацією, я планую розпочати після завершення роботи над дисертацією. Вірогідно, це станеться після 2011 року.