Початкова сторінка

МИСЛЕНЕ ДРЕВО

Ми робимо Україну – українською!

?

Попередня підготовка матеріалів для бази даних “Пам’ятки України”

М.В.Панченко

База даних “Пам’ятки України” покликана обслуговувати великий масив інформації, збір і нагромадження якої було розпочато задовго до створення будь-яких комп’ютерних систем. До того ж необхідно зазначити, що документовані звістки про історичні події та пов’язані з ними конкретні, географічно визначені об’єкти (власне те, що зараз входить до поняття “нерухомі пам’ятки”) формувались і зберігалися за стихійними, вірніш – ситуаційно визначеними правилами. Це стосується також інформації про персоналії, про величезний масив різноманітного речового матеріалу, письмові джерела та ін., тобто про ті типи даних, які в тому чи іншому контексті пов’язані з пам’ятками і обслуговуються відповідними підсистемами бази. З розвитком науки, зокрема – історичних дисциплін та архівної справи, цей процес входить у більш системні рамки; впорядковується структура зберігання й, звичайно, форми посилань. Деякої уніфікації набувають певні типи документації, що безпосередньо стосується даної теми – наприклад, з’явилась усталена (хоч і не завжди дотримувана) форма археологічного звіту. Однак навіть у “формалізованих” видах документів (не кажучи вже про ті, що з’явились раніше) внутрішній спосіб викладу відрізняється довільністю побудови та “розповідним” стилем. Вважати це за недолік було б недоречно – адже багатство синтаксичних форм лише сприяє кращій передачі змісту та полегшує його засвоєння. Однак, між логічними структурами документів на паперовій основі та документами електронних інформаційних систем існує досить відчутна різниця, яка змушує проектувальників маневрувати, шукаючи “золоту середину” між свободою викладу матеріалу (при неминучих втратах в науково-аналітичних можливостях) та глибоким, часто – громіздким структуруванням інформації, яке, однак, надає широкий спектр використання введених даних. Останнє, окрім іншого, напряму залежить від застосування індексованих термінів й відлагодженої системи зв’язків, що забезпечують “діалог” між окремими записами з різних підсистем. В цілому це вимагає чіткого структурування висхідних (тут – призначених для вводу) даних, які, переважно, знаходяться у традиційному текстовому вигляді. Розглянемо можливі варіанти підготовки такої інформації.

Зрозуміло, що таку підготовку потрібно проводити з урахуванням особливостей внутрішньої архітектури бази; наприклад, необхідно мати на увазі, що атрибути її об’єктів можуть поділятися на ті, що володіють стандартним набором значень, й ті, значення яких потрібно вважати індивідуальними. На практиці це виливається в можливість попереднього наповнення тих полів бази, які структурно відповідають будові індексованих списків вибору, в тому числі багатоскладових типологічних словників, словників за матеріалом та технікою виготовлення та ін. [Структуру таких списків та їх місце в системі докладніше розглянуто в окремій статті (Панченко М.В. Списки выбора в базе данных “Пам’ятки України” // АРОІКС.- Вип. 1.- Київ, 1997.- С. 63-66); приклади детально розроблених словників на предмети матеріальної культури див. в роботі : Щапова Ю.Л., Лихтер Ю.А., Столярова Е.Л. Морфология древностей.- Киев, 1990.- 92 с.] Це має цілком позитивне значення, оскільки такий підхід дозволяє вносити важливу частку інформації ще на етапі налагодження системи, що в свою чергу надає ряд відчутних переваг. По-перше, забезпечується можливість попередньої перевірки правильності заповнення, а по-друге, масовий користувач, зацікавлений у швидкому наповненні бази, отримує значну кількість даних у практично введеному вигляді. Звичайно, це не позбавляє його від необхідності заповнення відповідних полів, але тепер ручний набір значень замінено їх вибором із заздалегідь підготованих списків (або – словників). Це не лише прискорює процес вводу, але й дозволяє уникнути серйозних помилок, пов’язаних з неусталеністю термінологічного апарату або й просто з випадковими похибками набору, що особливо важливо при злитті локально введеної інформації і, звичайно, при складенні коректного пошукового запиту. При наявності ж такого інструменту, опрацювання призначених для введення “типових” даних (по класифікації пам’ятки, її хронологічній належності та ін.), полягатиме у їх виділенні з висхідного тексту й знаходженні відповідностей у вище згаданих списках; власне кажучи, така робота може провадитись користувачем “з ходу”, безпосередньо в процесі наповнення бази.

Майже так само виглядає звернення до тих полів, які заповнюються шляхом посилання на інші підсистеми бази, котрі покликані зберігати дані самостійного значення, наприклад – про осіб, пов’язаних з історією пам’ятки, дослідні установи та ін. В цьому випадку індексований словник, з якого обирається потрібне значення, належатиме відповідній підсистемі і комплектуватиметься разом із її наповненням. Звідси випливає, що інформація, до якої адресоване посилання, повинна бути введена до того, як воно здійснене. Така послідовність також обумовлена логічною структурою об’єктно орієнтованої бази – якщо значенням атрибуту є посилання на певний об’єкт, то для того, щоб надати таке значення, потрібно спершу створити цей об’єкт. Для користувача, який аналізує призначений для вводу текст, це означає необхідність виділити подібні “локальні” дані в окремий логічний блок, маючи на увазі його подальше внесення до відповідної підсистеми.

Звернемось тепер до інформації індивідуального характеру, тобто такої, що не повторюється при описі конкретних пам’яток й, відповідно, не може бути вичерпана обмеженим списком класифікованих понять. Для неї відведено текстові поля описового та анотаційного змісту, послідовність розташування яких і являє собою найочевиднішу підказку для структурування висхідного матеріалу. Останнє вимагає від користувача певного аналізу, інколи дещо глибшого за формальне рознесення викладеного на папері тексту по відповідним полям БД. Розглянемо цю проблему на одному, найбільш виразному прикладі.

В підсистемі “Пам’ятки” чільне місце посідає поле “Назва”, котре містить дані, що постійно супроводжують практично будь-яку інформацію про пам’ятку. Принципи формування назви нової пам’ятки, або перейменування відомої раніше й зберігання цих даних в базі, становлять певну теоретичну проблему. Наприклад, щодо археологічних пам’яток існує традиція формувати найменування з назви населеного пункту, який служить географічною прив’язкою і з порядкового номеру знайденої поблизу нього пам’ятки (Клюси 3, Бодня 2 та ін.). Простота, очевидність та нейтральний, не вимагаючий попереднього аналізу характер цього способу побудови назв в цілому змушують визнати його доцільність. Однак необхідно зауважити, що він має кілька суттєвих недоліків : по-перше, відсутність чітко визначеної домовленості щодо фіксації пам’яток не гарантує від випадкового їх перейменування при наступних розвідках, особливо коли ті здійснюються іншими дослідницькими підрозділами. Робити поправку на таку можливість стало настільки звичним, що спеціальна література часто опускає власну назву пам’ятки, залишаючи для її ідентифікації лише вказівку на культурну і хронологічну належність, тип та місцезнаходження (згадаємо, хоча б, серію довідників з археології окремих областей). Таким чином, присвоєне при першій фіксації найменування, якщо воно не встигло увійти до широкого наукового вжитку, може залишитись надбанням окремого архівного звіту.

Окрім того, є ряд пам’яток, що мають історично усталену назву, котра найчастіше походить від місцевого мікротопоніма, як то : “Княжа Гора”, “Черлена Балка”, “Петрів Горб” і т.п. Деякі багатоскладові назви містять вказівку на функціональний тип пам’ятки – “Бушівське городище”, “Мезінська стоянка”, “Скалистинський могильник” та ін. Як показує практика, паралельне використання різних варіантів найменувань трапляється не лише в спеціальній та популярній літературі, а й в офіційній документації; мало того, інколи варіант, який спершу мав практично сленгове походження, стає настільки вживаним, що поступово витісняє первісну офіційну назву. Для оптимального вирішеня цієї проблеми в базі зберігатимуться всі відомі назви пам’ятки, одна з яких вважатиметься основною, інші – альтернативними, що дозволить провадити рівноцінний пошук за будь-яким з введених варіантів. Зрозуміло, що за таких умов користувач повинен з’ясувати, яку з назв можна вважати основною, і, якщо офіційно це не визначено, підібрати найбільш вживану.

Звичайно, все це стосується не лише археологічних об’єктів – алгоритми найменування інших видів пам’яток також мають по декілька варіантів.

Цікаво, що для пам’яток архітектури та містобудування характерна виразна залежність способу побудови назви від функціонального типу об’єкту. Об’єкти масового будівництва (житлового наприклад), найчастіше іменуються за простою схемою – тип плюс датування : “житловий будинок др.пол. XIX ст.”, “громадський заклад поч. XX ст.” та ін. Сама вказівка на дату, яка з формальної точки зору повторює відповідне поле бази даних, в цьому випадку є чисто текстовим елементом, що відіграє уточнюючу роль до основної частини найменування. Це тим більше помітно в порівнянні з випадками, коли після набуття власних “особистих” рис назва об’єкту втрачає цей елемент : звернімо увагу – в обох варіантах – “Будинок з химерами” та “Будинок Городецького” вона містить вказівку на виразні індивідуальні особливості, будь то специфічні деталі архітектурного декору або прізвище відомого архітектора. Зазвичай не застосовують його і назви будівель високого соціального статусу – “Міська дума”, “Міська ратуша”, “Контрактовий будинок”; тут у всіх випадках ми спостерігаємо, як функціональна назва стає власною назвою пам’ятки, іноді – з вказівкою на місце розташування (“Київський університет”). Специфічним варіантом можна вважати поєднання функціональної назви з офіційно наданою – це, в основному, стосується таких об’єктів, яким “предписано” мати найменування, наприклад – “готель "Національ"”, “кафе "Прокоп"”; тут необхідно мати на увазі різницю між назвою об’єкту, який отримав статус пам’ятки, та назвою закладу, яку той носить безвідносно до споруди, в якій його розміщено. Осібну групу складають архітектурні пам’ятки, назва яких фактично отримує статус власного “імені” об’єкту – “Ермітаж”, вищезгаданий “Будинок з химерами”, “мінарет Калян” та ін.

Подібна ситуація спостерігається й для пам’яток церковної архітектури – власні імена, притамані деяким із них, можуть відображати як характерні зовнішні ознаки (“Михайлівський Золотоверхий собор”), так і пов’язані з побудовою історичні події (“храм Спаса на крові”) або навіть конкретний соціальний патронаж (“церква Богородиці Десятинна”, “церква Богородиці Пирогощі”) [в обох випадках мається на увазі вказівка на покровительство, завдяки якому були збудовані храми – десятина від княжої казни та кошти подільських торговців хлібом (за найрозповсюдженішою версією)]; іноді невід’ємною частиною назви стає посилання на розміщення [вказівку на належність до конкретного комплексу чи ансамблю також можна вважати посиланням на локальне розміщення, але питання про співвідношення назв комплексу та окремої пам’ятки ми торкнемося трохи нижче] (“церква Спаса на Берестові”). Однак для кожного варіанту назви, незалежно від того містить він індивідуальну специфіку чи ні, приналежні два обов’язкові елементи – вказівка на вже не раз згаданий тип та (для християнської архітектури принаймні) на сакральний патронаж. Перший елемент, у даному випадку, також досить промовистий, оскільки він містить інформацію про статус споруди (каплиця, церква, собор) та її конфесійну належність. Зазначимо, що для пам’яток культової архітектури, що вперше виявлені в процесі археологічних розкопок, вказані дані часто лишаються нез’ясованими. В таких випадках, зазвичай, надається формальна назва, яка містить вказівку або на локальне розміщення у складі конкретного комплексу наприклад – “храм в південному кварталі порту”, або, якщо архітектурна знахідка розглядається як окремий археологічний об’єкт – звичайну адресну прив’язку скажімо – “безіменний храм в Георгієвському провулку”.

Належність пам’яток церковної архітектури до певного комплексу (ансамблю) практично завжди знаходить відображення в найменуваннях, відіграючи, так би мовити, “надбудовну” роль у їх структурі, наприклад – “Спаський собор Єлецького монастиря”, “Успенський собор Києво-Печерської лаври” та ін. Ще виразніше така схема спрацьовує стосовно пам’яток фортифікації, адже ієрархія піделементів комплексу там досить сувора. І якщо такий піделемент згадується осібно, по за контекстом пам’ятки в цілому, його повна назва може бути досить багатоскладовою, скажімо – “Надбрамна башта Білгород-Дністровської (Аккерманської) фортеці”, “Кругла башта Острозького дитинця” та ін. Як бачимо, перша, фактично – власна частина такої назви може включати вже згадувані вище ознаки – вказівку на функціональне призначення, зовнішній вигляд, локальне розміщення, або навіть на пов’язану зі спорудою особу – “Башта Константина Феодосійської генуезської фортеці”. Друга ж частина вказує на пам’ятку в цілому, і в такому контексті може застосовуватись повністю відокремлено від її піделементів. Традиції формування назви осібної фортифікаційної пам’ятки мають певну специфіку. По-перше, вказівка на її загальний тип (фортеця, фортеця-замок, напільний вал, капонір) практично завжди конкретизує певні оборонні функції і, відповідно, дозволяє зробити попередні висновки щодо головних типових ознак її будови. По-друге, як невід’ємна частина назви часто застосовується родове ім’я володільця, а іноді – вказівка на хронологічний період або на етнічну (етнополітичну) належність – “Турецька Аккерманська фортеця”, “Судакська генуезська фортеця” та ін. Як бачимо, не виключаються й інші, вже розглянуті елементи, наприклад – географічна прив’язка або власне ім’я (“фортеця Арк”).

За простою і досить прозорою схемою будуються назви природних ландшафтних пам’яток (тип плюс географія, інколи – власна назва) та пам’ятних місць, які власне, повторюють назву історичної події.

Як бачимо, більшість способів утворення найменувань тяжіють до певних закономірностей, обумовлених типологічними, хронологічними, топо- географічними та іншими характеристиками пам’ятки. Урахування цих закономірностей має практичний сенс не лише при роботі із щойно зафіксованим об’єктом; так звані “історичні” назви, наприклад, акумулюють в собі цінну інформацію, яка відіграє важливу роль при вирішенні спеціальних палеолінгвістичних, етногеографічних та інших, тим чи іншим способом пов’язаних з топонімікою задач, що, безумовно, має самостійну наукову цінність. Стосовно ж розвинених електронних довідково-аналітичних систем, потрібно мати на увазі, що поле “Назва” приймає найактивнішу участь у формуванні логічного імені, яке візуалізує для користувача зв’язок між введеними об’єктами, в тому числі і з об’єктами неспоріднених класів. Ця функція обумовлює серйозні вимоги до логічного імені як до елементу бази даних. Це, насамперед, якомого виразніша загальна характеристика об’єкту при максимально стислій формі. Зрозуміло, що формальна назва відіграє при цьому провідну роль, але вкладеного в неї змісту може бути недостатньо, адже сама різноманітність способів її утворення не робить виконання таких функцій жорстким правилом. Складові частини формальної назви можуть і не включати елементів, які задовольняють вимоги логічного імені, або включати такі, що в даному випадку будуть надлишковими. Саме тому логічне ім’я доцільніше формувати з кількох полів, більшість з яких містить жорстко структуровану інформацію; майже завжди окрім поля “Назва” серед них буде поле з даними про датування або хронологічний період, іноді – поля, що містять скорочені дані про розташування, фунціональний тип та ін.

Як важливий момент треба відмітити, що формування логічного імені не входить до обов’язків користувача, і навіть цілком може знаходитись по за межами його компетенції – воно здійснюється автоматично, за заздалегідь визначеним алгоритмом. Для кожного класу об’єктів такий алгоритм визначається індивідуально, що надає додаткової гнучкості в обранні найбільш вдалого варіанту. Якщо, припустимо, для ряду археологічних пам’яток цілком достатнім виглядає посилання типу “Телешівка 2 (поселення доби бронзи)” або, при наявності докладніших відомостей про пам’ятку – “Вербова Балка 3 (могильник черняхівської культури)”, “Бушівське городище XI – перш. пол. XIII ст.”, то інші класи вимагають спеціалізованого підходу у формуванні логічного імені. Досліднику, який працює з об’єктами житлового будівництва, мало що скаже назва “Будинок кінця XIX ст.”, особливо коли масив інформації про такі пам’ятки сягає за кілька сот; а от посилання типу “Будинок кінця XIX ст. по вул. Володимирській, 18” набирає вже цілком індивідуального змісту. Зрозуміло, що для комплексних пам’яток при побудові алгоритму необхідно враховувати згадувану вище “надбудовну” частину назви, тобто – вказівку на основну пам’ятку, піделементом якої вона виступає. Можна заперечити, запропонувавши вводити всі вищезгадані елементи безпосередньо до формальної назви, у відповідне поле, з тим, щоб формувати логічне ім’я тільки з нього. Але в такому випадку з’явиться багато надлишкової інформації, яку, до того ж, доведеться вводити вручну; окрім того, занадто громіздким виглядатиме формуляр цього об’єкту, адже дані з кількох полів дублюватимуться у полі “Назва”. За таких умов набагато доцільнішим буде зберігати в базі традиційне найменування, довіривши їй автоматичне формування логічного імені. Якщо це останнє достатньо прозоро характеризуватиме об’єкт, то, при зверненні до полів де воно виконує роль скороченого посилання, істотно зменшиться необхідність у викликах повного опису цих об’єктів. Фактично, з’являється ще один допоміжний спосіб обробки інформації – швидкий візуальний аналіз зв’язків розглядуваного користувачем об’єкту (наприклад пам’ятки).

Для повної реалізації зазначених можливостей користувач повинен враховувати правила формування логічного імені, уникаючи елементів, які викликали б тавтологічні повтори у його звучанні; і в першу чергу це треба мати на увазі ще на початку введення даних про пам’ятку, а саме – при утворенні її головної, базової назви.

Таким чином, ми почали розглядати проблему об’єднання структури висхідних (текстових) матеріалів з логічною структурою бази даних в один референтний простір. Пов’язані з цим питання досить обширні, і, безумовно, потребують подальшого розгляду самостійними тематичними розділами.

Надійшло до редакції 14.05.1999 р.

Джерело : Археометрія та охорона історико-культурної спадщини, 1999 р., вип. 3, с. 81 – 84.