Систематизація інформаційних ресурсів

Електронна публікація

Українська академія друкарства

Кафедра комп’ютерних наук та інформаційних технологій

Климентий Юрій Михайлович, Огірко Ігор Васильович

Одним з ключових механізмів, що використовуються при розв’язанні задач з обліку та реєстрації інформаційних ресурсів (ІР), публікації ІР та метаданих, а також моніторингу стану ІР, являється каталогізація ІР. Першою концептуальною проблемою на шляху систематизації ІР є необхідність визначення, опис яких суттєвих властивостей може представлятися в загальнодоступних каталогах ІР.

В широкому сенсі під інформаційними ресурсами розуміються знання, підготовлені людьми для соціального використання в суспільстві і зафіксовані на матеріальних носіях у вигляді документів, баз даних і знань, алгоритмів, комп’ютерних програм і т. п.

ІР - це документ (сукупність документів), призначений і самостійно оформлений для поширення серед необмеженого кола осіб або слугуючий основою для надання інформаційних послуг.

Наведене визначення відображає ключові ознаки, які мають бути властиві інформаційній сутності, для того щоб бути представленою в загальнодоступному каталозі ІР. По-перше, ІР - це продукт, призначений для поширення серед необмеженого кола осіб, для яких він являє інтерес, тобто має споживацьку цінність. В той же час ІР - не обов’язково опублікований документ. Розміщення інформації про нього в каталозі може бути кроком на шляху до публікації. Доступ до ІР може бути організований через Internet або шляхом випуску тиражу інформаційних носіїв, розміри яких задовольняють потребам цих осіб і визначаються з урахуванням характеру ІР.

Друга ключова ознака ІР - оформлення, що забезпечу можливість самостійного поширення. Сутність, що не має такого оформлення, не може бути відображена в каталозі.

На ринку інтелектуальної продукції більшість ІР виступають у якості продуктів або товарів. Виключення складає особливий клас мегаресурсів Internet, що служать основою для надання послуг. Такі ІР не являються товаром (права на їх використання не продаються і не купуються). Одне і те ж ІР, як правило, використовуються для надання різноманітних послуг. Ці послуги складають його основну цінність і не можуть бути надані без його наявності. Тому каталогізації підлягають ІР, а не послуги.

На сьогоднішній день освітнє товариство не прийшло до єдиної думки стосовно того, які види ІР доцільно охопити систематизацією і представляти в загальнодоступних каталогах ресурсів. Існуючі точки зору з даного приводу в основному заключаються в лімітації видів систематизованих ІР, під приводом складності уніфікації метаданих, трудоємності наповнення каталогів і надання переваги конкретним технологіям реалізації бізнес-процесів, передбачаючих використання таких каталогів.

Подібні обмеження не достатньо обґрунтовані з наступних причин:

По-перше, один і той же ІР може бути реалізований в різних формах і випущений на різних носіях;

По-друге, різноманітні форми представлення ІР і способи доступу до них можуть використовуватись сумісно;

По-третє, деякі ІР являються комплексними, що являють собою набори ресурсів різних видів, зафіксованих на різних типах носіїв;

По-четверте, крім ІР, що виступають на ринку інтелектуальної продукції в якості товарів, необхідно враховувати мегаресурси Internet, що не являються товарами, але слугують основою для надання інформаційних послуг;

По-п’яте, тимчасове обмеження сфери систематизації окремими видами ІР означає, що замість однієї специфікації метаданих, що описують ІР, буде розроблено кілька специфікацій, орієнтованих на різні класи ІР і які вводяться в дію по мірі готовності. В результаті відбудеться не спрощення, а ускладнення задач систематизації, обумовлене необхідністю узгодження специфікації, а також наявністю багатьох наборів правил формування описів в рамках різних специфікацій.

Із сказаного випливають два важливих висновки:

   • В загальнодоступні каталоги ІР, що формуються в рамках систематизації, можуть включатися відомості про ІР, різних за формою представлення даних і їх характеру, зафіксованих на різних типах носіїв і підтримуючих різні способи доступу;
   • Ці відомості повинні представлятися за правилами, що регламентуються єдиним набором відкритих специфікацій метаданих.

Існують різноманітні підходи до класифікації ІР. Типологія видів видавницької продукції, що випускається на паперових носіях (ДСТ 7.60-90). Класифікація електронних видавництв міститься в ДСТ 7.83-2001. Обидві класифікації являються фасетними.

В роботах, що розвиваються за кордоном, по стандартизації технологій електронної освіти важливе місце займає класифікація ІР за рівнем агрегації. В технології CMI виділені чотири типи структурних одиниць контенту:

   • призначений елемент (assignable unit - AU) - найменша структурна одиниця контенту, що враховується системою управління навчальним процесом (СУНП);
   • урок (lesson) - структурна одиниця контенту, що містить навчальний матеріал, що відповідає певним цілям підготовки; урок також може включати засоби оцінювання;
   • блок (block) - група структурних одиниць курсу; блок може включати зв’язані AU та інші блоки;
   • курс (course) - завершений освітній ресурс, орієнтований на одного або кількох учнів і призначений для набуття умінь і навичок, що формують компетенцію в деякій предметній області і потрібних для виконання групи взаємопов’язаних задач; курс може включати уроки і тести, що відповідають певним цілям підготовки, і може бути частиною навчального плану;
   • елемент (asset) - одиниця контенту, що являє собою інформацію в електронному вигляді, яка може бути відправлена web-клієнту;
   • сумісно використовуваний об’єкт контенту (Sharable Content Object - SCO) - набір з одного або декількох елементів, що включає елемент, який реалізує функції інтерфейсу з СУНП;
   • агрегат (content aggregation) - інтегральний ресурс, що об’єднує одиниці контенту в інтегральну структуру.

Класифікація ІР за різними властивостями орієнтована на розв’язання різноманітних задач, що відносяться до каталогізації ІР, їх пошуку, організації доступу до них, побудові інтегральних ресурсів, управлінню використання ІР в навчальному процесі, аналізу і моніторингу забезпеченості ІР для потреб системи освіти та ін.

Документ, який представляє класифікацію, називається класифікатором. При формуванні метаданих та пошукових запитів класифікатори служать джерелами для вибору значень, що заносяться в елементи даних і поля запитів відповідного типу. Інформаційна модель метаданих може містити безліч елементів, значення яких вибираються в класифікаторах. Кожен з них відображає класифікацію ІР за властивістю, що визначається елементом даних, значення якого представлене в класифікаторі.

Серед безлічі класифікацій ІР виділимо базовий набір, що включає класифікації, які відіграють особливу роль при розробці і використанні метаданих.

Подібний статут визначається наступними моментами:

   • загальністю основ ділення, що обумовлює застосовність класифікацій базового набору по відношенню до всіх ІР;
   • зручністю використання даних класифікацій для організації навігації по каталогу ІР;
   • реалізацією на основі даних класифікацій значної частини обмежень цілісності, що накладаються на опис ІР.

Вимоги до системи метаданих

Розв’язання більшості задач систематизації ІР пов’язане з використанням метаданих. Під метаданими розуміється інформація, яка характеризує будь-яку іншу інформацію, тобто являє собою опис ІР.

Система метаданих виступає в якості центральної ланки будь - якої інформаційної системи. Метадані можуть бути як частиною ІР, так і зберігається окремо від них.

Для метаданих визначається два рівні представлення:

   1. інфологічний, що фіксується схемою метаданих, яка відображає склад і структуру елементів даних (полів) в екземплярі метаданих, їх семантику, типи значень (включаючи словники та класифікатори) і обмеження цілісності;
   2. даталогічний, що фіксується форматом метаданих, який відображає спосіб представлення (кодування) інформації.

До числа основних вимог до системи мета даних відносяться:

   • універсальність в рамках встановленого розуміння ІР як об’єкта систематизації;
   • структурованість і формалізованість мета даних, необхідні для їх автоматичної обробки;
   • достатня виразність для забезпечення ефективного вирішення задач, які потребують наявності мета даних;
   • сумісність з міжнародними стандартами і протоколами в області мета даних та інформаційного пошуку (створення умов для інтероперабельності);
   • відповідності законодавству в області освіти (зокрема, встановленим рівням освіти), відображення особливостей вітчизняної освітньої системи і стандартів України;
   • можливість задання обмежень цілісності, що відображають взаємозв’язки полів описання ІР;
   • забезпечення можливості зберігання мета даних як сумісно з ІР, так і окремо від нього;
   • можливість представлення в мета даних відомостей про створювачів, правовласників та поширювачів ІР, а також відносини між ними.

Структура інформаційної моделі метаданих

Інформаційна модель, що представляє форму опису ІР, складається із сукупності елементів даних, утворюючих ієрархічну структуру. Елементи даних підрозділяються на неподільні та складові. Перші відповідають листкам ієрархії, другі - транзитним вузлам.

Складовий елемент включає один або кілька елементів, серед яких можуть бути як неподільні, так і складові елементи. Елементи, що входять в складовий елемент, називаються підлеглими цьому елементу. В свою чергу, складовий елемент по відношенню до вхідних в нього елементів називають підлеглим або батьківським.

Складовий елемент не має інтегрального значення. Його значення виражається через значення вхідних в нього елементів.

Неподільний елемент даних не має підлеглих елементів. Він може мати самостійне значення, що відповідає множені допустимих значень, які визначаються асоційованим з елементом типом даних.

На верхньому рівні ієрархії інформаційної моделі представлені дев’ять контейнерів:

   • загальні відомості про ІР (general);
   • життєвий цикл ІР (lifecycle) - відомості про поточний стан ІР і суб’єкта, що вніс вклад в його створення і розвиток;
   • метаметадані (metametadata) - характеристики описання ІР (екземпляра мета даних);
   • технічні характеристики ІР (technical);
   • освітні характеристики ІР (educational);
   • права інтелектуальної власності на ІР (rights) - відомості про права інтелектуальної власності на ІР і пов’язаних з ними умовах його використання;
   • відносини (relation) - відомості про відносини між описаним ІР та іншим ІР;
   • анотація (annotation) - коментарі про застосування ІР та відомості про те, хто і коли їх складав;
   • класифікаційні ознаки (classification) - класифікаційні ознаки ІР в рамках різних класифікаторів.

Елемент даних не може бути включений в екземпляр мета даних без свого батьківського контейнера. Таким чином, із наявності будь-якого елемента в екземплярі мета даних автоматично слідує входження в цей екземпляр і батьківського контейнера даного елемента.

Елемент даних в інформаційній моделі характеризується наступними атрибутами:

   • індексом;
   • іменем;
   • описом;
   • повторюваністю;
   • впорядкованістю значень;
   • типом даних;
   • граничним об’ємом;
   • граничною повторюваністю.

Список використаної літератури

1. Інькова, Н. А. Створення Web-сайтів: Навчально-методичний посібник [Електронний ресурс] / Інькова Н.А., Зайцева Е.А., Кузьміна Н.В., Толстих С.Г. / / Режим доступу: http://clubedu.tambov.ru/methodic/fio/p5.doc

2. Селін, Г. Інтернет-посібник зі створення Web-сайту, його публікації та способи розкручування [Електронний ресурс] / Геннадій Селін / / Режим доступу: http://web-book.narod.ru/

3. Рогачова, Г.І. Сучасні інформаційні ресурси [Текст] / Г.І. Рогачова / / Матеріали міжнар. наук.-практ. конф. 17-18 вересня 2002 р. – Барнаул, 2003. – С. 34-36

4. Бейли Л. Изучаем PHP и MySQL / Л. Бейли, М. Моррисон. – М.: Эксмо, 2010. ­– 352с.

5. Шрайберг, Я.Л. Бібліотека, електронна інформація і мінливе суспільство в інформаційному столітті [Текст] / Я.Л. Шрайберг / / Наукові та технічні бібліотеки. – 2007. – № 1. – С. 25-55

6. Тлеукеева, Р. Традиційні та електронні ресурси: стан, проблеми. ефективність використання [Текст] / Роза Тлеукеева / / Бібліотека. – 2008. – № 1. – С. 15-19