Створення семантичного Web-порталу

Проект № ІТ / 558 - 2009 від 20 липня 2009 р. „Створення семантичного Web-порталу знань і засобів інтелектуального аналізу даних для національної GRID- інфраструктури”

Виконаний проект присвячено удосконаленню освітянського сегменту національної Grid – інфраструктури для потреб е-науки , який було створено на попедньому етапі виконання Державної програми ІКТ згідно проекту Ugrid за договором № ІТ /506 - 2007 від 22 серпня 2007. Мова йде про початок досліджень Grid систем третього покоління, так званих семантичних Grid, в яких інформація і послуги мають чітке визначення, що надає можливість комп'ютерам і людям працювати в кооперації. Семантичний Грід як розширення сучасного Гріду буде надзвичайно корисним для е-науки, оскільки його технології дадуть змогу легко, швидко та зручно працювати зі знанням, а не з інформацією, як то робиться зараз. Додатки Семантичних Грідів можуть інтегрувати велику множину різнорідних джерел інформації і послуг, які залучені і об'єднані, а також людські і обчислювальні послуги і послуги передачі інформації.

Результати роботи:

1. Розроблений інструментарій для семантичної розмітки HTML -документів, зокрема, система управління контентом (CMS), яка увібрала в себе усі доступні на цей день мікроформати і інші семантичні технології. Публікуючи інформацію через цю систему, можна автоматично згенерувати семантично розмічений документ, який після обробки пошуковими системами матиме більше шансів бути проіндексованим і знаходиться на перших сторінках пошукової видачі.

2.Проаналізовані переваги і складнощі вибору технології веб-сервісів як базової для реалізації концепції грід-сервісів. Досліджені основні протиріччя між засадами сервісно-орієнтованої архітектури та реаліями грід-середовищ, розглянуті можливі шляхи їх подолання (реалізовані та перспективні). Сформульовані рекомендації для розробників грід-сервісів для національної грід-інфраструктури з узгодження грід- та веб-сервісів. Вказано первинне коло стандартів, рекомендованих до використання розробниками для мінімізації проблем із сумісністю розроблених рішень.

3. Проаналізовано придатність окремих стандартів зі стеку специфікацій веб-сервісів (WS-*) та ресурсів веб-сервісів (WSRF) для використання при реалізації грід-сервісів. При цьому враховувалися такі аспекти, як: сумісність з існуючим інструментарієм, врахування особливостей грід-середовища, здатність інтегруватися у інфраструктуру безпеки, можливість використання стандартних засобів автоматизованого виконання складених процесів, можливості семантичного розширення.

4. Досліджені елементи Грід- інфраструктури з ціллю встановлення тих із них, що можуть бути покращені за допомогою семантичних технологій. Це елементи, найбільш залежні від операцій пошуку, порівняння (matchmaking) та прийняття рішень: інформаційна система, брокери, засоби автоматизації робочих потоків (workflows).

5. Запропонована методологія створення онтологій, заснована на системах представлення декларативних знань. Проаналізовані і порівняні існуючі мови опису онтологій (зокрема, OIL, DAML+OIL, OWL). Приведені приклади онтологій для наук про Землю і г ід- технології як сучасну основу комп’ютерних наук.

6.. Створений програмний семантичний пошукач як засіб перегляду та пошуку у семантичній базі знань порталу, який складається із серверної на клієнтської частини.
6.1. Серверна частина представлена двома сервісами:
• SPARQL-процесор загального призначення
• обробник запитів клієнтської частини.
SPAQRL-процесор реалізовує стандартний протокол W3C для віддалених запитів мовою SPARQL до набору даних RDF. Він побудований на основі сервелету з відкритим кодом Joseki.
Сервіс доступу для віддалених запитів складається з наступних компонентів:
• сервлет Joseki для реалізації протоколу
• SDB – бібліотека з фреймворку Jena для роботи із семантичними даними, що дозволяє використовувати реляційну базу даних в якості сховища триплетів
• СУБД MySQL
Обробник запитів реалізований у вигляді сервлету, що приймає на вхід тип запиту та об’єкт пошуку, проводить його валідацію, здійснює SPARQL-запит до сховища та повертає результати у форматі JSON для відображення їх у клієнтській частині.
6.2. Клієнтська частина представляє собою JSP-сторінки із вбудованими скриптами на мові JavaScript, що використовують бібліотеку jQuery з плагінами для відображення та динамічного оновлення вмісту сторінки на основі результатів, що повертає серверна частина засобу.
63..JSP-сторінка (index.jsp) дозволяє здійснювати пошук за ключовим словом за властивостями даних та відображати список ресурсів, що пов’язані із цією властивістю. Крім цього при переході за посиланнями у повернених результатах пошуку у табличному вигляді відображаються усі властивості, пов’язані з даним ресурсом, що є на даний момент у семантичній базі.
6.4.Сторінка advanced.jsp надає конструктор запитів до семантичної бази знань із можливістю опису довільної кількості тверджень, які мають задовольнятись результатами пошуку, правил фільтрації результатів, їх сортування та обмеження їх кількості. Кожне твердження складається із суб’єкту, предикату та об’єкту.
Результати запитів відображаються у таблиці. Кожен рядок таблиці складається із кількості стовпчиків, що відповідає кількості змінних у запиті (змінні позначені) . Ресурси, отримані в результаті запиту, є посиланнями для перегляду пов’язаних властивостей у спосіб, описаний вище.

7.Підготовлений навчальний посібник „ «Семантичний Грід для науки і освіти» (проф.Петренко А.І.), який підтримує новий для ВНЗ курс з грід-технологій, викладання якого для магістрів починається з лютого 2011 року в НТУУ «КПІ».

Практичне значення отриманих результатів:

Розробка і впровадження технологій Семантичного Веб є нині магістральним напрямом розвитку веб- технологій. Використання технологій Семантичного Веб в освітніх порталах дозволяє забезпечити вищий рівень персоналізації навчання, підвищити якість обробки запитів користувачів, ефективніше інтегрувати інформацію з різнорідних джерел на користь наукової і освітньої діяльності. Таким чином, розробка семантичних порталів повинна розглядатися на цьому етапі як пріоритетний напрям створення навчально- дослідницьких інформаційних середовищ наступного покоління.

Актуальність завдання підтверджується збільшенням інтересу пошукових систем до семантично розмічених сторінок, постійний вступ нових мікроформатів і доопрацювання нинішніх. Не можна не врахувати, що усі великі сервіси (Facebook, Twitter, YouTube і інші) вже використовують багато мікроформатів для поліпшення пошукової видачі і створення зв'язків між документами і подіями. Пошукові гіганти (Google, Yahoo, Yandex і інші) щодня стежать за розвитком семантики і сервісів зокрема, що б надалі покращувати свої пошукові механізми.
Аналітичні узагальнені матеріали з семантичного Веб використані при розробці програми і матеріалів нової дисципліни „ Веб- дизайн і Веб-технології”, яка недавно введена згідно проекту Державного стандарту на освіту в навчальний план підготовки бакалаврів з напрямку „Комп’ютерні науки”.

Розроблена робоча навчальна програма магістерського курсу ” Грід – технології для розподілених обчислень та обробки даних ” (с.н.с. Свістунов С.Я.), яка містить розділ «Портали та мета планувальники».

Проведені дослідження з можливої архітектури і властивостей семантичного Грід дають підставу кваліфіковано формувати технічні завдання на відповідні конкурсні проекти з нової Державної програми впровадження Грід-технологій на 2009-2013 роки, зокрема, з її розділу, присвяченого „розробленню і впровадженню методів ефективного використання існуючих Грід- ресурсів за допомогою інтелектуальної обробки даних (DataMining).”

.Опубліковано 11 статей з тематики семантичного Грід і результатів проекту і зроблено 10 доповідей на міжнародних і республіканських конференціях з публікацію їх тез. Видані навчальні матеріали «Семантичні грід- технології для науки і освіти» як складова частина нового для ВНЗ курсу з грід-технологій, викладання якого для магістрів починається з лютого 2011 року в НТУУ «КПІ».

Перелік наукових публікацій, доповідей на конференціях, семінарах

1. Згуровський М.З., Петренко А.І..Grid – технології для е-науки і освіти.- \\Наукові вісті, НТУУ»КПІ».-№2, 2009.-с.10-17.
2. Zagorodny A., Zgurovsky M., Zinovjev G., Petrenko A., Martynov E. Integrating Ukraine into European Grid Infrastructure.-// Системні дослідження і інформаційні технології.-Київ, №2, 2009.-с.35-49.
3. Петренко А.І. Застосування Грід- технологій в науці і освіті.-Київ: Політехніка, 2009.-145 с
4. Згуровский М.З., Петренко А.І. Е-наука на шляху до семантичного Грід. Частина 1: Об’єднання Web- і Грід- технологій .-//Системні дослідження і інформаційні технології.-Київ, №1, 2010.-с.26-38.
5. Згуровский М.З., Петренко А.І. Е-наука на шляху до семантичного Грід. Частина 2: Семантичний Web- і семантичний Грід.-//Системні дослідження і інформаційні технології.-Київ, №2, 2010.-с.7-25.
6. Згуровський М.З., Петренко А.І.., Кисельов Г.Д. Створення національної Grid – інфраструктури для забезпечення наукових досліджень.-// Інформаційні технології в освіті.- Херсон, випуск 4, 2009. -12-17 с.
7. Петренко А.І. Комп’ютерне моделювання Грід- систем. -//Электроника и связь /Тематический выпуск «Электроника и нанотехнологии». №5, 2010.-с.40-48
8. Петренко А.І. Моделювання Грід- систем і в Грід-системах. -// Збірник наукових праць Інституту проблем моделювання в енергетиці НАНУ: Моделювання і інформаційні технології (спеціальний випуск), том1.-Київ, 2010.- с.11-21.
9. Петренко А.І, . Моделювання Грід- систем. -// 12-а Міжнародна конференція «Системний аналіз та інформаційні технології» (САІТ-10), Київ, 25-29 травня 2010, Київ, Україна : матеріали – К. : УНК "ИПСА" НТУУ "КПИ", 2010.
10. Петренко А.И.,Хондар В.С. Інструментарій розроблення онтологій –-// 12-а Міжнародна конференція «Системний аналіз та інформаційні технології» (САІТ-10), Київ, 25-29 травня 2010, Київ, Україна : матеріали. – К. : УНК "ИПСА" НТУУ "КПИ", 2010.
11. Петренко А.І., Оленович Є. Компьютерные облака в Грид технологиях – -// 12-а Міжнародна конференція «Системний аналіз та інформаційні технології» (САІТ-10), Київ, 25-29 травня 2010, Київ, Україна : матеріали. – К. : УНК "ИПСА" НТУУ "КПИ", 2010.
12. Петренко А.І.,Булах Б.В., Хондар В.Д. Семантичний Грід для науки і освіти.-//Київ: « Політехніка», 2010.-155 с.

Документальні підтвердження результатів:

1. Сайт проекту www.portal.hpcc.kpi.ua , який є по-суті семантичним Веб-пошукачем даних, зокрема, про грід-ресурси.
2. Сайт дистанційного навчання http://moodle.kpi.ua на якому розміщено навчальні матеріали дистанційного магістерського курсу ” Грід – технології для розподілених обчислень та обробки даних ” .


 

 

Ukrainian (UA)Russian (CIS)English (United Kingdom)