REKLAMA

Ośrodek Przetwarzania Informacji – Państwowy Instytut Badawczy, oprócz ogólnopolskiego systemu teleinformatycznego gromadzącego w jednym miejscu dane o polskiej nauce i szkolnictwie wyższym (POLON) oraz ogólnopolskiego systemu monitorowania losów absolwentów szkół wyższych (ELA) buduje też inny ogólnopolski system – ściśle powiązany z POL-onem – Jednolity System Antyplagiatowy (JSA).

To kompleksowe narzędzie już od przyszłego roku akademickiego będzie sprawdzało, czy prace dyplomowe składane do obrony nie otarły się o plagiat. Warto wspomnieć, że wprowadzenie Jednolitego Systemu Antyplagiatowego jest rekomendowane przez Komisję Europejską, a OPI PIB buduje JSA zgodnie z ustawą Prawo o szkolnictwie wyższym. Przedsięwzięcie jest finansowane m.in. w ramach Programu Operacyjnego Wiedza Edukacja Rozwój.

O specyfice JSA opowiadają nam główni twórcy systemu: dr Marek Kozłowski – kierownik Laboratorium Inżynierii Lingwistycznej w OPI PIB oraz Maciej Kowalski – lider zespołu programistów i specjalista badawczo-techniczny w LIL.

- Jaka idea stoi za Jednolitym Systemem Antyplagiatowym? Po co ten system powstaje?

Marek Kozłowski: - Zbudowanie jednolitego systemu antyplagiatowego jest pierwszym w Polsce działaniem, które proponuje zapewnienie ochrony antyplagiatowej na poziomie systemowym. Po pierwsze, ma zapewnić nieodpłatny dostęp do usługi weryfikacji plagiaryzmu[1] dla wszystkich uczelni w Polsce. Usuwa więc bariery finansowe i organizacyjne, które do tej pory uniemożliwiały to istotnej grupie szkół wyższych. Po drugie, proponowane rozwiązanie systemowe gwarantuje unikalny i kompletny zestaw danych, tzn. bazę wszystkich prac dyplomowych bronionych w Polsce od 2009 r. – znaną pod nazwą ORPPD (Ogólnopolskie Repozytorium Pisemnych Prac Dyplomowych). Dzięki temu weryfikacja nowych prac będzie bardziej skuteczna. Dodatkowo, w ramach JSA planowane jest badanie plagiaryzmu stosując porównywanie danych pochodzących także z zasobów Internetu, co jest bardzo nowatorskim rozwiązaniem, zwłaszcza w aspekcie unikalności danych.

- Czyli JSA będzie systemem centralnym?

M.Kozłowski: - Tak, budujemy narzędzie systemowe, które już od roku akademickiego 2018/2019 będzie obowiązywało wszystkie polskie uczelnie. Każda praca dyplomowa przed dopuszczeniem do obrony będzie musiała zostać sprawdzona w JSA pod względem plagiaryzmu.

- A jak to wygląda obecnie? Jak promotorzy weryfikują, czy studenci nie składają plagiatów?

Maciej Kowalski: - Dotąd uczelnie organizowały systemy antyplagiatowe na własną rękę, utrzymywały je i aktualizowały we własnym zakresie. I to tylko część uczelni. Szacuje się, że maksymalnie połowa uczelni w Polsce wykupiła usługi antyplagiatowe. Mieliśmy więc wiele różnych systemów, wzajemnie niepowiązanych, odnoszących się do różnych baz wielokrotnie mniejszych niż samo ORPPD. Bo te wewnątrzuczelniane systemy antyplagiatowe nie posiadają dostępu do wszystkich prac bronionych w Polsce. Teraz będzie JSA, z którego na zasadach wolnego dostępu będą mogły korzystać  uczelnie publiczne i niepubliczne. Dostaną centralne, gotowe rozwiązanie zapewniające jednolitość i kompletność danych oraz zunifikowane kryteria sprawdzania prac. JSA będzie obejmował wszystkie obszary kształcenia na poziomie wyższym.

- Dlaczego to właśnie OPI PIB buduje JSA?

Kozłowski: - Stworzenie Jednolitego Systemu Antyplagiatowego zostało wpisane do znowelizowanej ustawy Prawo o szkolnictwie wyższym. Znalazł się w niej zapis mówiący, że za JSA odpowiedzialny będzie minister właściwy do spraw szkolnictwa wyższego, a instytutem badawczym mogącym opracować system i administrować nim jest instytut badawczy nadzorowany przez Ministra Nauki i Szkolnictwa Wyższego, czyli OPI PIB. Jesteśmy instytutem budującym systemy informatyczne dla całego sektora szkolnictwa wyższego i nauki. Zbudowaliśmy i utrzymujemy POL-on, o którym ostatnio opowiadali moi koledzy oraz ORPPD – Ogólnopolskie Repozytorium Pisemnych Prac Dyplomowych. Mamy zasoby i doświadczenie. I operujemy dużymi zbiorami danych.

- Czy to będą bazy referencyjne dla JSA?

Kozłowski: - Oczywiście. To się rozumie samo przez się. JSA będzie współpracował z ORPPD sprawdzając treści nowych prac dyplomowych z tymi już zgromadzonymi w repozytorium.

- JSA wydaje się być ogromnym przedsięwzięciem. Od czego zaczęliście?

Kozłowski: - Od konkursu. Rozpisaliśmy konkurs na algorytmy i kody źródłowe różnych rozwiązań antyplagiatowych, w którym wybraliśmy i nagrodziliśmy najwyższej jakości metody detekcji plagiaryzmu, a potem wykorzystaliśmy je jako kanwę do budowy JSA. Rozwiązania zgłoszone w ramach konkursu musiały sprostać bardzo trudnym wyzwaniom, które wyznaczył nasz zespół, a było to: wykrywanie fraz/zdań wspólnych między dwoma dokumentami (tzw. Text Alignment), wykrywanie istotnych zapożyczeń między danym dokumentami a zadanym zbiorem dokumentów (External Plagiarism Detection), wykrywanie w ramach jednego dokumentu części podejrzanych o autorstwo innej osoby (Intrinsic Plagiarism Detection), wykrywanie zapożyczeń w Internecie (Web Source Retrieval) oraz wykonanie analizy szybkości działania i podatności na skalowalność (Scalability Verification). Potem zajęliśmy się budową silnika detekcji, interfejsów użytkownika i końcówek integracyjnych.

-  Brzmi bardzo specjalistycznie.

Kozłowski: - I jest mocno specjalistyczne. Silnik detekcji plagiatów będzie złożonym modułem obliczeniowym działającym w modelu obliczeń rozproszonych, maksymalizującym wykorzystanie pamięci operacyjnej RAM (tzw. in-memory computation). Silnik będzie wykorzystywał dwa typowe dla dziedziny podejścia: przetwarzania potokowe oraz hybrydowe wykorzystanie różnych podejść (czyli ważenie wyników z różnych modeli detekcji). Tak to zbudowaliśmy, żeby w jak najprostszy i najefektywniejszy sposób wykorzystać nowe wzorce skalowalnych systemów obliczeniowych oraz wyniki uzyskane w konkursie.

-  Wykorzystaliście je jeden do jednego? Czy trzeba było je dopracowywać i ulepszać?

Kozłowski: - Oczywiście konsumpcja rozwiązań konkursowych wymagała prac adaptacyjnych, w tym budowy końcówek integracyjnych – integrujących rozwiązania opracowane przez naszych specjalistów z tymi konkursowymi. Zbudowaliśmy też zestawy graficznych interfejsów użytkownika końcowego zawierające panele do autoryzacji, wprowadzania prac dyplomowych, raporty z analizy plagiaryzmu, zestawy interfejsów dedykowanych administratorom, czy helpdeskowi. Aktualnie gotowa jest wersja DEMO v1 JSA, która będzie testowana na wybranych uczelniach od końca maja do wakacji. Planujemy też dodatkowe badania użyteczności systemu. W kolejnym wdrożeniu DEMO v2 w drugiej połowie września pojawią się nowe ekrany z dodatkowymi funkcjonalnościami oraz interfejsy sieciowe do bezpośredniej integracji systemów uczelnianych z JSA.

- Wspominali Panowie o unikatowej funkcjonalności JSA, czyli badaniu plagiaryzmu w zasobach Internetu. Czy JSA będzie przeszukiwał cały Internet czy tylko polskie strony?

Kozłowski: - Na razie skupiliśmy się na stronach polskojęzycznych, ale angielskojęzyczny Internet też jest już w naszych bliskich planach. Jeszcze w tym roku przewidujemy uwzględnienie angielskiej Wikipedii w obszarze anglojęzycznych stron internetowych. W JSA do przeszukiwania Internetu wykorzystujemy unikalny projekt NEKST – pierwszą w Polsce i dotychczas największa semantyczną wyszukiwarkę internetową stworzoną przez Instytut Podstaw Informatyki Polskiej Akademii Nauk jeszcze w poprzedniej perspektywie finansowej w ramach Programu Innowacyjna Gospodarka. NEKST to skrót od: Narzędzia Eksploracji Semantycznej Tekstów. Wyszukiwarka NEKST ma docelowo bazować na blisko miliardzie dokumentów polskojęzycznych, teraz bazuje na około 730 milionach dokumentów. JSA wykorzystuje zebrane przez NEKST strony polskiego Internetu, czyli tzw. polski obraz Internetu do wyszukiwania plagiaryzmu. Z IPI PAN działamy dwutorowo. Budujemy podzbiór polskiego Internetu na potrzeby przeszukiwania podejrzanych pasaży w pracach dyplomowych eliminując m.in. fora, oferty e-commerce i klony stron. Następnie, w oparciu o tak odflitrowane dane budujemy dedykowane indeksy, które są odpytywane przez JSA. IPI PAN zmodyfikował nawet NEKST specjalnie do celów JSA.

- A czy JSA będzie przyjazny dla użytkownika? Czy łatwo będzie się nim posługiwać?

Kowalski: - Bardzo nam na tym zależało. Mając świadomość złożoności procesu weryfikacji prac dyplomowych staraliśmy się zadbać o przyjazne oblicze interfejsu użytkownika aplikacji internetowej JSA. Dodatkowo, aby ułatwić procesy wdrożeniowe, planujemy integrację JSA z powszechnymi systemami uczelnianymi w trybie integracji za pośrednictwem szeregu usług sieciowych. Będziemy też prowadzili szkolenia z obsługi systemu dla pracowników uczelni w całej Polsce.

- Kiedy i gdzie się odbędą?

Kowalski: - Na początku maja przeprowadziliśmy już szkolenie wykorzystując testową wersję systemu – DEMO v1. Jesienią zakończymy rozbudowę systemu do wersji DEMO v2 i wówczas przeprowadzimy kolejne szkolenia. Planujemy zorganizowanie czterech szkoleń w Warszawie oraz ośmiu poza Warszawą, w dużych ośrodkach akademickich: Trójmieście, Poznaniu, Olsztynie, Łodzi, Lublinie, Krakowie, Katowicach, Wrocławiu. Z Jednolitego Systemu Antyplagiatowego będzie korzystało wiele podmiotów, dlatego niezwykle istotne jest, aby ich przedstawiciele odpowiedzialni za wdrażanie systemu antyplagiatowego zapoznali się z procedurami antyplagiatowymi i scenariuszami użycia systemu. Dlatego będą potrzebne merytoryczne oraz wdrożeniowe szkolenia z tego zakresu. Poprowadzą je pracownicy OPI PIB zaangażowani w tworzenie systemu.

-  Kiedy będzie gotowy JSA w pełnej przetestowanej i sprawdzonej wersji?

Kowalski: - Robimy wszystko, żeby stało się to pod koniec tego roku.

- Jak już uruchomicie system i finansowanie z POWER się skończy? Kto i za co będzie go utrzymywał?

Kozłowski: - Po zakończeniu realizacji projektu system będzie utrzymywany i poddawany dalszym niezbędnym modyfikacjom przez OPI PIB, w ramach zadań zleconych przez MNISW – zgodnie z obowiązującym prawem.

- A dalsza rozbudowa o nowe funkcjonalności? Myślicie o tym?

Kozłowski: - Oczywiście. W przyszłości możliwe jest wykorzystywanie opracowanego systemu do analizy innych prac, na przykład prac doktorskich, czy wszelkich prac zaliczeniowych składanych na uczelniach w Polsce. I oczywiście porównywanie nie tylko do polskich baz referencyjnych, ale również do baz angielskojęzycznych, a w dalszej przyszłości również tych tworzonych w innych językach. Nasze działania będą tu dotyczyć zarówno gromadzenia wielojęzycznych danych, jak i wprowadzenia mechanizmów tłumaczenia na potrzeby indeksowania i wyszukiwania.

- To duże wyzwanie. Życzymy powodzenia. Dziękuję za rozmowę.

[1] plagiaryzm według Słownika Języka Polskiego to “dopuszczenie się bezprawnego wypromowania, wykorzystania cudzego dzieła lub pomysłu pod własnym nazwiskiem”; w przypadku JSA: w kontekście pracy dyplomowej.

Partner Merytoryczny
Rankingu Szkół Wyższych 2018

Partnerzy Medialni
Rankingu Szkół Wyższych 2018