Przekształcanie danych 
w wiedzę

  • DoRIS specyfikacja techniczna

DoRIS - Specyfikacja techniczna

Liczba dokumentów zależnie od edycji

Unlimited (ograniczone zasobami środowiska)

Liczba użytkowników

Unlimited

Źródła danych

  • Serwer sieciowy (SMB)
  • Chmura (Onedrive, Googledrive, etc.)
  • Strony WWW – Webscraping, Webcrawling
  • Inne wskazane przez Klienta
  • Formularz WWW (GUI)
  • Sharepoint (on premise, cloud)
  • Systemy zewnętrzne z API

Typy danych wejściowych

  • Nieustrukturyzowane
    • Użytkownik
    • Właściciel dokumentów
    • Administrator zawartości
  • Ustrukturyzowane
    • Excel, json, xml, csv

Formaty danych wyjściowych

  • API: json

Graficzny interfejs użytkownika

  • Interfejs WEB z poziomu przeglądarki internetowej (Chrome, Firefox, Edge) lub urządzeń mobilnych
  • Integracja z Active Directory
  • Wyszukiwanie z uwzględnieniem literówek, negacji, dopełnień słów lub metadanych.
  • Wyznaczanie dokumentów podobnych oraz duplikatów
  • Wyszukiwanie w zasobach zewnętrznych
  • Graficzny podgląd stron dokumentów
  • Edycja metadanych
  • Moduł BI
             Statystyki dokumentów
             Raporty aktywności użytkowników
             Wizualizacja danych tabelarycznych
  • Role użytkowników
             Użytkownik
             Właściciel dokumentów
             Administrator zawartości
  • Autoryzowany dostęp do aplikacji
  • Wersje językowe interfejsu: polska, angielska
  • Wyszukiwanie pełnotekstowe z uwzględnieniem odmiany dla języka polskiego oraz angielskiego
  • Rekomendacje dokumentów na bazie zachowania użytkowników
  • Oznaczanie wyszukanych fraz w wynikach wyszukiwania
  • Przeglądanie struktury repozytorium wg. klasyfikacji
  • Tagowanie dokumentów
  • Poziomy uprawnień

           Dostęp na poziomie dokumentu
            Dostęp na poziomie taksonomii

Przetwarzanie

  • OCR - rozpoznawanie tekstu z obrazu
  • AI, NLP - przetwarzanie języka naturalnego z wykorzystaniem sztucznej inteligencji:
    • Wydobywanie metadanych, słów kluczowych, encji nazwanych
    • Automatyczna klasyfikacja dokumentów
    • Automatyczne uzupełnianie brakujących metadanych
    • Generowanie streszczenia
  • Generowanie podglądu stron dokumentu
  • Conformal Prediction - douczanie modeli na podstawie aktywności i preferencji użytkowników

Repozytorium dokumentów

  • Historia wersji dokumentu
  • Indeks szybkiego wyszukiwania
  • Historia aktywności użytkownika
  • Metadane dokumentu
  • Wielowymiarowa, hierarchiczna klasyfikacja dokumentów

API programistyczne

  • Autoryzowany dostęp do repozytorium bez użycia GUI
  • REST API
  • Swagger UI

Technologie

  • Dokumentowa baza danych: MongoDB
  • Indeks wyszukiwania: ElasticSearch
  • Relacyjna baza danych: PostgreSQL
  • Frontend: Vue.js
  • Przetwarzanie: Python
  • Serwer aplikacji: Nginx

Minimalne wymagania systemowe

  • HDD: 500 GB
  • RAM: 40 GB
  • CPU: 8x core
  • System operacyjny: Linux

Instalacja

  • Instalacja w infrastrukturze lokalnej klienta
  • Instalacja w chmurze (AWS, Azure, HP, IBM)