Przekształcanie danych
w wiedzę

DoRIS - Specyfikacja techniczna

Liczba dokumentów zależnie od edycji

Unlimited (ograniczone zasobami środowiska)

Liczba użytkowników

Unlimited

Źródła danych

 • Serwer sieciowy (SMB)
 • Chmura (Onedrive, Googledrive, etc.)
 • Strony WWW – Webscraping, Webcrawling
 • Inne wskazane przez Klienta
 • Formularz WWW (GUI)
 • Sharepoint (on premise, cloud)
 • Systemy zewnętrzne z API

 

 

Typy danych wejściowych

 • Nieustrukturyzowane
         Użytkownik

         Właściciel dokumentów
         Administrator zawartości

 • Ustrukturyzowane

          Excel, json, xml, csv

 

Formaty danych wyjściowych

 • API: json

Graficzny Interfejs Użytkownika

 • Interfejs WEB z poziomu przeglądarki internetowej (Chrome, Firefox, Edge) lub urządzeń mobilnych
 • Integracja z Active Directory
 • Wyszukiwanie z uwzględnieniem literówek, negacji, dopełnień słów lub metadanych.
 • Wyznaczanie dokumentów podobnych oraz duplikatów
 • Wyszukiwanie w zasobach zewnętrznych
 • Graficzny podgląd stron dokumentów
 • Edycja metadanych
 • Moduł BI
           Statystyki dokumentów
           Raporty aktywności użytkowników
           Wizualizacja danych tabelarycznych
 • Role użytkowników
           Użytkownik
           Właściciel dokumentów
           Administrator zawartości
 
 • Autoryzowany dostęp do aplikacji
 • Wersje językowe interfejsu: polska, angielska
 • Wyszukiwanie pełnotekstowe z uwzględnieniem odmiany dla języka polskiego oraz angielskiego
 • Rekomendacje dokumentów na bazie zachowania użytkowników
 • Oznaczanie wyszukanych fraz w wynikach wyszukiwania
 • Przeglądanie struktury repozytorium wg. klasyfikacji
 • Tagowanie dokumentów
 • Poziomy uprawnień
           Dostęp na poziomie dokumentu
            Dostęp na poziomie taksonomii

Przetwarzanie

 • OCR - rozpoznawanie tekstu z obrazu
 • AI, NLP - przetwarzanie języka naturalnego z wykorzystaniem sztucznej inteligencji:
           Wydobywanie metadanych, słów kluczowych, encji nazwanych
           Automatyczna klasyfikacja dokumentów
           Automatyczne uzupełnianie brakujących metadanych
           Generowanie streszczenia
 • Generowanie podglądu stron dokumentu
 • Conformal Prediction - douczanie modeli na podstawie aktywności i preferencji użytkowników

Repozytorium dokumentów

 • Historia wersji dokumentu
 • Indeks szybkiego wyszukiwania
 • Historia aktywności użytkownika
 • Metadane dokumentu
 • Wielowymiarowa, hierarchiczna klasyfikacja dokumentów

API programistyczne

 • Autoryzowany dostęp do repozytorium bez użycia GUI
 • REST API
 • Swagger UI

 Technologie

 • Dokumentowa baza danych: MongoDB
 • Indeks wyszukiwania: ElasticSearch
 • Relacyjna baza danych: PostgreSQL
 • Frontend: Vue.js
 • Przetwarzanie: Python
 • Serwer aplikacji: Nginx

 

Minimalne wymagania systemowe

 • HDD: 500 GB
 • RAM: 40 GB
 • CPU: 8x core
 • System operacyjny: Linux 

Instalacja

 • Instalacja w infrastrukturze lokalnej klienta
 • Instalacja w chmurze (AWS, Azure, HP, IBM) 

 

Kontakt z ekspertem

Proszę wypełnić wymagane pola
Proszę wypełnić wymagane pola