Co lepsze: jakość czy ilość danych?

Co lepsze: jakość czy ilość danych
Współcześnie komputery w coraz większym stopniu zaczynają „rozumieć” ludzką mowę i pismo. Przetwarzanie języka naturalnego pozwala w krótkim czasie wydobywać cenne informacje z ogromnych zbiorów nieustrukturyzowanych danych, zarazem dając do nich łatwy dostęp. Przedstawiamy przykłady wykorzystania technologii NLP w wybranych branżach i sektorach!

Co lepsze: jakość czy ilość danych?

Ogólnie rzecz biorąc, więcej danych prowadzi do bardziej precyzyjnych modeli, a zatem i lepszych wyników - o ile dane są prawdziwe i reprezentatywne.

☝️ Praktyka dowodzi, że lepiej jest używać mniejszej ilości danych najwyższej jakości niż dużych ilości danych, ale o słabej lub nieokreślonej jakości.

Czasami ilość wysokiej jakości danych jest niewystarczająca, aby zamodelować problem do rozwiązania i wytrenować model.

☑ Należy więc zapewnić rozwiązanie (np. biDQM) oparte na dogłębnej analizie i wysokiej jakości danych własnych lub oprzeć się na danych zewnętrznych (otwarte rejestry), a także pozyskiwanych komercyjnie, o ile rachunek ekonomiczny potwierdza ich skuteczność w procesie trenowania modelu biznesowego.