Rzeczywiste zbiory danych bardzo często zawierają dane numeryczne oraz
są niekompletne. Zastąpienie wielu wartości atrybutu numerycznego
niewielką liczbą przedziałów, wynikających z dyskretyzacji, może
poprawić wydajność oraz dokładność klasyfikacji, zwłaszcza w przypadku
nie w pełni poprawnych danych uczących. Ważny jest wybór odpowiedniej
techniki dyskretyzacji. Z tego powodu podjęto badania, których celem
jest ocena wpływu różnych technik dyskretyzacji, redukcji przedziałów
oraz atrybutów na jakość procesu uczenia oraz złożoność modeli uczenia.
Jednocześnie brakujące, nieznane wartości atrybutów nie oznaczają
wartości niemożliwych do analizy, dla takich przewidziane jest specjalne
oznaczenie w zbiorze. Z uwagi na fakt, że głównymi przyczynami
niekompletności są wartości utracone albo wartości uznane za nieistotne,
podjęto również badania nad rozwojem metod eksploracji danych z
zastosowaniem wspomnianych interpretacji.