Predspracovanie dát je kritický krok v strojovom učení, ktorý zahŕňa čistenie, transformáciu a prípravu dát pred použitím v modeloch. Typické úlohy predspracovania zahŕňajú:
- Čistenie dát (odstránenie chýb a nekonzistencií)
- Normalizácia a štandardizácia (zmena mierky dát)
- Kategorizácia a kódovanie (konverzia kategórií na číselné hodnoty)
- Rozdelenie dát na tréningovú a testovaciu sadu