Machine learning supervisionato
Gli algoritmi di machine learning supervisionato sono i più comunemente usati.
Sono detti "supervisionati" perché l'apprendimento si basa un set di dati di formazione (training dataset) in cui sono presenti diversi esempi X.
Ogni esempio è accompagnato da un'etichetta y dove è indicata la risposta corretta.
L'algoritmo di ML analizza il dataset alla ricerca per costruire un modello decisionale.
Il modello è una funzione che a partire da un insieme di attributi X determina una risposta y.
y = f(X)
La risposta può consistere in una classificazione, in un valore oppure in una decisione.
Una volta costruito il modello, questo viene testato con un altro set di dati di test (dataset testing) per verificare l'accuratezza del modello.
Anche nel testing dataset sono presenti degli esempi X con la relativa etichetta y che indica la risposta corretta di ciascun esempio.
Se l'accuratezza del modello è sufficientemente alta, il modello può essere utilizzato anche per valutare situazioni diverse da quelle usate per l'apprendimento.
Gli algoritmi di machine learning supervisionato si distinguono in due tipologie
- Algoritmi di classificazione
Questi algoritmi risolvono problemi di classificazione. Ad esempio, a partire da alcune caratteristiche classificano le specie di fiori. - Algoritmi di regressione
Questi algoritmi forniscono come risposta un valore reale. Ad esempio, il prezzo di una casa a partire da una sere di caratteristiche dell'immobile. Appartengono a questa tipologia gli algoritmi di apprendimento linear regression, decision tree, random forest, knn, logistic regression.