Mätvärden för obalanserad klassificering

Vilka mätvärden skulle du använda i ett klassificeringsproblem?
Vilket mått ska du använda för att utvärdera din klassificerare om data är obalanserad Hur härleds det?
Hur hanterar du obalanserad data i klassificeringen?
Vilket mått kan du använda för att utvärdera en klassificeringsmodell?

Vilka mätvärden skulle du använda i ett klassificeringsproblem?

De vanligaste prestandamätvärdena för klassificeringsproblem är följande,

Noggrannhet.
Förvirringsmatris.
Precisions-, återkallnings- och F1 -poäng.
ROC AUC.
Log-loss.

Vilket mått ska du använda för att utvärdera din klassificerare om data är obalanserad Hur härleds det?

Precisionsmätvärdet berättar hur många förutsagda prover som är relevanta i.e. våra misstag i att klassificera provet som ett korrekt om det inte är sant. detta mått är ett bra val för det obalanserade klassificeringsscenariot.

Hur hanterar du obalanserad data i klassificeringen?

7 tekniker för att hantera obalanserad data

Använd rätt utvärderingsstatistik. ...
Prova träningsuppsättningen igen. ...
Använd K-faldig korsvalidering på rätt sätt. ...
Samla olika omsamplade datamängder. ...
Provprov med olika förhållanden. ...
Kluster den rikliga klassen. ...
Designa dina egna modeller.

Vilket mått kan du använda för att utvärdera en klassificeringsmodell?

Area Under Curve (AUC) är en av de mest använda mätvärdena för utvärdering. Det används för binärt klassificeringsproblem. AUC för en klassificerare är lika med sannolikheten för att klassificeraren kommer att ranka ett slumpmässigt valt positivt exempel högre än ett slumpmässigt valt negativt exempel.