Wofür schätzen wir (ganz kurz gefasst)?
Schätzungen sollen uns helfen bei der Einschätzung, was wir schaffen, in Scrum also in einem Sprint. Zusätzlich kann man sie verwenden, um abzuschätzen, wie lange durchschnittlich die Bearbeitung großer Themen dauert.
Kann man Bugs schätzen?
Ich stimme den anderen Antworten zu, dass man Bugs viel schwieriger abschätzen kann, da die Analyse ob und falls ja was zu tun ist, länger dauert als die Umsetzung. Das bedeutet aber nicht, dass man mehr Zeit für die Schätzung aufwenden muss. Man könnte z.B. auch die Durchschnittsgröße vorheriger Bugs in dieser Domain oder in diesem technischen Bereich schätzen und den einfach nehmen. Damit ist es wirtschaftlich, da die Schätzung kaum Zeit nimmt (die Wahrscheinlichkeit, dass man größer drüber oder drunter liegt aber deutlich größer als bei anderen Backlog Items).
Kann man die Velocity interpretieren, wenn man Bugs schätzt?
Typischerweise erwartet man mindestens eine gleichbleibende Velocity (nicht zu verwechseln mit einem gleichbleibendem Mehrwert - dieser hängt an dem geschätzten Mehrwert einer Story, nicht an der geschätzten Komplexität/Aufwand/Risiko einer Umsetzung). Schätzt man Bugs nicht, erwartet man eine fallende Velocity, wenn immer mehr Bugs reinkommen und kümmert sich dann darum. Steigt die Velocity könnte es daran liegen, dass man weniger Bugs bearbeiten muss.
Schätzt man Bugs mit, dann könnte es sein, dass die Velocity gleich bleibt, nur der Anteil an Bugs variiert. Um die Bugs zu interpretieren, muss man die Summe der Bugs also getrennt betrachten, was kein technisches oder methodisches Problem sein sollte.
Würde ich Bugs im Nachhinein 'Schätzen'?
Falls wir Bugs im Nachhinein Schätzen, dann gleicht diese Schätzung eher Messungen, da je nach Aufmerksamkeit man relativ exakt sagen kann, wie lange eine Umsetzung gedauert hat / wie komplex sie war / wie viel Aufwand es war.
Meine persönliche Erfahrung ist hier, dass wir hier dazu neigen im Kopf die genauen Stunden in Story Points umzurechnen (Pi mal Daumen). Das können wir bei den anderen Backlog Items nicht. Das kann dazu führen, dass wir bei anderen Backlog Items auch den bekannten Aufwand in Stunden versuchen abzuschätzen und diese dann wieder in Story Points umrechnen. Da wir bei diesen Backlog Items aber vieles nicht wissen, müssen wir üblicherweise deutlich mehr tun, als das im Voraus Bekannte. Ich habe hier die Erfahrung gemacht, dass die im Nachhinein geschätzten Bugs im Verhältnis zu hoch geschätzt werden. Man kann dies abmildern mit dem ständigen Vergleich mit z.B. Referenzstories. Trotzdem ist die Art des Schätzens dann eine andere, da ich beim einen etwas Unbekanntes Vergleiche und bei Bugs einen bekannten Aufwand.
Ich halte dies nicht für ein großes Problem, würde aber trotzdem nach Möglichkeit dazu tendieren, die Arbeit an Bugs anderweitig zu sammeln (z.B. mit Strichen an einem Board für jede angefangene halbe Stunde bei Arbeit an Bugs <-- wenig Aufwand, (ausreichend) hohe Präzision).