Beiträge

Agile Schätztechniken: jenseits von Planning Poker

Team von Entwicklern versammelt um ein Whiteboard voller farbiger Haftnotizen, die in Gruppen organisiert sind, bei der gemeinsamen Schätzung ihres Sprint-Backlogs

Matt Lewandowski

Zuletzt aktualisiert am 14/02/20268 Min. Lesezeit

Planning Poker bekommt die meiste Aufmerksamkeit bei agilen Schätzungen, und das zu Recht. Aber es ist nicht die einzige Option. Je nach Teamgröße, Art der Arbeit und verfügbarer Zeit könnten andere Techniken besser passen. Hier ist, was es sonst noch gibt und wann man welche Technik einsetzt.

Planning Poker (die Basis)

Wenn du bereits mit Planning Poker vertraut bist, kennst du den Ablauf: Das Team bespricht ein Backlog-Item, jeder wählt privat eine Karte mit seiner Schätzung, die Karten werden gleichzeitig aufgedeckt und Ausreißer erklären ihre Begründung. Das wird wiederholt, bis man sich annähert. Planning Poker funktioniert gut, weil das gleichzeitige Aufdecken den Ankereffekt verhindert. Die Diskussion nach Meinungsverschiedenheiten ist der Moment, in dem man wirklich etwas lernt. Teams entdecken missverstandene Anforderungen und unterschiedliche Annahmen zum Umfang. Es ist die zuverlässigste Methode für detaillierte Schätzungen auf Sprint-Ebene. Aber es ist langsam. 30 Backlog-Items einzeln zu schätzen kann einen ganzen Nachmittag auffressen. Da kommen die anderen Techniken ins Spiel.

T-Shirt-Sizing

T-Shirt-Sizing ersetzt numerische Skalen durch vertraute Bezeichnungen: XS, S, M, L, XL und manchmal XXL. Statt darüber zu debattieren, ob etwas eine 5 oder eine 8 ist, fragen Teams: "Ist das ein Medium oder ein Large?"

So funktioniert es

Stelle dem Team die Backlog-Items vor
Beginne mit einem Referenz-Item, auf das sich alle einigen (z.B. "Dieses Login-Seiten-Redesign ist ein Medium")
Für jedes weitere Item diskutiert das Team und weist eine Größe relativ zur Referenz zu
Bei Meinungsverschiedenheiten erklären die Ausreißer ihre Begründung und es wird erneut abgestimmt

Wann man es einsetzt

T-Shirt-Sizing funktioniert am besten in der frühen Projektphase, wenn man grobe Schätzungen für die Roadmap-Planung braucht. Es ist schneller als Planning Poker, weil es weniger Optionen gibt, über die man grübeln muss, und die Bezeichnungen falsche Präzision vermeiden. Niemand streitet über den Unterschied zwischen XL und XXL so wie über 13 vs. 21 Story Points. Es funktioniert auch gut für nicht-technische Stakeholder. Produktmanager und Designer verstehen intuitiv "das ist ein Large", ohne eine Einführung in Fibonacci-Folgen zu brauchen.

Größen auf Zahlen abbilden

Wenn du T-Shirt-Größen in numerische Werte für die Kapazitätsplanung umrechnen musst, lege vorab ein Mapping fest (z.B. S=2, M=5, L=8, XL=13). Lass das Mapping aber nicht zum Fokus werden. Der ganze Sinn von T-Shirt-Sizing ist, abstrakt zu bleiben.

Gruppe von Personen, die Elemente in beschriftete Eimer von klein bis extra-groß sortieren, als Darstellung der relativen Größeneinschätzung von Aufgaben

Affinity Mapping (Affinitätsschätzung)

Affinitätsschätzung ermöglicht es Teams, eine große Anzahl von Items schnell zu bewerten, indem sie miteinander verglichen werden statt mit einer absoluten Skala.

So funktioniert es

Schreibe jedes Backlog-Item auf eine Karte oder Haftnotiz
Lege das erste Item in die Mitte eines Tisches oder einer Wand
Nimm das nächste Item und frage: "Ist das größer, kleiner oder ungefähr gleich wie das erste?"
Platziere es links für kleiner, rechts für größer, gleiche Spalte wenn ähnlich
Fahre mit jedem Item fort. Teammitglieder können Items, mit denen sie nicht einverstanden sind, still umordnen
Sobald alle Items platziert sind, ziehe Spaltengrenzen und weise jeder Gruppe Größenbezeichnungen zu

Die stille Sortierphase ist das Geheimnis. Statt jedes Item nacheinander zu debattieren, bewegen mehrere Personen gleichzeitig Karten. Meinungsverschiedenheiten tauchen natürlich auf, wenn jemand eine Karte verschiebt und jemand anders sie zurückschiebt. Genau diese Items werden zu den Diskussionspunkten.

Wann man es einsetzt

Affinitätsschätzung ist am besten geeignet, wenn man ein großes Backlog (30+ Items) und wenig Zeit hat. Teams können 50 Items in 20-30 Minuten sortieren, etwas das mit Planning Poker Stunden dauern würde. Es ist besonders nützlich zu Beginn eines neuen Projekts oder nach einer großen Backlog-Refinement-Session.

Dot Voting

Dot Voting ist streng genommen keine Schätztechnik. Es ist eine Priorisierungsmethode. Aber es ergänzt Schätzungen gut, indem es Teams hilft, schnell zu identifizieren, welche Items am wichtigsten sind.

So funktioniert es

Liste alle Items auf einem Board auf (physisch oder virtuell)
Gib jedem Teammitglied eine feste Anzahl von Punkten (typischerweise 3-5)
Jede Person platziert ihre Punkte auf den Items, die sie für am wichtigsten hält
Items mit den meisten Punkten steigen nach oben

Du kannst Einschränkungen hinzufügen: "Du darfst nur einen Punkt pro Item setzen" oder "Setze deine Punkte auf die Items, die wir deiner Meinung nach zuerst schätzen sollten." Manche Teams verwenden verschiedenfarbige Punkte für verschiedene Dimensionen (rot für Risiko, grün für Wert).

Wann man es einsetzt

Dot Voting funktioniert am besten als Vor-Schätzungsschritt. Statt das gesamte Backlog zu schätzen, stimme zuerst mit Punkten ab, um die Top 10-15 Items zu identifizieren, und verwende dann Planning Poker oder T-Shirt-Sizing nur für diese. Das spart Zeit und hält das Team auf das fokussiert, was für den nächsten Sprint oder Release wirklich wichtig ist. Hände, die farbige Klebepunkte auf ein Board voller Aufgabenkarten platzieren, einige Karten mit mehreren Punkten bedeckt, die klare Team-Prioritäten zeigen

Hände, die farbige Klebepunkte auf ein Board voller Aufgabenkarten platzieren, einige Karten mit mehreren Punkten bedeckt, die klare Team-Prioritäten zeigen

Bucket-System

Das Bucket-System kombiniert Elemente von Affinity Mapping und Planning Poker. Es ist dafür konzipiert, große Backlogs schnell mit größeren Gruppen zu schätzen.

So funktioniert es

Erstelle "Buckets" für Schätzgrößen (0, 1, 2, 3, 5, 8, 13, 20, 40, 100)
Wähle ein Item und platziere es als Referenz in einem Bucket (das Team muss sich bei diesem einig sein)
Verteile die restlichen Items gleichmäßig unter den Teammitgliedern
Jede Person platziert ihre Items still in Buckets relativ zur Referenz
Sobald alles platziert ist, überprüft das Team gemeinsam und bespricht Items, die fehl am Platz erscheinen
Anpassen und finalisieren

Wann man es einsetzt

Das Bucket-System funktioniert gut für große Backlogs (50-200 Items) mit Teams von 5-15 Personen. Da die initiale Sortierung still und parallel erfolgt, ist es viel schneller als sequentielles Schätzen. Die Überprüfungsphase sorgt für Ehrlichkeit, ohne dass jedes einzelne Item diskutiert werden muss.

Achtung bei den Bucket-Grenzen

Die größte Quelle für Meinungsverschiedenheiten sind Items, die zwischen zwei Buckets fallen. Lege vorab eine Regel fest: Im Zweifelsfall aufrunden. Es ist besser, leicht zu überschätzen, als mitten im Sprint festzustellen, dass eine "5" eigentlich eine 13 war.

Drei-Punkt-Schätzung (PERT)

Die Drei-Punkt-Schätzung stammt aus dem Projektmanagement, nicht aus der agilen Welt. Aber sie ist nützlich, wenn dein Team Unsicherheit berücksichtigen muss, besonders bei unbekannter Arbeit.

So funktioniert es

Für jedes Item gibt das Team drei Schätzungen ab:

Schätzung	Bedeutung
Optimistisch (O)	Alles läuft perfekt, keine Überraschungen
Wahrscheinlichst (M)	Realistisches Szenario mit normalem Aufwand
Pessimistisch (P)	Alles was schiefgehen kann, geht schief

Der gewichtete Durchschnitt ist: (O + 4M + P) / 6 Zum Beispiel, wenn ein Feature auf 2 Tage optimistisch, 5 Tage wahrscheinlichst und 14 Tage pessimistisch geschätzt wird: (2 + 20 + 14) / 6 = 6 Tage.

Wann man es einsetzt

Die Drei-Punkt-Schätzung lohnt den Mehraufwand, wenn die Unsicherheit hoch ist: unbekannte Technologie, Integrationen mit externen Systemen oder etwas, das das Team noch nie gebaut hat. Die pessimistische Schätzung zwingt die Leute, über Risiken nachzudenken, die Planning Poker oft übersieht. Für Routinearbeit ist es übertrieben. Wenn dein Team dutzende CRUD-Endpoints gebaut hat, brauchst du keine drei Schätzungen für den nächsten.

Die richtige Technik wählen

Es gibt keine einzelne beste Schätzmethode. Die richtige Wahl hängt vom Kontext ab.

Szenario	Beste Technik
Sprint-Planung mit 10-15 Items	Planning Poker
Roadmap-Planung mit grober Größeneinschätzung	T-Shirt-Sizing
Großes Backlog (30+ Items), wenig Zeit	Affinity Mapping
Priorisieren, was zuerst geschätzt wird	Dot Voting
Riesiges Backlog (50-200 Items), großes Team	Bucket-System
Arbeit mit hoher Unsicherheit	Drei-Punkt-Schätzung

Die meisten Teams kombinieren letztlich Techniken. Dot Voting zum Priorisieren, Affinity Mapping zum groben Dimensionieren des Backlogs, dann Planning Poker für die Items im kommenden Sprint. Geteilte Ansicht verschiedener Schätztechniken nebeneinander, mit Karten, Punkten und Größenbezeichnungen sichtbar bei verschiedenen Gruppen zusammenarbeitender Personen

Geteilte Ansicht verschiedener Schätztechniken nebeneinander, mit Karten, Punkten und Größenbezeichnungen sichtbar bei verschiedenen Gruppen zusammenarbeitender Personen

Ein paar Dinge, die für alle gelten

Egal welche Technik du verwendest:

Schätze relativ zueinander, nicht in absoluten Werten. "Das ist doppelt so komplex wie die Login-Seite" ist nützlicher als "das dauert 3 Tage."
Begrenze die Session zeitlich. Schätzungen haben abnehmende Erträge. Stell einen Timer und mach weiter, wenn ihr nah genug dran seid.
Schätze neu, wenn du etwas Neues lernst. Schätzungen sind Momentaufnahmen, keine Verpflichtungen. Aktualisiere sie, wenn die Anforderungen klarer werden.
Verfolge die Genauigkeit über die Zeit. Vergleiche nach ein paar Sprints Schätzungen mit tatsächlichen Werten. Die Muster zeigen dir, wo dein Team konsequent daneben liegt. Wenn dein Team bei bestimmten Story-Typen regelmäßig Schwierigkeiten hat, kann ein Estimation Complexity Analyzer versteckte Komplexitätsfaktoren vor der Schätzung aufdecken.

Wenn du Planning Poker mit deinem Team ausprobieren möchtest, unterstützt Kollabes Planning-Poker-Tool Fibonacci, T-Shirt-Größen und benutzerdefinierte Skalen, und der Einstieg ist kostenlos.

Ja, und viele Teams tun das. Ein gängiger Ansatz: Dot Voting zum Priorisieren, dann Planning Poker für die Top-Items. Oder Affinity Mapping für das gesamte Backlog, dann Planning Poker nur für Items, bei denen das Team uneinig war.

Planning Poker lässt sich am natürlichsten auf Remote-Settings übertragen, da Online-Tools das gleichzeitige Aufdecken übernehmen. T-Shirt-Sizing und Dot Voting funktionieren auch gut mit virtuellen Boards. Affinity Mapping ist remote schwieriger, weil es an Geschwindigkeit verliert, wenn man Karten nicht physisch verschieben kann.

Story Points (oder abstrakte Größen) werden generell bevorzugt, weil sie Komplexität statt Dauer messen. Zeitschätzungen werden davon beeinflusst, wer die Arbeit macht, und tendieren dazu, zu Verpflichtungen zu werden. Points bleiben relativ und flexibel.

Vergleiche deine Schätzungen mit den tatsächlichen Werten jedes Sprints. Suche nach Mustern: Unterschätzt ihr konsequent Integrationen? Überschätzt ihr Frontend-Arbeit? Die Daten zeigen euch, wo ihr kalibrieren müsst. Halte außerdem eure Referenz-Stories aktuell. Euer "Medium" heute könnte ein anderes sein als euer "Medium" vor sechs Monaten.

Agile Schätztechniken: jenseits von Planning Poker

Planning Poker (die Basis)

T-Shirt-Sizing

So funktioniert es

Wann man es einsetzt

Affinity Mapping (Affinitätsschätzung)

So funktioniert es

Wann man es einsetzt

Dot Voting

So funktioniert es

Wann man es einsetzt

Bucket-System

So funktioniert es

Wann man es einsetzt

Drei-Punkt-Schätzung (PERT)

So funktioniert es

Wann man es einsetzt

Die richtige Technik wählen

Ein paar Dinge, die für alle gelten

Kann man Schätztechniken in einer Session kombinieren?

Welche Technik ist am besten für Remote-Teams?

Sollten wir in Story Points oder Zeit schätzen?

Wie werden wir beim Schätzen besser?