Agile Schätztechniken: jenseits von Planning Poker

Team von Entwicklern versammelt um ein Whiteboard voller farbiger Haftnotizen, die in Gruppen organisiert sind, bei der gemeinsamen Schätzung ihres Sprint-BacklogsTeam von Entwicklern versammelt um ein Whiteboard voller farbiger Haftnotizen, die in Gruppen organisiert sind, bei der gemeinsamen Schätzung ihres Sprint-Backlogs Planning Poker bekommt die meiste Aufmerksamkeit bei agilen Schätzungen, und das zu Recht. Aber es ist nicht die einzige Option. Je nach Teamgröße, Art der Arbeit und verfügbarer Zeit könnten andere Techniken besser passen. Hier ist, was es sonst noch gibt und wann man welche Technik einsetzt.

Planning Poker (die Basis)

Wenn du bereits mit Planning Poker vertraut bist, kennst du den Ablauf: Das Team bespricht ein Backlog-Item, jeder wählt privat eine Karte mit seiner Schätzung, die Karten werden gleichzeitig aufgedeckt und Ausreißer erklären ihre Begründung. Das wird wiederholt, bis man sich annähert. Planning Poker funktioniert gut, weil das gleichzeitige Aufdecken den Ankereffekt verhindert. Die Diskussion nach Meinungsverschiedenheiten ist der Moment, in dem man wirklich etwas lernt. Teams entdecken missverstandene Anforderungen und unterschiedliche Annahmen zum Umfang. Es ist die zuverlässigste Methode für detaillierte Schätzungen auf Sprint-Ebene. Aber es ist langsam. 30 Backlog-Items einzeln zu schätzen kann einen ganzen Nachmittag auffressen. Da kommen die anderen Techniken ins Spiel.

T-Shirt-Sizing

T-Shirt-Sizing ersetzt numerische Skalen durch vertraute Bezeichnungen: XS, S, M, L, XL und manchmal XXL. Statt darüber zu debattieren, ob etwas eine 5 oder eine 8 ist, fragen Teams: "Ist das ein Medium oder ein Large?"

So funktioniert es

  1. Stelle dem Team die Backlog-Items vor
  2. Beginne mit einem Referenz-Item, auf das sich alle einigen (z.B. "Dieses Login-Seiten-Redesign ist ein Medium")
  3. Für jedes weitere Item diskutiert das Team und weist eine Größe relativ zur Referenz zu
  4. Bei Meinungsverschiedenheiten erklären die Ausreißer ihre Begründung und es wird erneut abgestimmt

Wann man es einsetzt

T-Shirt-Sizing funktioniert am besten in der frühen Projektphase, wenn man grobe Schätzungen für die Roadmap-Planung braucht. Es ist schneller als Planning Poker, weil es weniger Optionen gibt, über die man grübeln muss, und die Bezeichnungen falsche Präzision vermeiden. Niemand streitet über den Unterschied zwischen XL und XXL so wie über 13 vs. 21 Story Points. Es funktioniert auch gut für nicht-technische Stakeholder. Produktmanager und Designer verstehen intuitiv "das ist ein Large", ohne eine Einführung in Fibonacci-Folgen zu brauchen. Gruppe von Personen, die Elemente in beschriftete Eimer von klein bis extra-groß sortieren, als Darstellung der relativen Größeneinschätzung von AufgabenGruppe von Personen, die Elemente in beschriftete Eimer von klein bis extra-groß sortieren, als Darstellung der relativen Größeneinschätzung von Aufgaben

Affinity Mapping (Affinitätsschätzung)

Affinitätsschätzung ermöglicht es Teams, eine große Anzahl von Items schnell zu bewerten, indem sie miteinander verglichen werden statt mit einer absoluten Skala.

So funktioniert es

  1. Schreibe jedes Backlog-Item auf eine Karte oder Haftnotiz
  2. Lege das erste Item in die Mitte eines Tisches oder einer Wand
  3. Nimm das nächste Item und frage: "Ist das größer, kleiner oder ungefähr gleich wie das erste?"
  4. Platziere es links für kleiner, rechts für größer, gleiche Spalte wenn ähnlich
  5. Fahre mit jedem Item fort. Teammitglieder können Items, mit denen sie nicht einverstanden sind, still umordnen
  6. Sobald alle Items platziert sind, ziehe Spaltengrenzen und weise jeder Gruppe Größenbezeichnungen zu
Die stille Sortierphase ist das Geheimnis. Statt jedes Item nacheinander zu debattieren, bewegen mehrere Personen gleichzeitig Karten. Meinungsverschiedenheiten tauchen natürlich auf, wenn jemand eine Karte verschiebt und jemand anders sie zurückschiebt. Genau diese Items werden zu den Diskussionspunkten.

Wann man es einsetzt

Affinitätsschätzung ist am besten geeignet, wenn man ein großes Backlog (30+ Items) und wenig Zeit hat. Teams können 50 Items in 20-30 Minuten sortieren, etwas das mit Planning Poker Stunden dauern würde. Es ist besonders nützlich zu Beginn eines neuen Projekts oder nach einer großen Backlog-Refinement-Session.

Dot Voting

Dot Voting ist streng genommen keine Schätztechnik. Es ist eine Priorisierungsmethode. Aber es ergänzt Schätzungen gut, indem es Teams hilft, schnell zu identifizieren, welche Items am wichtigsten sind.

So funktioniert es

  1. Liste alle Items auf einem Board auf (physisch oder virtuell)
  2. Gib jedem Teammitglied eine feste Anzahl von Punkten (typischerweise 3-5)
  3. Jede Person platziert ihre Punkte auf den Items, die sie für am wichtigsten hält
  4. Items mit den meisten Punkten steigen nach oben
Du kannst Einschränkungen hinzufügen: "Du darfst nur einen Punkt pro Item setzen" oder "Setze deine Punkte auf die Items, die wir deiner Meinung nach zuerst schätzen sollten." Manche Teams verwenden verschiedenfarbige Punkte für verschiedene Dimensionen (rot für Risiko, grün für Wert).

Wann man es einsetzt

Dot Voting funktioniert am besten als Vor-Schätzungsschritt. Statt das gesamte Backlog zu schätzen, stimme zuerst mit Punkten ab, um die Top 10-15 Items zu identifizieren, und verwende dann Planning Poker oder T-Shirt-Sizing nur für diese. Das spart Zeit und hält das Team auf das fokussiert, was für den nächsten Sprint oder Release wirklich wichtig ist. Hände, die farbige Klebepunkte auf ein Board voller Aufgabenkarten platzieren, einige Karten mit mehreren Punkten bedeckt, die klare Team-Prioritäten zeigenHände, die farbige Klebepunkte auf ein Board voller Aufgabenkarten platzieren, einige Karten mit mehreren Punkten bedeckt, die klare Team-Prioritäten zeigen

Bucket-System

Das Bucket-System kombiniert Elemente von Affinity Mapping und Planning Poker. Es ist dafür konzipiert, große Backlogs schnell mit größeren Gruppen zu schätzen.

So funktioniert es

  1. Erstelle "Buckets" für Schätzgrößen (0, 1, 2, 3, 5, 8, 13, 20, 40, 100)
  2. Wähle ein Item und platziere es als Referenz in einem Bucket (das Team muss sich bei diesem einig sein)
  3. Verteile die restlichen Items gleichmäßig unter den Teammitgliedern
  4. Jede Person platziert ihre Items still in Buckets relativ zur Referenz
  5. Sobald alles platziert ist, überprüft das Team gemeinsam und bespricht Items, die fehl am Platz erscheinen
  6. Anpassen und finalisieren

Wann man es einsetzt

Das Bucket-System funktioniert gut für große Backlogs (50-200 Items) mit Teams von 5-15 Personen. Da die initiale Sortierung still und parallel erfolgt, ist es viel schneller als sequentielles Schätzen. Die Überprüfungsphase sorgt für Ehrlichkeit, ohne dass jedes einzelne Item diskutiert werden muss.

Drei-Punkt-Schätzung (PERT)

Die Drei-Punkt-Schätzung stammt aus dem Projektmanagement, nicht aus der agilen Welt. Aber sie ist nützlich, wenn dein Team Unsicherheit berücksichtigen muss, besonders bei unbekannter Arbeit.

So funktioniert es

Für jedes Item gibt das Team drei Schätzungen ab:
SchätzungBedeutung
Optimistisch (O)Alles läuft perfekt, keine Überraschungen
Wahrscheinlichst (M)Realistisches Szenario mit normalem Aufwand
Pessimistisch (P)Alles was schiefgehen kann, geht schief
Der gewichtete Durchschnitt ist: (O + 4M + P) / 6 Zum Beispiel, wenn ein Feature auf 2 Tage optimistisch, 5 Tage wahrscheinlichst und 14 Tage pessimistisch geschätzt wird: (2 + 20 + 14) / 6 = 6 Tage.

Wann man es einsetzt

Die Drei-Punkt-Schätzung lohnt den Mehraufwand, wenn die Unsicherheit hoch ist: unbekannte Technologie, Integrationen mit externen Systemen oder etwas, das das Team noch nie gebaut hat. Die pessimistische Schätzung zwingt die Leute, über Risiken nachzudenken, die Planning Poker oft übersieht. Für Routinearbeit ist es übertrieben. Wenn dein Team dutzende CRUD-Endpoints gebaut hat, brauchst du keine drei Schätzungen für den nächsten.

Die richtige Technik wählen

Es gibt keine einzelne beste Schätzmethode. Die richtige Wahl hängt vom Kontext ab.
SzenarioBeste Technik
Sprint-Planung mit 10-15 ItemsPlanning Poker
Roadmap-Planung mit grober GrößeneinschätzungT-Shirt-Sizing
Großes Backlog (30+ Items), wenig ZeitAffinity Mapping
Priorisieren, was zuerst geschätzt wirdDot Voting
Riesiges Backlog (50-200 Items), großes TeamBucket-System
Arbeit mit hoher UnsicherheitDrei-Punkt-Schätzung
Die meisten Teams kombinieren letztlich Techniken. Dot Voting zum Priorisieren, Affinity Mapping zum groben Dimensionieren des Backlogs, dann Planning Poker für die Items im kommenden Sprint. Geteilte Ansicht verschiedener Schätztechniken nebeneinander, mit Karten, Punkten und Größenbezeichnungen sichtbar bei verschiedenen Gruppen zusammenarbeitender PersonenGeteilte Ansicht verschiedener Schätztechniken nebeneinander, mit Karten, Punkten und Größenbezeichnungen sichtbar bei verschiedenen Gruppen zusammenarbeitender Personen

Ein paar Dinge, die für alle gelten

Egal welche Technik du verwendest:
  • Schätze relativ zueinander, nicht in absoluten Werten. "Das ist doppelt so komplex wie die Login-Seite" ist nützlicher als "das dauert 3 Tage."
  • Begrenze die Session zeitlich. Schätzungen haben abnehmende Erträge. Stell einen Timer und mach weiter, wenn ihr nah genug dran seid.
  • Schätze neu, wenn du etwas Neues lernst. Schätzungen sind Momentaufnahmen, keine Verpflichtungen. Aktualisiere sie, wenn die Anforderungen klarer werden.
  • Verfolge die Genauigkeit über die Zeit. Vergleiche nach ein paar Sprints Schätzungen mit tatsächlichen Werten. Die Muster zeigen dir, wo dein Team konsequent daneben liegt.
Wenn du Planning Poker mit deinem Team ausprobieren möchtest, unterstützt Kollabes Planning-Poker-Tool Fibonacci, T-Shirt-Größen und benutzerdefinierte Skalen, und der Einstieg ist kostenlos.

Ja, und viele Teams tun das. Ein gängiger Ansatz: Dot Voting zum Priorisieren, dann Planning Poker für die Top-Items. Oder Affinity Mapping für das gesamte Backlog, dann Planning Poker nur für Items, bei denen das Team uneinig war.

Planning Poker lässt sich am natürlichsten auf Remote-Settings übertragen, da Online-Tools das gleichzeitige Aufdecken übernehmen. T-Shirt-Sizing und Dot Voting funktionieren auch gut mit virtuellen Boards. Affinity Mapping ist remote schwieriger, weil es an Geschwindigkeit verliert, wenn man Karten nicht physisch verschieben kann.

Story Points (oder abstrakte Größen) werden generell bevorzugt, weil sie Komplexität statt Dauer messen. Zeitschätzungen werden davon beeinflusst, wer die Arbeit macht, und tendieren dazu, zu Verpflichtungen zu werden. Points bleiben relativ und flexibel.

Vergleiche deine Schätzungen mit den tatsächlichen Werten jedes Sprints. Suche nach Mustern: Unterschätzt ihr konsequent Integrationen? Überschätzt ihr Frontend-Arbeit? Die Daten zeigen euch, wo ihr kalibrieren müsst. Halte außerdem eure Referenz-Stories aktuell. Euer "Medium" heute könnte ein anderes sein als euer "Medium" vor sechs Monaten.
Zuletzt aktualisiert am 09/02/2026