Heiko Maaß Software-Entwicklung und Elektronische Musik

(Micro)services – Service-Schnitt

Eine wichtige Idee von einem Microservice ist, dass er von genau einem Team entwickelt und gepflegt werden kann. Durch Aufteilung der Software in eigenständig deploybare Services erhofft man sich unter anderem eine reduzierte Projektlaufzeit, da mehrere Teams gleichzeitig und unabhängig entwickeln können. Im Idealfall sind alle Abhängigkeiten zu anderen Services über direkte API-Calls oder Message-Queues modelliert, und die Teams können Stories unabhängig von anderen Teams umsetzen. Die Services können bei Last unabhängig von voneinander skalieren. Und auch der kleinere Funktionsumfang eines Microservices gegenüber einem großen Monolithen erleichtert das Testen und die Einarbeitung neuer Entwickler. Klingt nach einem idealen Zustand für die Software-Entwicklung.

In der Realität entsteht dieser Idealzustand leider nicht sofort und manchmal auch gar nicht. Beispielsweise kann es passieren, dass der Service-Schnitt schon vorab geplant wird und auch entsprechend Teams aufgebaut werden, die voller Tatenkraft loslegen. Die pure Existenz der Teams wird dafür sorgen, dass der vorgegebene Service-Schnitt lange eingehalten wird, auch wenn sich während der Entwicklung langsam ein sinnvollerer Service-Schnitt herauskristallisiert. Das Gesetz von Conway ist schwer zu umgehen. Redundanzen sind in der Microservice-Welt gewollt, aber ein schlechter Service-Schnitt kann die Menge an redundant geschriebenen Code deutlich erhöhen, und damit die Wartungskosten erhöhen. Um diesem Effekt initial entgegenzuwirken, empfehle ich erst mit einem kleinen Team monolithisch zu starten und organisch Teams aufzubauen, wenn sich sinnvolle Service-Schnitte ergeben. Nach meiner Erfahrung hat sich während der frühen, kritischen Projektphase eine Flexibilität in der Teamzusammenstellung als Erfolgsfaktor erwiesen, benötigt aber die Bereitschaft von Entwicklern, das Team zu wechseln.

Aber kommen wir zurück zum Service-Schnitt: Wie findet man ihn? Ein wichtiger Schritt ist eine genaue Betrachtung der Abhängigkeiten:

  • Kann eine logische Komponente eindeutig zu einem Service zugeordnet werden, oder ist sie auf mehrere Services verteilt?
  • Ist ein Service unabhängig deploybar, oder muss ich bei den meisten Änderungen / Stories einen weiteren Service anfassen und deployen?
  • Hat ein Service indirekte Abhängigkeiten zu anderen Services, die ihn zwar nicht per API aufrufen, aber indirekt seine Daten konsumieren?
  • Wo werden Daten gespeichert? Kann ich sicherstellen, dass mein Service der alleinige Owner einer Datenbank ist? Oder muss ich sogar das Datenbankschema mit einem anderen Service teilen?
  • Gibt es Services, die bei jedem Call fachlich immer ebenfalls aufgerufen werden müssen?

Die Antworten auf die obigen Fragen im Projektkontext sollten helfen, den geplanten Service-Schnitt zu validieren. Auch das geforderte Performance- und Lastverhalten kann beim Service-Schnitt eine große Rolle spielen. Hier können sich folgende Fragen als hilfreich erweisen:

  • Wie viele Calls sind zur Peak-Time zu erwarten? Können diese auf Usecases heruntergebrochen werden?
  • Welche Anforderungen zur Ausfallsicherheit sind gefordert? Wie groß ist der Blast-Radius bei Ausfall eines Services?
  • Bei synchronen Aufrufen: Wie groß ist die Aufruf-Tiefe? Also wie viele Services müssen sequentiell hintereinander für eine Anfrage aufgerufen werden? Können Calls parallelisiert werden? Gibt es redundante Calls, die ggf. durch eine Verschiebung der Aufrufhierarchie vermieden werden können?
  • Bei asynchronen Aufrufen: Was passiert, wenn Messages Queues volllaufen oder die Bearbeitung zu viele Fehler produziert?
  • Können Services rein über die CPU-Last skalieren, oder muss auf eine andere Metrik zugegriffen werden?
  • Wie viele Instanzen von Services (Pods) sind notwendig, um die Last- und Performance-Anforderungen zu erfüllen? Wie viel kostet das?
  • Bonus-Frage: Entstehen durch die Vielzahl an Calls ggf. Mehrkosten für Netzwerk-Traffic (z.B. bei AWS-Account-übergreifenden Calls?)

Der Service-Schnitt hat auch Auswirkung auf die Wartungskosten: Jeder Service muss ständig aktualisiert werden, sei es regelmäßige Dependency-Updates oder kritische Security-Fixes, die möglich schnell breitflächig ausgerollt werden müssen (Hallo Log4j2!). Technische Änderungen in der Infrastruktur wie beispielsweise Kubernetes-Updates oder die Einführung bestimmter neuer Kubernetes-Operatoren erfordern ebenfalls regelmäßige Anpassungs- und Deploymentaufwände. Auch Umwälzungen im CI/CD-Umfeld (z.B. Nutzung von Gitlab anstelle von Jenkins, oder Flux anstelle von Helmfile) erfordern Anpassungen an jedem Service-Repository. Man braucht in jedem Team also Personen mit entsprechenden betrieblichen Fähigkeiten. Wenn diese wegfallen, werden die Kosten für solche Anforderungen vom verbleibenden Team höher eingeschätzt, weil die Unsicherheit eingepreist wird. Gibt es dann auch noch wenig Standardisierung im Infrastruktur-Code, muss jedes Team ihre eigene Lösung weiterpflegen, was langfristig auch teuer wird.

Kurzum: Das Schneiden der Software in separate (Micro)services ist eine komplexe Aufgabe mit vielen Fragestellungen und Konsequenzen, die sich gravierend auf den ganzen Lebenszyklus auswirken. In meiner Erfahrung ist nicht sinnvoll, vorab zu kleinteilig zu schneiden und möglichst früh zu parallelisieren. Ein zu schnelles Hochskalieren von Teams sorgt meistens dafür, dass der Service-Schnitt sich an der Organisation der Teams orientiert, und fachliche Abhängigkeiten untereinander erstmal in Kauf genommen werden, was einem wesentlichen Merkmal von Microservices widerspricht. Zwar können während der Entwicklung Services zusammengelegt werden, jedoch passiert das nicht zwangsläufig automatisch, sondern erst, wenn der Leidensdruck zu groß wird und noch Budget freigeschaufelt werden kann. Sinnvoll ist es, solche Zusammenlegungen schon vorab vorzubereiten und durchzuspielen. Umgekehrt besteht aber auch die Gefahr, dass neue Fachlichkeit in vorhandene Services eingebaut wird, die eigentlich in einen separaten Service verortet werden sollte. Das passiert nicht nur aus Kostengründen, sondern weil die Fachlichkeit auf den ersten Blick „sehr ähnlich“ ist und man sich Synergieeffekte erhofft. Erst bei einer detaillierten Betrachtung findet man so viele Unterschiede im Detail, die dazu führen, dass Dinge nebeneinander in einen Service implementiert werden, wenn man die Herauslösung unterlässt.