Chaos Monkey i łańcuch dostaw Netflixa

Niedawno odbyłem rozmowę z Carlosem Crespo, dyrektorem operacyjnym firmy macierzystej Zara Inditex, w której wspomniał o narzędziu programowym stworzonym przez Netflix ponad dziesięć lat temu w celu zinstytucjonalizowania odporności systemu. Nazwa jest chwytliwa, a liderzy łańcucha dostaw, którzy próbują na nowo wymyślić swoje sieci dostaw na niespokojne czasy, nie mogą się jej oprzeć. A jednak GoogleGOOG
wyszukiwanie hasła „małpa chaosu w łańcuchu dostaw” dało dokładnie takie wyniki jeden cytat, od 2012 r.

Dlaczego nie stosujemy tego pomysłu do odporności łańcucha dostaw?

Co to jest Małpa Chaosu?

Jest narzędzie programowe, a szerzej, zasada inżynierii, która losowo wyłącza części złożonego systemu, zmuszając operatorów do przywracania na żywo. Coś w rodzaju niespodziewanego ćwiczenia przeciwpożarowego, ale codziennie, w przypadkowych miejscach i na różne sposoby. Chodzi o to, że szybkie rozwiązywanie problemów systemowych to proces uczenia się, który powinien skorzystać na stromej krzywej uczenia się.

Historia dotyczy tego, jak Netflix skalował swoją działalność w zakresie przesyłania strumieniowego w Amazon Web Services, przechodząc od wysyłania płyt DVD do progów klientów. Na pierwszy rzut oka jest to logiczne podejście do planowania nadmiarowości systemu, czego można oczekiwać od NASA, ale w praktyce wykorzystuje normę kulturową Netflix, pozwalającą indywidualnym współpracownikom rozwiązywać własne problemy. Jak opisano w „Inżynieria chaosu” Książka z 2020 roku autorstwa Casey Rosenthal i Nory Jones, którzy zapoczątkowali tę praktykę w Netflix, sprowadza się do pięciu zasad:

  • Zbuduj hipotezę dotyczącą zachowania w stanie ustalonym
  • Zmieniaj wydarzenia w świecie rzeczywistym
  • Przeprowadzaj eksperymenty w produkcji
  • Zautomatyzuj eksperymenty, aby działały nieprzerwanie
  • Zminimalizuj promień wybuchu

Połączenie kultury i procesu w firmie Netflix jest ważne, ponieważ sprzyjało i wykorzystywało podejście do rozwiązywania problemów oparte na otwartym kodzie źródłowym, a systematyczne obracanie kołem losowych wyłączeń przyspiesza naukę w rozszerzonym zespole.

Odporność łańcucha dostaw i inżynieria chaosu

Cyfrowa transformacja w łańcuchu dostaw był gorący w tym roku, ponieważ pomaga łańcuchom dostaw wspierać nowe modele biznesowe i dążyć do zrównoważonych działań (patrz badanie BCG X), ale także dlatego, że obiecuje „odporność”. Niestety, praktyczne zastosowania transformacji cyfrowej w celu zapewnienia odporności łańcucha dostaw nadal zasadniczo sprowadzają się do platform zapewniających lepszą „widoczność”, wspieranych przez szereg tradycyjnych taktyk, takich jak buforowanie zapasów i podwójne zaopatrzenie. Podstawą tego podejścia jest kolejna warstwa prac analitycznych czas na regenerację autorstwa Davida Simchi-Leviego z MIT oraz fala symulacji z wykorzystaniem cyfrowych bliźniaków. To wszystko brzmi świetnie, ale brakuje jakiegokolwiek systematycznego sposobu eksperymentowania z prawdziwymi porażkami łańcucha dostaw, aby dowiedzieć się, jak najlepiej odzyskać w praktyce.

Stosowanie Małpy Chaosu w Łańcuchach Dostaw

Lekarze składają przysięgę Hipokratesa przed rozcięciem, w tym słynną „po pierwsze nie szkodzić”. Niezły pomysł dla każdego, kto stosuje zasady Chaos Monkey do łańcuchów dostaw, co pociąga za sobą przypadkowe wyłączenie gdzieś prawdziwej maszyny. To nie jest trywialne i, o ile mi wiadomo, jeszcze nigdzie się nie dzieje.

  • Pierwsza przytoczona powyżej zasada mówi o skupieniu się na wynikach systemu, a nie na wewnętrznych atrybutach. Sprawdź, czy system działa, zamiast próbować zrozumieć, dlaczego działa.
  • Druga zasada mówi o rozbijaniu różnych rzeczy w realistyczny sposób. Nie musisz symulować globalnej wojny termojądrowej, wystarczy wyłączyć przełącznik lub stracić zamówienie i dowiedzieć się, jakie rozwiązanie działa najlepiej.
  • Trzecia zasada mówi, że najlepszym miejscem do nauki jest produkcja. Uczenie się przez działanie jest lepsze niż uczenie się przez symulację – cyfrowe bliźniaki są świetne, ale mogą nie wystarczyć do zbudowania kultury odporności.
  • Czwarta zasada instytucjonalizuje zasady małpy chaosu, ponieważ pozwala skalować proces eksperymentowania, co prowadzi do bardziej stromej krzywej uczenia się. Wykorzystaj analitykę danych do gaszenia pożarów.
  • Na koniec zminimalizuj promień wybuchu. Oznacza to „nie szkodzić” i przekłada się na pewnego rodzaju buforowanie (zapasy, czas realizacji, przyspieszona wysyłka), aby chronić klientów przed odczuciem Twojego eksperymentu. Naucz się zarządzać kontrolowanymi eksplozjami.

Można argumentować, że ostatnie trzy lata Covid, wojna, Niepokoje w pracy, a zawirowania gospodarcze były dla wszystkich jedną wielką próbą małpy chaosu. Lekcja Netflixa polegała na tym, że tego rodzaju kryzysy nie są czymś, co należy zaplanować, ale czymś, co należy opanować jako stały fakt życia.

Idealna burza może nigdy się nie kończyć, więc może powinniśmy nauczyć się z nią żyć.

Źródło: https://www.forbes.com/sites/kevinomarah/2022/12/22/netflix-chaos-monkey-and-supply-chain/