Ścieżka Starclouds do 88 000 satelitów obliczeniowych
W listopadzie firma Starcloud wysłała na orbitę niewielki satelita Starcloud-1 dzięki rakiecie SpaceX. Satelita o masie 60 kg był pierwszym, który wyposażono w system obliczeniowy z układem NVIDIA H100 GPU.
Według firmy, urządzenie miało być około sto razy potężniejsze od jakiegokolwiek GPU, które kiedykolwiek wcześniej dotarło na kosmiczną orbitę. W kontekście prezentacji w Waszyngtonie na początku wiosny Johnston, współzałożyciel i CEO Starcloud, podkreślił, że projekt umożliwił wytrenowanie modelu w kosmosie, przeprowadzenie zaawansowanego wnioskowania na danych SAR i uruchomienie wersji Gemini, a także zbudowanie ogromnego zestawu telemetrycznych danych o działaniu GPU w kosmosie.
W rozmowie z Jeffem Foustem, starszym redaktorem SpaceNews, Johnston przedstawił krótkoterminowe plany uruchomień Starcloud, wyzwania techniczne obliczeń orbitalnych i długoterminową strategię firmy. Wywiad został skrócony pod kątem długości i klarowności.
Jeff Foust pyta, nad czym pracuje Starcloud w przestrzeni orbitalnych centrów danych?
Philip Johnston wyjaśnia, że Starcloud tworzy orbitalne centra danych, poczynając od zapewnienia usług chmury i przetwarzania na krawędzi dla innych statków kosmicznych, a w dłuższej perspektywie ma konkurować z naziemnymi centrami danych pod kątem kosztów energii i ograniczeń związanych z AI.
W przeciągu ośmiu miesięcy uruchomimy drugi satelita Starcloud-2 o mocy 8 kilowatów. Następnie naszym celem będzie skalowanie do konstelacji 88 000 jednostek o masie trzech ton i poborze 200 kilowatów, co umożliwi uruchomienie około 20 gigawatów nowej mocy obliczeniowej.
Jakie stoi plan działania, by osiągnąć liczebność 88 000?
Osiągnięcie 88 000 zależy głównie od częstotliwości lotów Starshipa należącego do SpaceX. Najprawdopodobniej pierwsze wdrożenia Starlink V3 nastąpią pod koniec bieżącego roku lub na początku przyszłego. Następnie przewiduje się kolejne 18 do 24 miesięcy przed uruchomieniem pierwszych satelitów dla klientów komercyjnych, takich jak Starcloud ? czyli około 2029 lub 2030 roku.
W międzyczasie pojawią się różne warianty satelitów Starcloud-2. Już teraz Starcloud-2 zaczyna generować zwrot z inwestycji dzięki umowom na usługi chmury i przetwarzanie na krawędzi.
Główne zapotrzebowanie na ten system pojawia się w zastosowaniach specjalistycznych ? zwłaszcza w przetwarzaniu danych z obserwacji Ziemi i czynnościach realizowanych na krawędzi. Takie obciążenia są wysoce wartościowe i za nie można pobierać stawki rzędu 100-krotne, a nawet 1000-krotne w przeliczeniu na dolary za godzinę pracy GPU.
W dłuższym okresie dążymy do konkurowania z naziemnymi centrami danych pod kątem kosztów energii. Trenowanie modeli w kosmosie nie jest naszym priorytetem w najbliższym czasie, bo wymaga dużej infrastruktury, a przewidujemy, że stanowi mniej niż 1% obciążeń AI w pięć lat, więc rynek ten nie jest atrakcyjny. Zasadniczo dostarczymy wszystko, co zapewni energię i infrastrukturę po niższych kosztach niż cokolwiek na Ziemi.
Więc czy widzisz swoją firmę co najmniej w perspektywie konkurowania z naziemnymi centrami danych pod kątem kosztów obliczeń?
Tak, gdy koszty rakiety Starship spadną do okolic 500 dolarów za kilogram. Koszt podstawowy pozostanie wyższy niż SpaceX, ale niższy niż u wszystkich hyperscalers. Obciążenia, które planujemy uruchomić, obejmują operacje inferencyjne nie wymagające latencji poniżej 50 ms, takie jak generowanie kodu, obsługa agentów back-office i obsługa klienta.
To łączenie dwóch trendów ? spadek kosztów orbitalnych i rosnące koszty energetyczne na Ziemi.
Oba trendy zbliżają się do siebie. Nawet jeśli koszty naziemne nie wzrosną, w perspektywie pięciu lat pojawi się moment, w którym operacje w kosmosie będą tańsze od ich odpowiedników na Ziemi.
Jakie kluczowe wyzwania dostrzegasz w implementacji systemu, łańcuchu dostaw i regulacjach?
Główne działania firmy koncentrują się na wyzwaniach technicznych. Pracujemy nad dwoma dużymi elementami inżynierii: po pierwsze, masywnym, tanim i lekkim radiatorem rozkładanym do odprowadzania ciepła; prototyp już powstał i testujemy go. Ma masowy stosunek wydajności na wat znacznie korzystniejszy niż radiator ISS, a jego koszt na wat rozpraszania jest znacząco niższy niż w ISS. Uruchomienie planujemy za osiem miesięcy, co będzie dużym kamieniem milowym.
Drugim elementem jest zapewnienie, że układy scalone będą funkcjonować w środowisku o wyższym promieniowaniu. Na razie to w praktyce dużo testów naziemnych. Przeprowadziliśmy trzy serie badań w ośrodku cyklotronowym w Knoxville na protonach o wysokiej prędkości, jedną serię w Brookhaven National Lab dla jonów ciężkich, a wszystkie zebrane dane wykorzystujemy do dopracowania osłon i oprogramowania układów.
FCC jest bardzo wspierająca i pomocna przy składaniu wniosku. Łańcuch dostaw nie stanowi jeszcze problemu, bo skala nie jest jeszcze wystarczająca, ale pod koniec dekady, gdy rosnąć, będzie to coś, o czym trzeba pomyśleć.
Jak planujecie zorganizować masową produkcję satelitów? Najważniejsze partnerstwo to współpraca z NVIDIA. Współpracujemy nad modułem Space-1 Vera Rubin, układem zoptymalizowanym pod kątem masy, termiki i promieniowania, a w projekt angażuje się także zespół ruggedizacji.
Czy prowadzicie już rozmowy z potencjalnymi klientami? W tych wczesnych dniach współpracujemy z różnymi podmiotami Departamentu Obrony nad zapewnieniem usług chmury i przetwarzania na krawędzi, ale to wciąż mniejszy rynek. Podpisaliśmy dużą umowę z Crusoe ? firmą budującą centra danych dla OpenAI ? aby zapewnić im moc 10 gigawatów od wczesnych lat 2030. Jeśli potrafisz dostarczyć energię i infrastrukturę w konkurencyjnych cenach, hyperscalers będą zainteresowani.
Dziękujemy, że przeczytałaś/eś artykuł! Obserwuj nas w Wiadomościach Google.