Chinas LongCat-2.0 ist das größte KI-Modell ohne Nvidia-Chips

Was LongCat-2.0 auszeichnet
LongCat-2.0 ist ein großes Sprachmodell mit 1,6 Billionen Parametern und einem Kontextfenster von einer Million Token. Es handelt sich um eine sogenannte Mixture-of-Experts-Architektur mit rund 48 Milliarden aktiven Parametern. Meituan gibt an, das Modell sei als Open-Source verfügbar und speziell für sogenannte Agentic-Coding-Aufgaben entwickelt worden, also für KI-Systeme, die eigenständig Programmieraufgaben lösen.
Der entscheidende technische Unterschied zu früheren chinesischen Modellen liegt im Trainingsverfahren. DeepSeeks Modell V4-pro nutzte inländische Chips lediglich für die Inferenz, also die leichtere Aufgabe des Beantwortens von Anfragen. LongCat-2.0 hingegen wurde sowohl beim deutlich rechenintensiveren Pre-Training als auch bei der Inferenz vollständig auf chinesischer Hardware betrieben. Meituan bezeichnet es als das erste Trillion-Parameter-Modell, das diese Bedingung erfüllt.
Technische Infrastruktur: Inlandschips statt Nvidia
Für das Training setzte Meituan auf einen Cluster aus großmaßstäblichen ASIC-Superpods, also anwendungsspezifisch entwickelten Chips. Zur Koordination der Chips untereinander kam Huaweis Collective Communication Library, kurz HCCL, zum Einsatz. Diese Lösung übernimmt eine ähnliche Funktion wie Nvidias eigene NCCL-Bibliothek in GPU-Clustern. Forscher Hanchi Sun von der Lehigh University bezeichnete LongCat-2.0 als das erste Modell, das nahe an der Frontierleistung auf 50.000 chinesischen Inlandsbeschleunigern trainiert wurde.
Meituan räumt jedoch auch Schwächen ein. Das Software-Ökosystem der verwendeten Chips hinkt Nvidias ausgereifter GPU-Community noch hinterher. Zudem war der Arbeitsspeicher pro Gerät der zentrale Engpass beim Training. Die eingesetzten Inlandsbeschleuniger verfügen über weniger Speicher pro Einheit als Nvidias in China verbotener H800-Chip.
Leistung und globale Einordnung
Im Benchmarkvergleich zeigt LongCat-2.0 starke Ergebnisse. Es übertrifft Googles älteres Modell Gemini 3.1 Pro auf den Benchmarks Terminal-Bench 2.1 und SWE-Bench Pro. Gegenüber den führenden westlichen Systemen wie OpenAIs GPT-5.5 und Anthropics Opus 4.8 besteht bei anspruchsvollen Reasoning- und Agentic-Aufgaben jedoch weiterhin ein Rückstand.
Branchenbeobachter reagierten dennoch aufmerksam. Techanalyst TP Huang erklärte, der Launch zerstreue Zweifel an Huaweis Atlas-950-SuperPods. Analyst Yuchen Jin verwies auf frühere Aussagen von Nvidia-Chef Jensen Huang, wonach Exportkontrollen Chinas KI-Entwicklung nicht stoppen, sondern die Entstehung einheimischer Alternativen beschleunigen würden. Venture-Partner Alvin Foo fasste es so zusammen: Wenn China Frontier-Training auf einheimischem Silizium in diesem Maßstab skalieren könne, sei das Rennen um Rechenkapazitäten offener denn je. Meituans Erfolg zeigt, dass Frontier-Training auf chinesischer Hardware technisch möglich ist. Die Lücke zwischen chinesischen Open-Source-Modellen und den besten westlichen Systemen könnte sich schneller schließen als bislang erwartet.



