{"title":"KI-Server","description":"","products":[{"product_id":"terra-ki-server-8x-rtx-6000-blackwell-768-gb-vram","title":"TERRA KI\/GPU-SERVER · 8x RTX 6000 Blackwell 768 GB VRAM","description":"\u003c!-- 8× RTX PRO 6000 Blackwell – Inferenz-Server · Mobile-optimiert --\u003e\n\u003cstyle\u003e\n  .rack {font-family: Inter, Arial, sans-serif; color:#111; line-height:1.6;}\n  .rack .wrap {max-width:1100px; margin:0 auto; padding:40px 0 16px;}\n  .rack h1 {margin:0 0 10px; font-size:32px; line-height:1.2; word-break:break-word; hyphens:auto;}\n  .rack h2 {margin:0 0 12px; font-size:24px; line-height:1.25;}\n  .rack h3 {margin:0 0 6px; font-size:18px;}\n  .rack p {margin:0; color:#444;}\n  .rack .lead {margin:0 0 18px; font-size:18px;}\n  .rack .cta-row {display:flex; gap:12px; flex-wrap:wrap;}\n  .rack .btn {background:#E30613; color:#fff; padding:12px 18px; border-radius:10px; text-decoration:none; font-weight:700; display:inline-block;}\n  .rack .btn.dark {background:#111; color:#fff;}\n  .rack .grid-3, .rack .grid-2 {display:grid; gap:16px;}\n  .rack .grid-3 {grid-template-columns:repeat(3,minmax(0,1fr));}\n  .rack .grid-2 {grid-template-columns:repeat(2,minmax(0,1fr));}\n  .rack .card {background:#fff; border:1px solid #EDEDED; border-radius:12px; padding:16px;}\n  .rack ul {margin:0; padding-left:18px;}\n  .rack .note {margin:10px 0 0; font-size:14px; color:#555;}\n  .rack .closing {background:#111; color:#fff; border-radius:14px; padding:20px; display:flex; align-items:center; gap:16px; flex-wrap:wrap;}\n  .rack .closing h2 {color:#fff; margin:0 0 6px; font-size:22px;}\n  .rack .closing p {color:#eee;}\n\n  \/* Mobile *\/\n  @media (max-width: 768px) {\n    .rack .wrap {padding:22px 16px 10px;}\n    .rack h1 {font-size:24px; line-height:1.28;}\n    .rack .lead {font-size:16px;}\n    .rack h2 {font-size:20px;}\n    .rack h3 {font-size:16px;}\n    .rack .grid-3 {grid-template-columns:1fr;}\n    .rack .grid-2 {grid-template-columns:1fr;}\n    .rack .card {padding:16px; border-radius:10px;}\n    .rack .cta-row {flex-direction:column;}\n    .rack .btn {width:100%; text-align:center; padding:14px 18px;}\n    .rack .note {font-size:13px;}\n    .rack .closing {padding:18px;}\n  }\n\n  \/* Tablet Feinschliff *\/\n  @media (min-width: 769px) and (max-width: 1100px) {\n    .rack .wrap {padding-left:20px; padding-right:20px;}\n  }\n\u003c\/style\u003e\n\u003cdiv class=\"rack\"\u003e\n\u003c!-- HERO --\u003e\n\u003csection class=\"wrap\"\u003e\n\u003ch1\u003eGPU-Server mit 8× NVIDIA RTX PRO 6000 Blackwell (96 GB)\u003c\/h1\u003e\n\u003cp class=\"lead\"\u003eRobuste Plattform für KI-Inference im Unternehmen: optimiert für große Sprachmodelle (bis ~1T), hohe Parallelität und stabile Laufzeit im 24\/7-Betrieb. Ausgelegt auf Datensouveränität, Nachvollziehbarkeit und Wartbarkeit.\u003c\/p\u003e\n\u003cdiv class=\"cta-row\"\u003e\n\u003ca class=\"btn\" href=\"\/pages\/kontakt\"\u003eBeratung anfragen\u003c\/a\u003e \u003ca class=\"btn dark\" href=\"\/pages\/ki-bedarfsanalyse\"\u003eKI-Bedarfsanalyse\u003c\/a\u003e\n\u003c\/div\u003e\n\u003c\/section\u003e\n\u003c!-- HIGHLIGHTS --\u003e\n\u003csection style=\"padding: 8px 0 8px;\" class=\"wrap\"\u003e\n\u003cdiv class=\"grid-3\"\u003e\n\u003cdiv class=\"card\"\u003e\n\u003ch3\u003eHoher Durchsatz\u003c\/h3\u003e\n\u003cp\u003e8 GPUs mit je 96 GB VRAM für parallele Inferenz, Continuous Batching und lange Kontexte.\u003c\/p\u003e\n\u003c\/div\u003e\n\u003cdiv class=\"card\"\u003e\n\u003ch3\u003eGroße Modelle\u003c\/h3\u003e\n\u003cp\u003eGeeignet für 70B–120B-Klasse (z. B. Heavy-Path) plus schnelles 8–14B-Modell als Fast-Path.\u003c\/p\u003e\n\u003c\/div\u003e\n\u003cdiv class=\"card\"\u003e\n\u003ch3\u003eOn-Prem \u0026amp; auditierbar\u003c\/h3\u003e\n\u003cp\u003eBetrieb im eigenen Rechenzentrum: Daten bleiben intern, Prozesse sind protokolliert.\u003c\/p\u003e\n\u003c\/div\u003e\n\u003c\/div\u003e\n\u003c\/section\u003e\n\u003c!-- EINSATZSZENARIEN --\u003e\n\u003csection style=\"padding: 24px 0;\" class=\"wrap\"\u003e\n\u003ch2\u003eTypische Einsatzszenarien\u003c\/h2\u003e\n\u003cdiv class=\"grid-2\"\u003e\n\u003cdiv class=\"card\"\u003e\n\u003ch3\u003eLLM-Serving im Unternehmen\u003c\/h3\u003e\n\u003cul\u003e\n\u003cli\u003eInterne Assistenzen, Wissenssuche (RAG), Dokumentenzusammenfassungen\u003c\/li\u003e\n\u003cli\u003eDecision Notes, Meeting-Briefs, To-do-Extraktion\u003c\/li\u003e\n\u003cli\u003eMehrsprachige Antworten \u0026amp; lange Kontexte\u003c\/li\u003e\n\u003c\/ul\u003e\n\u003c\/div\u003e\n\u003cdiv class=\"card\"\u003e\n\u003ch3\u003eMedien \u0026amp; Vision\u003c\/h3\u003e\n\u003cul\u003e\n\u003cli\u003eBild-\/Video-Inferenz (z. B. Diffusion, Vision-Modelle)\u003c\/li\u003e\n\u003cli\u003eAssistierte Inhaltsproduktion und Recherche\u003c\/li\u003e\n\u003cli\u003eBatch-Verarbeitung \u0026amp; Pipelines\u003c\/li\u003e\n\u003c\/ul\u003e\n\u003c\/div\u003e\n\u003c\/div\u003e\n\u003c\/section\u003e\n\u003c!-- ARCHITEKTUR \/ SOFTWARE-STACK --\u003e\n\u003csection style=\"padding: 8px 0;\" class=\"wrap\"\u003e\n\u003ch2\u003eBewährter Stack für den Betrieb\u003c\/h2\u003e\n\u003cdiv class=\"grid-3\"\u003e\n\u003cdiv class=\"card\"\u003e\n\u003ch3\u003eModel-Serving\u003c\/h3\u003e\n\u003cp\u003evLLM (Tensor-Parallel), Continuous Batching, Paged Attention. Fast-\/Heavy-Path Routing.\u003c\/p\u003e\n\u003c\/div\u003e\n\u003cdiv class=\"card\"\u003e\n\u003ch3\u003eDaten \u0026amp; RAG\u003c\/h3\u003e\n\u003cp\u003eVektor-Index für Wissenssuche, strukturierte Notizen, Quellenbezug \u0026amp; Zitate.\u003c\/p\u003e\n\u003c\/div\u003e\n\u003cdiv class=\"card\"\u003e\n\u003ch3\u003eMonitoring\u003c\/h3\u003e\n\u003cp\u003eDCGM-Exporter, Prometheus, Grafana. Logs \u0026amp; Audit-Trails für Nachvollziehbarkeit.\u003c\/p\u003e\n\u003c\/div\u003e\n\u003c\/div\u003e\n\u003c\/section\u003e\n\u003c!-- TECHNISCHE SPEZIFIKATIONEN --\u003e\n\u003csection style=\"padding: 24px 0;\" class=\"wrap\"\u003e\n\u003ch2\u003eTechnische Spezifikationen (Beispielkonfiguration)\u003c\/h2\u003e\n\u003cdiv class=\"grid-2\"\u003e\n\u003cdiv class=\"card\"\u003e\n\u003cul\u003e\n\u003cli\u003e\n\u003cstrong\u003eGPU:\u003c\/strong\u003e 8× NVIDIA RTX PRO 6000 Blackwell, 96 GB VRAM je Karte\u003c\/li\u003e\n\u003cli\u003e\n\u003cstrong\u003eChassis:\u003c\/strong\u003e 4U GPU-Server mit 8× PCIe x16 (Dual-Slot-Support)\u003c\/li\u003e\n\u003cli\u003e\n\u003cstrong\u003eCPU:\u003c\/strong\u003e Dual AMD EPYC (9004-Serie), viele PCIe-Lanes\u003c\/li\u003e\n\u003cli\u003e\n\u003cstrong\u003eRAM:\u003c\/strong\u003e ab 768 GB DDR5 ECC, erweiterbar\u003c\/li\u003e\n\u003cli\u003e\n\u003cstrong\u003eStorage (OS\/Logs):\u003c\/strong\u003e 2× NVMe (RAID1)\u003c\/li\u003e\n\u003c\/ul\u003e\n\u003c\/div\u003e\n\u003cdiv class=\"card\"\u003e\n\u003cul\u003e\n\u003cli\u003e\n\u003cstrong\u003eStorage (Daten):\u003c\/strong\u003e NVMe-Bays für RAG-Korpus\/Embeddings\u003c\/li\u003e\n\u003cli\u003e\n\u003cstrong\u003eNetzwerk:\u003c\/strong\u003e 1× 100 GbE oder 2× 25 GbE\u003c\/li\u003e\n\u003cli\u003e\n\u003cstrong\u003eNetzteile:\u003c\/strong\u003e bis 4× 3000 W (N+1), Titanium\u003c\/li\u003e\n\u003cli\u003e\n\u003cstrong\u003eBetriebssystem:\u003c\/strong\u003e Ubuntu Server LTS\u003c\/li\u003e\n\u003cli\u003e\n\u003cstrong\u003eSoftware:\u003c\/strong\u003e Docker, NVIDIA Toolkit, vLLM, Monitoring-Stack\u003c\/li\u003e\n\u003c\/ul\u003e\n\u003c\/div\u003e\n\u003c\/div\u003e\n\u003cp class=\"note\"\u003eHinweis: Die genaue Bestückung (CPUs, RAM-Größe, NVMe-Anzahl) wird auf Workload und Budget abgestimmt.\u003c\/p\u003e\n\u003c\/section\u003e\n\u003c!-- LEISTUNG \u0026 KAPAZITÄT (PRAXIS) --\u003e\n\u003csection style=\"padding: 8px 0;\" class=\"wrap\"\u003e\n\u003ch2\u003eLeistung \u0026amp; Kapazität in der Praxis\u003c\/h2\u003e\n\u003cdiv class=\"card\"\u003e\n\u003cul\u003e\n\u003cli\u003e\n\u003cstrong\u003eParallelität:\u003c\/strong\u003e Ausgelegt für bis zu~20 gleichzeitige Nutzer mit Routing (Fast-\/Heavy-Path).\u003c\/li\u003e\n\u003cli\u003e\n\u003cstrong\u003eModelle:\u003c\/strong\u003e 8–14B für Routine (schnell), 70B–1T für anspruchsvolle Prompts.\u003c\/li\u003e\n\u003cli\u003e\n\u003cstrong\u003eKontextlängen:\u003c\/strong\u003e praxisnah 8k–32k; längere Kontexte sind möglich, reduzieren aber Durchsatz.\u003c\/li\u003e\n\u003cli\u003e\n\u003cstrong\u003eBetrieb:\u003c\/strong\u003e 24\/7-fähig mit Persistence-Mode, Health-Checks und Alerting.\u003c\/li\u003e\n\u003c\/ul\u003e\n\u003c\/div\u003e\n\u003c\/section\u003e\n\u003c!-- INFRASTRUKTUR-ANFORDERUNGEN --\u003e\n\u003csection style=\"padding: 24px 0;\" class=\"wrap\"\u003e\n\u003ch2\u003eInfrastruktur-Voraussetzungen\u003c\/h2\u003e\n\u003cdiv class=\"grid-3\"\u003e\n\u003cdiv class=\"card\"\u003e\n\u003ch3\u003eStrom \u0026amp; Kühlung\u003c\/h3\u003e\n\u003cp\u003eGesamtaufnahme im kW-Bereich; Kalt-\/Warmgang-Trennung und ausreichende Luftführung erforderlich.\u003c\/p\u003e\n\u003c\/div\u003e\n\u003cdiv class=\"card\"\u003e\n\u003ch3\u003eRack \u0026amp; Verkabelung\u003c\/h3\u003e\n\u003cp\u003e4U-Einbau, stabile Rails, passende Stromanschlüsse (dreiphasig empfohlen), QSFP\/SFP je nach Switch.\u003c\/p\u003e\n\u003c\/div\u003e\n\u003cdiv class=\"card\"\u003e\n\u003ch3\u003eBetrieb \u0026amp; Sicherheit\u003c\/h3\u003e\n\u003cp\u003eiKVM\/IPMI, Rollen\/Rechte, Audit-Logs; Updates \u0026amp; Monitoring nach festen Wartungsfenstern.\u003c\/p\u003e\n\u003c\/div\u003e\n\u003c\/div\u003e\n\u003c\/section\u003e\n\u003c!-- SERVICE \/ LIEFERUMFANG --\u003e\n\u003csection style=\"padding: 8px 0 16px;\" class=\"wrap\"\u003e\n\u003ch2\u003eLieferumfang \u0026amp; Services\u003c\/h2\u003e\n\u003cdiv class=\"grid-2\"\u003e\n\u003cdiv class=\"card\"\u003e\n\u003ch3\u003eEnthalten\u003c\/h3\u003e\n\u003cul\u003e\n\u003cli\u003eVorkonfiguriertes OS inkl. NVIDIA-Treiber \u0026amp; Container-Runtime\u003c\/li\u003e\n\u003cli\u003eReferenz-Setup für vLLM (Fast\/Heavy-Path)\u003c\/li\u003e\n\u003cli\u003eMonitoring-Vorlage (Prometheus\/Grafana)\u003c\/li\u003e\n\u003cli\u003eInbetriebnahme-Checkliste \u0026amp; Dokumentation\u003c\/li\u003e\n\u003c\/ul\u003e\n\u003c\/div\u003e\n\u003cdiv class=\"card\"\u003e\n\u003ch3\u003eOptional\u003c\/h3\u003e\n\u003cul\u003e\n\u003cli\u003eRAG-Einrichtung (Index, Pipelines, Deduplikation)\u003c\/li\u003e\n\u003cli\u003eOn-Prem-Assistenz „Clara“ (Pilot, Policies, Logs)\u003c\/li\u003e\n\u003cli\u003eSLAs \u0026amp; Vor-Ort-Service nach Bedarf\u003c\/li\u003e\n\u003c\/ul\u003e\n\u003c\/div\u003e\n\u003c\/div\u003e\n\u003c\/section\u003e\n\u003c!-- ABSCHLUSS \/ CTA --\u003e\n\u003csection style=\"padding: 16px 0 40px;\" class=\"wrap\"\u003e\n\u003cdiv class=\"closing\"\u003e\n\u003cdiv style=\"flex: 1 1 520px;\"\u003e\n\u003ch2\u003ePasst der Server zu Ihrem Workload?\u003c\/h2\u003e\n\u003cp\u003eWir kalkulieren gemeinsam Kapazität, Strom\/Kühlung und Modell-Mix – praxisnah und skalierbar.\u003c\/p\u003e\n\u003c\/div\u003e\n\u003cdiv class=\"cta-row\"\u003e\n\u003ca class=\"btn\" href=\"\/pages\/kontakt\"\u003eKontakt aufnehmen\u003c\/a\u003e \u003ca class=\"btn dark\" href=\"\/pages\/ki-bedarfsanalyse\"\u003eKI-Bedarfsanalyse\u003c\/a\u003e\n\u003c\/div\u003e\n\u003c\/div\u003e\n\u003c\/section\u003e\n\u003c\/div\u003e","brand":"Wortmann AG (TERRA)","offers":[{"title":"Default Title","offer_id":55191176577350,"sku":null,"price":119999.0,"currency_code":"EUR","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0959\/9828\/0006\/files\/item110023490000.jpg?v=1759417000"}],"url":"https:\/\/ki.makeit4u.de\/collections\/ki-server.oembed","provider":"MakeIT4U GmbH","version":"1.0","type":"link"}