Dalam keynote Computex 2026 di Taipei, Selasa (26/5), CEO Intel Lip Bu Tan membeberkan dua purwarupa desain rak server yang dikembangkan bersama Foxconn dan mitra infrastruktur lainnya. Desain pertama dioptimalkan untuk beban kerja agen AI yang sensitif terhadap latensi, sementara desain kedua mengutamakan kepadatan komputasi maksimal. Keduanya mendukung hingga 128 unit prosesor — baik Granite Rapids Xeon 6 128-core maupun Clearwater Forest Xeon 6+ 288-core — menghasilkan total 16.384 P-core hingga 36.864 E-core dalam satu rak.
"Pelanggan kami meminta kami berpikir di level sistem untuk membantu mereka melayani beban kerja agenik berskala besar," ujar Tan di atas panggung. Pernyataan ini menegaskan pergeseran fokus Intel dari sekadar menjual chip menjadi perancang solusi infrastruktur terintegrasi.
Meski model AI besar (LLM) kebanyakan berjalan di GPU atau akselerator khusus, komponen pendukung agen AI — seperti OpenClaw yang menghubungkan model ke alat eksternal, terminal shell, interpreter kode, dan API — tetap membutuhkan CPU. Intel melihat celah ini sebagai peluang untuk mempertahankan relevansi bisnis prosesornya di tengah dominasi Nvidia di pasar akselerator AI.
Pengumuman ini muncul beberapa bulan setelah Nvidia meluncurkan platform rak server CPU serupa yang menampung 256 unit prosesor Vera 88-core. Arm juga tengah mengembangkan dua desain referensi untuk agen AI: sistem berpendingin udara 36 kW dengan 8.160 core dan rak berpendingin cair 200 kW dengan 45.696 core. Artinya, persaingan infrastruktur CPU untuk AI agen kian memanas.
Satu rak server dengan konsumsi daya 100 kilowatt — setara kebutuhan listrik sekitar 80-100 rumah tangga Indonesia — hanya untuk satu unit komputasi. Kapasitas memorinya mencapai 384 TB DDR5. Angka ini menunjukkan betapa borosnya energi infrastruktur AI generasi terbaru, sekaligus menjadi tantangan bagi pusat data di Indonesia yang masih bergulat dengan keterbatasan pasokan listrik dan pendinginan.
Tan memperkirakan sistem berbasis desain referensi ini akan tersedia secara luas dari mitra ODM dan OEM Intel dalam waktu dekat.
Intel mengungkapkan bahwa Vector Core Compute, penyedia cloud inferensi yang baru diluncurkan, akan menjadi salah satu pengguna pertama platform ini. Sementara Together.AI ditetapkan sebagai pelanggan komersial pertamanya.
Pendekatan arsitektur yang digunakan berasal dari cetak biru AI terdisagregasi yang sebelumnya dikembangkan Intel bersama SambaNova. Sistem ini memisahkan operasi prefill yang berat komputasi ke GPU Nvidia, sementara akselerator AI SambaNova menangani operasi decode yang membutuhkan bandwidth tinggi. Hasilnya, output token per pengguna meningkat 2-3 kali lipat.
Strategi ini mirip dengan apa yang dilakukan Nvidia bersama Groq dan LPU-nya, atau AWS yang menggabungkan Trainium dengan akselerator AI Cerebras berskala wafer. Intel dan SambaNova mencoba menawarkan alternatif yang lebih efisien untuk beban kerja inferensi yang membutuhkan respons cepat.