Gambaran besar: Tantangan besar dalam menganalisis perusahaan yang berkembang pesat seperti NVIDIA memahami semua bisnis yang berbeda yang dipartisipasi, banyak produk yang diumumkannya, dan strategi keseluruhan yang dikejar. Mengikuti pidato utama oleh CEO Jensen Huang di konferensi GTC tahunan perusahaan tahun ini, tugas itu sangat menakutkan. Seperti biasa, Huang menutupi sejumlah besar topik di atas presentasi yang panjang dan, terus terang, meninggalkan lebih dari beberapa orang yang menggaruk -garuk kepala.
Namun, selama sesi tanya jawab yang mencerahkan dengan analis industri beberapa hari kemudian, Huang berbagi beberapa wawasan yang tiba -tiba membuat semua berbagai produk dan pengumuman kemitraan yang ia liput, serta pemikiran di baliknya, Crystal Clear.
Intinya, ia mengatakan bahwa NVIDIA sekarang menjadi penyedia infrastruktur AI, membangun platform perangkat keras dan perangkat lunak yang dapat digunakan oleh penyedia komputasi awan besar, vendor teknologi, dan departemen TI perusahaan untuk mengembangkan aplikasi bertenaga AI.
Tak perlu dikatakan, itu sangat jauh dari perannya sebagai penyedia chip grafis untuk game PC, atau bahkan dari upayanya untuk membantu mendorong penciptaan algoritma pembelajaran mesin. Namun, ia menyatukan beberapa pengumuman yang tampaknya berbeda dari peristiwa baru -baru ini dan memberikan indikasi yang jelas tentang ke mana perusahaan sedang menuju.
https://www.youtube.com/watch?v=_wapvowl9z8
Nvidia bergerak melampaui asal-usulnya dan reputasinya sebagai rumah desain semikonduktor ke dalam peran penting dari infrastruktur enabler untuk dunia masa depan kemampuan bertenaga AI-atau, seperti yang dijelaskan Huang, “produsen intelijen.”
Dalam keynote GTC -nya, Huang membahas upaya Nvidia untuk memungkinkan generasi token yang efisien untuk model fondasi modern, menghubungkan token ini dengan kecerdasan yang akan dimanfaatkan organisasi untuk menghasilkan pendapatan di masa depan. Dia menggambarkan inisiatif ini sebagai membangun pabrik AI, relevan dengan berbagai industri.
Meskipun ambisius, tanda-tanda ekonomi yang didorong oleh informasi yang muncul-dan efisiensi yang dibawa AI ke manufaktur tradisional-menjadi semakin jelas. Dari bisnis yang dibangun sepenuhnya di sekitar layanan AI (seperti chatgpt) hingga manufaktur robot dan distribusi barang tradisional, kami tidak diragukan lagi pindah ke era ekonomi baru.
Dalam konteks ini, Huang secara luas menguraikan bagaimana penawaran terbaru Nvidia memfasilitasi penciptaan token yang lebih cepat dan lebih efisien. Dia awalnya membahas inferensi AI, umumnya dianggap lebih sederhana daripada proses pelatihan AI yang awalnya membuat Nvidia menjadi terkenal. Namun, Huang berpendapat bahwa inferensi, terutama ketika digunakan dengan model penalaran rantai baru seperti Deepseek R1 dan Openai's O1, akan membutuhkan sumber daya komputasi sekitar 100 kali lebih banyak daripada metode inferensi satu-shot saat ini. Akibatnya, ada sedikit kekhawatiran bahwa model bahasa yang lebih efisien akan mengurangi permintaan untuk menghitung infrastruktur. Memang, kami tetap pada tahap awal pengembangan infrastruktur pabrik AI.
Salah satu pengumuman Huang yang paling penting namun paling tidak dipahami adalah alat perangkat lunak baru yang disebut NVIDIA Dynamo, yang dirancang untuk meningkatkan proses inferensi untuk model canggih. Dynamo, versi yang ditingkatkan dari perangkat lunak NVIDIA's Triton Inference Server, secara dinamis mengalokasikan sumber daya GPU untuk berbagai tahap inferensi, seperti Prefill dan Decode, masing -masing dengan persyaratan komputasi yang berbeda. Ini juga membuat cache informasi dinamis, mengelola data secara efisien di berbagai jenis memori.
Beroperasi mirip dengan orkestrasi Docker dari kontainer dalam komputasi awan, Dynamo secara cerdas mengelola sumber daya dan data yang diperlukan untuk pembuatan token di lingkungan pabrik AI. Nvidia telah dijuluki Dynamo “OS pabrik AI.” Secara praktis, Dynamo memungkinkan organisasi untuk menangani hingga 30 kali lebih banyak permintaan inferensi dengan sumber daya perangkat keras yang sama.
Tentu saja, tidak akan GTC jika NVIDIA tidak juga memiliki pengumuman chip dan perangkat keras dan ada banyak kali ini. Huang mempresentasikan peta jalan untuk GPU di masa depan, termasuk pembaruan untuk seri Blackwell saat ini yang disebut Blackwell Ultra (seri GB300), menawarkan memori HBM onboard yang ditingkatkan untuk kinerja yang lebih baik.
Dia juga meluncurkan arsitektur Vera Rubin yang baru, menampilkan CPU berbasis ARM baru yang disebut Vera dan GPU generasi berikutnya bernama Rubin, masing-masing menggabungkan lebih banyak inti dan kemampuan canggih secara signifikan. Huang bahkan mengisyaratkan generasi di luar itu – dinamai setelah ahli matematika Richard Feynman – memproyeksikan peta jalan Nvidia ke tahun 2028 dan seterusnya.
Selama sesi tanya jawab berikutnya, Huang menjelaskan bahwa mengungkapkan produk di masa depan jauh sebelumnya sangat penting bagi mitra ekosistem, memungkinkan mereka untuk mempersiapkan secara memadai untuk perubahan teknologi yang akan datang.
https://www.youtube.com/watch?v=1QurzPWGWHQ
Huang juga menekankan beberapa kemitraan yang diumumkan di GTC tahun ini. Kehadiran yang signifikan dari vendor teknologi lain menunjukkan keinginan mereka untuk berpartisipasi dalam ekosistem yang berkembang ini. Di sisi komputasi, Huang menjelaskan bahwa memaksimalkan infrastruktur AI sepenuhnya membutuhkan kemajuan di semua area tumpukan komputasi tradisional, termasuk jaringan dan penyimpanan.
Untuk itu, NVIDIA meluncurkan teknologi fotonik silikon baru untuk jaringan optik antara rak server yang dipercepat GPU dan membahas kemitraan dengan Cisco. Kemitraan Cisco memungkinkan silikon Cisco di router dan sakelar yang dirancang untuk mengintegrasikan pabrik-pabrik AI yang dipercepat GPU ke dalam lingkungan perusahaan, bersama dengan lapisan manajemen perangkat lunak bersama.
Untuk penyimpanan, NVIDIA berkolaborasi dengan penyedia perangkat keras terkemuka dan perusahaan platform data, memastikan solusi mereka dapat memanfaatkan akselerasi GPU, sehingga memperluas pengaruh pasar NVIDIA.
Dan akhirnya, membangun strategi diversifikasi, Huang memperkenalkan lebih banyak pekerjaan yang dilakukan perusahaan untuk kendaraan otonom (terutama kesepakatan dengan GM) dan robotika, yang keduanya ia gambarkan sebagai bagian dari tahap besar berikutnya dalam pengembangan AI: AI fisik.
Nvidia tahu bahwa menjadi penyedia infrastruktur dan ekosistem berarti bahwa mereka dapat memperoleh manfaat secara langsung maupun secara tidak langsung ketika gelombang keseluruhan komputasi AI meningkat, bahkan ketika persaingan langsung mereka pasti akan meningkat
NVIDIA telah memberikan komponen kepada pembuat mobil selama bertahun -tahun sekarang dan, juga, telah memiliki platform robotika selama beberapa tahun juga. Apa yang berbeda sekarang, bagaimanapun, adalah bahwa mereka diikat kembali ke infrastruktur AI yang dapat digunakan untuk melatih model yang lebih baik yang akan digunakan ke perangkat tersebut, serta menyediakan data inferensial real-time yang diperlukan untuk mengoperasikannya di dunia nyata. Sementara ikatan ini kembali ke infrastruktur ini bisa dibilang merupakan kemajuan yang relatif sederhana, dalam konteks yang lebih besar dari strategi infrastruktur AI keseluruhan perusahaan, itu memang lebih masuk akal dan membantu mengikat bersama banyak inisiatif perusahaan menjadi keseluruhan yang kohesif.
Masuk akal dari semua elemen yang diluncurkan oleh Huang dan Nvidia di GTC tahun ini tidak sederhana, terutama karena sifat seperti Firehose dari semua pengumuman yang berbeda dan jangkauan yang jauh lebih luas dari ambisi perusahaan. Namun, begitu potongan-potongan itu bersatu, strategi Nvidia menjadi jelas: perusahaan mengambil peran yang jauh lebih besar daripada sebelumnya dan diposisikan dengan baik untuk mencapai tujuan ambisiusnya.
Pada akhirnya, Nvidia tahu bahwa menjadi penyedia infrastruktur dan ekosistem berarti bahwa mereka dapat memperoleh manfaat secara langsung maupun tidak langsung sebagai gelombang keseluruhan komputasi AI meningkat, bahkan ketika persaingan langsung mereka pasti akan meningkat. Ini adalah strategi yang cerdas dan yang dapat menyebabkan pertumbuhan yang lebih besar untuk masa depan.
Bob O'Donnell adalah pendiri dan kepala analis Technalysis Research, LLC A Technology Consulting Firping yang menyediakan konsultasi strategis dan layanan riset pasar untuk industri teknologi dan komunitas keuangan profesional. Anda dapat mengikutinya di Twitter @bobodtech