Mobitekno – NVIDIA telah mengumumkan layanan mikro AI generatif terbaru yang memungkinkan perusahaan mengintegrasikan model bahasa khusus besar ke dalam data perusahaan mereka untuk memberikan respons yang sangat akurat pada aplikasi AI mereka. Dengan diperkenalkannya NVIDIA NeMo Retriever, penawaran terbaru dalam rangkaian kerangka kerja dan alat NVIDIA NeMo, organisasi dapat meningkatkan aplikasi AI generatif mereka melalui retrieval-augmented generation (RAG) tingkat perusahaan.
Sebagai layanan mikro pengambilan semantik tingkat perusahaan, NeMo Retriever membantu aplikasi AI generatif memberikan respons yang lebih akurat melalui algoritme yang dioptimalkan oleh NVIDIA. Pengembang yang menggunakan layanan mikro ini dapat menghubungkan aplikasi AI mereka ke data bisnis di cloud dan pusat data, menambahkan kemampuan RAG yang dioptimalkan NVIDIA ke dalam pengembangan AI. NeMo Retriever juga merupakan bagian dari platform perangkat lunak NVIDIA AI Enterprise, yang dapat diakses melalui AWS Marketplace.
Beberapa perusahaan pionir seperti Cadence, Dropbox, SAP, dan ServiceNow telah bekerja sama dengan NVIDIA untuk mengintegrasikan kemampuan RAG siap produksi ke dalam aplikasi dan layanan AI generatif khusus mereka. Jensen Huang, pendiri dan CEO NVIDIA, menyatakan bahwa aplikasi AI generatif dengan kemampuan RAG akan menjadi tren mendatang dan dapat membawa transformasi produktivitas melalui kecerdasan AI generatif yang akurat dan berharga.
“Dengan NVIDIA NeMo Retriever, pengembang dapat membuat chatbot, kopilot, dan alat ringkasan AI generatif khusus yang dapat mengakses data bisnis mereka untuk mentransformasikan produktivitas dengan kecerdasan AI generatif yang akurat dan berharga.”
Cadence, sebagai pemimpin desain sistem elektronik, telah menggunakan NeMo Retriever untuk meningkatkan akurasi aplikasi AI generatif mereka. Mereka bersama NVIDIA mengembangkan fitur RAG untuk aplikasi AI generatif dalam desain industri elektronik, memungkinkan mereka mengidentifikasi potensi kelemahan di awal proses desain dan memasarkan produk berkualitas tinggi dengan lebih efisien.
“AI Generatif memperkenalkan pendekatan inovatif untuk memenuhi kebutuhan pelanggan, seperti alat untuk mengungkap potensi kelemahan di awal proses desain,” kata Anirudh Devgan, presiden dan CEO Cadence. “Peneliti kami bekerja sama dengan NVIDIA untuk menggunakan NeMo Retriever guna lebih meningkatkan akurasi dan relevansi aplikasi AI generatif guna mengungkap masalah dan membantu pelanggan memasarkan produk berkualitas tinggi dengan lebih cepat.”
NeMo Retriever Didukung AI Generatif
Berbeda dengan toolkit RAG sumber terbuka, NeMo Retriever mendukung AI generatif siap produksi dengan model yang layak secara komersial, stabilitas API, patch keamanan, dan dukungan perusahaan. Algoritma yang dioptimalkan NVIDIA memberikan hasil akurasi tertinggi pada model penyematan Retriever, menangkap hubungan antar kata dan memungkinkan pemrosesan data tekstual oleh LLM.
Dengan menggunakan NeMo Retriever, perusahaan dapat menghubungkan LLM mereka ke berbagai sumber data dan basis pengetahuan, sehingga pengguna dapat dengan mudah berinteraksi dengan data dan menerima jawaban yang akurat dan terkini menggunakan perintah percakapan yang sederhana. Bisnis yang menggunakan aplikasi yang didukung Retriever dapat memungkinkan pengguna mendapatkan akses aman ke informasi yang mencakup berbagai modalitas data, seperti teks, PDF, gambar, dan video.
Perusahaan dapat menggunakan NeMo Retriever untuk mencapai hasil yang lebih akurat dengan lebih sedikit pelatihan, mempercepat waktu pemasaran, dan mendukung efisiensi energi dalam pengembangan aplikasi AI generatif.
Perusahaan dapat memanfaatkan NeMo Retriever untuk mencapai hasil yang lebih akurat dengan waktu pelatihan yang lebih singkat, mempercepat waktu pemasaran, dan mendukung efisiensi energi dalam pengembangan aplikasi AI generatif. Penerapan NeMo Retriever dapat dilakukan dengan mudah pada komputasi yang dipercepat NVIDIA di hampir semua pusat data atau cloud, menggunakan NVIDIA AI Enterprise bersama dengan berbagai perangkat lunak pendukung seperti NVIDIA Triton Inference Server™, NVIDIA TensorRT™, dan NVIDIA TensorRT-LLM.
Pengembang dapat mendaftar untuk akses awal ke NVIDIA NeMo Retriever dan memanfaatkan layanan mikro AI generatif ini dalam pengembangan aplikasi AI mereka. Dengan demikian, NVIDIA terus mendukung inovasi dan kemajuan dalam industri kecerdasan buatan untuk membawa manfaat yang lebih besar bagi perusahaan dan pengembang di seluruh dunia.