نیازهای فزاینده به برقراری ارتباط بین خوشههای گسترده پردازندههای GPU در دنیای هوش مصنوعی، منجر به حرکت به سمت استفاده از نور برای ارتباطات شبکه شده است. انویدیا با ارائه فناوریهای جدیدی مبتنی بر فوتونیک سیلیکونی قصد دارد انتقال دادهها را با سرعت بیشتر و مصرف انرژی کمتر انجام دهد.

سال گذشته، انویدیا برنامهریزی کرد که پلتفرمهای نسل جدید هوش مصنوعی خود در مقیاس رک را با استفاده از اتصالات فوتونیکی سیلیکونی و با اپتیکهای کو-پکیج برای نرخهای انتقال بالاتر و مصرف انرژی کمتر توسعه دهد. در کنفرانس Hot Chips امسال، جزئیات بیشتری درباره راهحلهای اتصالات فوتونیکی Quantum-X و Spectrum-X و زمان عرضه آنها در سال ۲۰۲۶ منتشر شد.
نقشه راه انویدیا به احتمال زیاد از نقشه راه COUPE شرکت TSMC پیروی خواهد کرد که در سه مرحله عرضه میشود. نسل اول، موتور نوری برای کانکتورهای OSFP ارائه میکند که انتقال داده ۱.۶ ترابیت در ثانیه را همزمان با کاهش مصرف انرژی ارائه میدهد. نسل دوم به سراغ بستهبندی CoWoS با اپتیکهای کو-پکیج میرود که ۶.۴ ترابیت در ثانیه را در سطح مادربورد فراهم میسازد. نسل سوم رسیدن به ۱۲.۸ ترابیت در ثانیه در بستهبندی پردازندهها و کاهش بیشتر در مصرف انرژی و تأخیر را هدف قرار داده است.
چرا باید کو-پکیج اپتیک را انتخاب کنید؟

در خوشههای بزرگ هوش مصنوعی، هزاران پردازنده GPU باید مانند یک سیستم واحد عمل کنند و این امر چالشهایی برای نحوه اتصال این پردازندهها ایجاد میکند. به جای اینکه هر رک به یک سوئیچ سطح اول (Top-of-Rack) متصل شده و کوتاه این اتصالات با کابلهای مسی انجام شود، سوئیچها به انتهای ردیف منتقل میشوند تا بافتی همگن و با تأخیر کم بین چندین رک ایجاد شود؛ این انتقال باعث افزایش فاصله بین سرورها و سوئیچها میشود، بنابراین در سرعتهایی مانند ۸۰۰ گیگابیت در ثانیه استفاده از کابل مسی غیرعملی بنظر میرسد و نیاز به ارتباطات نوری برای تقریباً هر ارتباط سرور به سوئیچ و سوئیچ به سوئیچ ضروری میشود.
استفاده از ماژولهای اپتیکال قابل اتصال در این محیط محدودیتهای روشنی دارد: سیگنالهای داده در چنین طراحیهایی از ASIC خارج میشوند، از مدار و کانکتورهای برد عبور کرده و سپس به نور تبدیل میشوند. این روش موجب اتلاف شدید الکتریکی میشود که انویدیا تا ۲۲ دسیبل بر روی کانالهای ۲۰۰ گیگابیت در ثانیه آن را محاسبه کرده و نیازمند جبران آن به وسیله پردازشهای پیچیده و افزایش مصرف انرژی است که میتواند به ۳۰ وات در هر پورت برسد (که در نتیجه آن نیاز به خنکسازی بیشتر و ایجاد نقطهای برای خرابی میشود)، و با افزایش مقیاس پیادهسازیهای هوش مصنوعی تقریباً غیرقابل تحمل میشود.
CPO این معایب ماژولهای اپتیکال قابل اتصال سنتی را با قرار دادن موتور تبدیل نوری در کنار ASIC سوئیچ دور میزند، بنابراین به جای عبور از مسیرهای الکتریکی طولانی، سیگنال تقریباً بلافاصله به فیبر متصل میشود. در نتیجه، اتلاف الکتریکی به ۴ دسیبل کاهش مییابد و مصرف انرژی در هر پورت به ۹ وات میرسد. این چیدمان اجزا زیادی که ممکن است خراب شوند را حذف کرده و پیادهسازی اتصالات نوری را بسیار ساده میکند.
انویدا ادعا میکند با کنار گذاشتن تریسورهای قابل اتصال سنتی و ادغام موتورهای اپتیکال بهطور مستقیم در سیلیکون سوئیچ، از طریق پلتفرم COUPE شرکت TSMC، به بهبودهای بسیار قابل توجهی در بهرهوری انرژی، اطمینان و مقیاسپذیری دست یافته است. بر اساس اظهارات انویدیا، بهبودهای CPO نسبت به ماژولهای قابل اتصال به نحو چشمگیری است: ۳.۵ برابر افزایش در بهرهوری انرژی، ۶۴ برابر بهبود در یکپارچگی سیگنال، ۱۰ برابر تقویت در مقاومت به دلیل دستگاههای فعال کمتر، و حدود ۳۰٪ سرعت بیشتر در پیادهسازی به دلیل سادگی سرویس و مونتاژ.
CPO برای اترنت و InfiniBand

انویدیا قصد دارد پلتفرمهای اتصال نوری مبتنی بر CPO خود را هم برای فناوریهای اترنت و هم InfiniBand معرفی کند. اولین این فناوریها، سوئیچهای Quantum-X InfiniBand خواهند بود که اوایل سال ۲۰۲۶ عرضه خواهند شد. هر سوئیچ، جریان ۱۱۵ ترابیت در ثانیه را پشتیبانی کرده و دارای ۱۴۴ پورت با سرعت ۸۰۰ گیگابیت در ثانیه خواهد بود. این سیستم همچنین شامل یک ASIC با قدرت پردازش درون شبکهای ۱۴.۴ ترافلوپ است و از پروتکل SHARP نسل چهارم انویدیا برای کاهش تأخیر در عملیات جمعی پشتیبانی میکند. این سوئیچها از سیستم خنکسازی مایع بهره خواهند برد.
به موازات آن، انویدیا CPO را به اترنت با پلتفرم Spectrum-X فوتونیک در نیمه دوم سال ۲۰۲۶ خواهد آورد. این سیستم بر روی ASIC Spectrum-6 تکیه دارد که دو دستگاه را به بهرهبرداری میبرد: SN6810 با پهنای باند ۱۰۲.۴ ترابیت در ثانیه با ۱۲۸ پورت با سرعت ۸۰۰ گیگابیت در ثانیه و SN6800 که به ۴۰۹.۶ ترابیت در ثانیه و ۵۱۲ پورت در همان سرعت میرسد. هر دو نیز از خنکسازی مایع استفاده خواهند کرد.
انویدیا میبیند که سوئیچهای مبتنی بر CPO آن قدرت جدیدی به خوشههای هوش مصنوعی های تولیداتی که روز به روز بزرگتر و پیچیدهتر میشوند خواهند داد. به خاطر استفاده از CPO، چنین خوشههایی هزاران مؤلفه جداگانه را حذف کرده، نصب سریعتری دارند و سرویسدهی آسانتری به دلیل کاهش مصرف انرژی در هر ارتباط انجام میدهند. به این ترتیب، خوشههایی که از InfiniBand Quantum-X و Spectrum-X فوتونیک استفاده میکنند، در بهبود معیارهایی مانند زمان روشن شدن، زمان تا اولین توکن و اطمینان بلندمدت بهبودهایی ارائه میدهند.
انویدیا توضیح میدهد که اپتیکهای کو-پکیج نه یک بهبود انتخابی، بلکه یک نیاز ساختاری برای دیتاسنترهای هوش مصنوعی آینده است که این امر به شرکت امکان میدهد اتصالات نوری خود را به عنوان یکی از مزایای کلیدی در برابر راهحلهای هوش مصنوعی در مقیاس رک از رقبا مانند AMD موضع دهد. این است، البته، دلیلی که AMD اقدام به خرید Enosemi کرده است.
راه پیش رو

نکتهای که باید در نظر داشت این است که ابتکار فوتونیکی سیلیکونی انویدیا با تکامل پلتفرم COUPE شرکت TSMC هماهنگ است که در سالهای دیگر نیز تکامل خواهد یافت و پلتفرمهای CPO انویدیا را نیز بهبود خواهد داد. نسل اول COUPE شرکت TSMC با تکیه بر پشتهساز ۶۵ نانومتری EIC و PIC با استفاده از تکنولوژی بستهبندی SoIC-X ایجاد شده است.
نقشه راه COUPE شرکت TSMC در سه مرحله منتشر میشود. نسل اول، موتور نوری برای کانکتورهای OSFP ارائه میدهد که انتقال داده ۱.۶ ترابیت در ثانیه میکند و مصرف انرژی را کاهش میدهد. نسل دوم به بستهبندی CoWoS با اپتیکهای کو-پکیج حرکت میکند که ۶.۴ ترابیت در ثانیه را در سطح مادربورد فراهم میآورد. نسل سوم رسیدن به ۱۲.۸ ترابیت در ثانیه در بستهبندی پردازندهها و کاهش بیشتر در مصرف انرژی و تأخیر را هدف قرار داده است.
نتیجهگیری
راهحلهای مبتنی بر فوتونیک سیلیکونی انویدیا تغییری قابل توجه در روشهای برقراری ارتباطات شبکهای ایجاد کردهاند. این فناوریها نه تنها امکان دستیابی به سرعتهای بالاتر و کاهش مصرف انرژی را فراهم میسازند، بلکه اجرای آنها نیز سادهتر و با ضمانت کارایی بلندمدت بیشتری همراه است. همانطور که استفاده از نور در ارتباطات شبکه گسترش مییابد، این انقلاب در فناوری ارتباطات میتواند به مزیای بزرگی برای مراکز داده هوش مصنوعی بدل شود.
پرسشهای متداول
انویدیا از اتصالات فوتونیکی سیلیکونی به دلیل کارایی بالاتر، مصرف انرژی کمتر و افزایش اطمینان در برقراری ارتباطات شبکهای استفاده میکند. این فناوری مشکلات متداول در ماژولهای اپتیکال قابل اتصال سنتی را رفع کرده و برای آینده دیتاسنترهای هوش مصنوعی ضروری است.
پلتفرمهای Quantum-X و Spectrum-X انویدیا برای ارائه سرعتهای بالاتر و کاهش مصرف انرژی در خوشههای هوش مصنوعی طراحی شدهاند. این پلتفرمها با استفاده از اتصالات فوتونیکی سیلیکونی و کو-پکیج، تأخیر را کاهش و قابلیت جابجایی دادهها را بهبود میبخشند.
اتصالات مبتنی بر CPO ارائهای با پایداری و کیفیت بهتر شامل یکپارچگی سیگنال 64 برابری، بهرهوری انرژی 3.5 برابری و مقاومت در برابر خرابیهای احتمالی تا 10 برابر بیشتر از ماژولهای موجود ایجاد میکنند.


