در چند سال اخیر، همگرایی HPC و هوش مصنوعی مرز میان ابررایانش علمی و کاربردهای تجاری را از بین برده است. مدلهای عظیم زبانی و شبکههای عصبی عمیق دیگر فقط به آزمایشگاههای تحقیقاتی محدود نیستند؛ آنها قلب تپنده سرویسهای ابری، محصولات نرمافزاری و حتی فرایندهای عملیاتی کسبوکارها شدهاند. در چنین فضایی، دیتاسنترهای سنتی جوابگوی این موج جدید نیستند و سازمانها ناچارند زیرساخت خود را از سطح تراشه تا سیستم خنکسازی دوباره طراحی کنند تا بتوانند از این تحول جا نمانند.
دیتاسنترهای نوین؛ از CPU محور تا عصر GPU

در معماریهای قدیمی، اغلب بارهای کاری دیتاسنتر بر دوش پردازندههای چند هستهای عمومی یا همان CPU بود. این پردازندهها برای اجرای کارهای متنوع، از پایگاه داده تا وبسرور، طراحی شدهاند و همچنان برای وظایف ترتیبی و مدیریتی ضروریاند. اما الگوریتمهای مدرن هوش مصنوعی، مخصوصاً شبکههای عصبی عمیق، ذاتاً موازی هستند و برای آموزش و استنتاج به هزاران هسته پردازشی همزمان نیاز دارند.
در این نقطه است که همگرایی HPC و هوش مصنوعی خود را نشان میدهد. مدلهای زبانی غولپیکر با میلیاردها و حتی تریلیونها پارامتر، در عمل به همان سطح قدرت پردازشی نیاز دارند که پیشتر فقط در سوپرکامپیوترهای علمی دیده میشد. دیتاسنترهایی که تا دیروز برای پردازش تراکنشها و سرویسهای وب بهینه شده بودند، امروز باید شبیه کلاسترهای HPC طراحی شوند؛ یعنی سرشار از GPU، شتابدهندههای تخصصی و شبکههای فوق سریع.
این تغییر فقط به نصب چند کارت گرافیک در رک خلاصه نمیشود. وقتی دهها و صدها GPU در یک گره یا رک قرار میگیرند، نحوه ارتباط آنها با هم مهمتر از تعدادشان میشود. اگر تأخیر شبکه بالا باشد یا پهنای باند کافی فراهم نشود، زمان آموزش مدلها بهطور تصاعدی افزایش مییابد و هزینه زیرساخت به شدت بالا میرود.
بازطراحی محاسبات؛ از CPU تا GPU و شتابدهندهها
نقطه عطف این تحول، جابهجایی مرکز ثقل توان محاسباتی از CPU به GPU و شتابدهندههای مبتنی بر ماتریس و تانسور است.

همگرایی HPC و هوش مصنوعی نقطه تلاقی دنیای سوپرکامپیوترها و موج انفجاری هوش مصنوعی در کسبوکارهاست. سازمانهایی که این واقعیت را بپذیرند و از سطح تراشه تا شبکه، استوریج، توان و خنکسازی را با همین نگاه یکپارچه طراحی کنند، میتوانند هزینهها را کنترل کرده و در عین حال سرعت نوآوری خود را چند برابر کنند. در مقابل، رویکردهای جزیرهای و مقطعی که فقط روی خرید چند GPU جدید تمرکز میکنند، دیر یا زود به سقف فنی و اقتصادی میرسند. تصمیم امروز شما درباره معماری دیتاسنتر، تا سالها تعیین میکند که تا چه حد میتوانید از قدرت واقعی هوش مصنوعی و این همگرایی بهره ببرید.
منبع (Source):


