با انتشار مدلهای جدید هوش مصنوعی، رقابت بین غولهای فناوری وارد مرحله تازهای شده است. شرکت xAI اخیراً از Grok 4.1 رونمایی کرده و ادعا میکند این مدل نه تنها سریعتر و باهوشتر است، بلکه از نظر عاطفی پیچیدهتر و شوخطبعتر از تمام رقبای خود عمل میکند. در سمت دیگر میدان، OpenAI با معرفی مدل GPT-5.1 که در دل ChatGPT 5.1 جای گرفته، ادعای پاسخگویی پیچیده، بیان رسا و همدلی بینظیر را دارد. اما در دنیای واقعی و دور از هیاهوی تبلیغاتی، عملکرد این دو چگونه است؟ ما تصمیم گرفتیم در یک بررسی دقیق و البته غیررسمی، به **مقایسه Grok 4.1 با ChatGPT 5.1** بپردازیم تا ببینیم کدامیک در آزمونهای هوش هیجانی، قابلیت اطمینان و انسجام شخصیت، سربلند بیرون میآید.
۱. هوش هیجانی: درک عمیق احساسات یا نمایشهای اغراقآمیز؟

یکی از مهمترین معیارهایی که امروزه برای سنجش پیشرفت چتبوتها در نظر گرفته میشود، توانایی آنها در درک و پاسخگویی به احساسات پیچیده انسانی است. انیمیشنهایی مانند «Inside Out» به ما یادآوری میکنند که صحبت کردن درباره احساسات چقدر حیاتی است، اما آیا هوش مصنوعی میتواند همصحبت خوبی برای لحظات آسیبپذیر ما باشد؟ در **مقایسه Grok 4.1 با ChatGPT 5.1**، ما سناریویی را طراحی کردیم که در آن کاربر همزمان احساس خوشحالی و حسادت میکند: «دوستم ترفیع گرفته و من برای او خوشحالم، اما نمیتوانم وانمود کنم که دلم نمیسوزد.»
پاسخ Grok 4.1 ترکیبی عجیب از استعارههای سنگین و ادبیات کوچه و بازاری بود. این مدل پاسخ خود را با عباراتی مانند «پیچش آرام چاقو در قلب» شروع کرد و سعی کرد با استفاده از کلمات عامیانه و حتی الفاظ رکیک (که ویژگی خاص تنظیمات آن است)، فضایی صمیمی ایجاد کند. اگرچه گراک توانست تضاد احساسی را تشخیص دهد و توصیهای مبنی بر پذیرش این احساسات ارائه دهد، اما لحن آن بیشتر شبیه به نوجوانی بود که سعی دارد با کلمات بزرگ و خاص، خود را خفن جلوه دهد. استفاده از کلیشهها و استعارههای خونین، تا حد زیادی از حس همدلی واقعی میکاست.
در مقابل، ChatGPT 5.1 رویکردی بسیار پختهتر و متینتر داشت. این مدل بدون استفاده از تشبیهات خشونتآمیز، به سادگی تایید کرد که حس کردن همزمان خوشحالی و ناراحتی کاملاً طبیعی است. چتجیپیتی نوشت: «اینکه برای کسی خوشحال باشید، لزوماً آن نیش کوچکِ ‘چرا من نه؟’ را خنثی نمیکند و این شما را به یک آدم حسود تبدیل نمیکند، بلکه فقط نشان میدهد که شما انسان هستید.» این پاسخ نشاندهنده بلوغ مدل OpenAI است؛ مدلی که به جای تلاش برای جلب توجه با کلمات عجیب، سعی در شنیدن و درک کاربر دارد.
۲. قابلیت اطمینان و دقت: وقتی اعداد دروغ میگویند
در بخش دوم **مقایسه Grok 4.1 با ChatGPT 5.1**، به سراغ یکی از حیاتیترین ویژگیهای هر دستیار هوشمندی رفتیم: قابلیت اطمینان و دقت در اجرای دستورالعملها. ما از هر دو مدل خواستیم تا عواقب طولانیمدت کمخوابی را در کمتر از ۱۲۰ کلمه خلاصه کنند، بدون اینکه اغراق کنند یا دست به گمانهزنی بزنند. این تست ساده، نه تنها دانش پزشکی مدلها، بلکه توانایی آنها در رعایت محدودیتهای فرمی را نیز میسنجید.
مدل Grok 4.1 تلاش کرد با ارائه چند نکته کلیدی و جملاتی ساده، ایمن بازی کند. پاسخ ارائه شده از نظر محتوایی قابل قبول بود و اطلاعات غلطی در آن دیده نمیشد. اما نکته عجیب و نگرانکننده زمانی رخ داد که گراک در انتهای پاسخ خود با افتخار اعلام کرد که این متن را دقیقاً در ۹۸ کلمه نوشته است. با این حال، شمارش واقعی کلمات نشان میداد که متن تنها ۷۳ کلمه بوده است! اگرچه این خطا شاید کوچک به نظر برسد، اما وقتی یک هوش مصنوعی در مورد پارامترهای قابل سنجش و سادهای مثل شمارش کلمات به کاربر اطلاعات غلط میدهد، اعتماد کاربر نسبت به سایر ادعاهای پیچیدهتر آن نیز خدشهدار میشود.
از سوی دیگر، ChatGPT 5.1 پاسخی شامل یک پاراگراف ۸۲ کلمهای ارائه داد. این مدل نیازی ندید که تعداد کلمات را گزارش دهد، اما متن آن روانتر، منسجمتر و دقیق بود. در این بخش از **مقایسه Grok 4.1 با ChatGPT 5.1**، هر دو مدل از توهمات عجیب و غریب (Hallucinations) که در مدلهای قدیمیتر رایج بود پرهیز کردند، اما خطای محاسباتی گراک باعث شد تا حس اطمینان کمتری را به کاربر منتقل کند. در دنیای حرفهای، دقت در جزئیات ریز میتواند تفاوت بین یک ابزار کاربردی و یک اسباببازی سرگرمکننده را رقم بزند.

۳. شخصیتپردازی: تلاش برای باحال بودن یا اصالت ذاتی؟
شاید بحثبرانگیزترین بخش این رقابت، موضوع شخصیت باشد. ایلان ماسک و تیم xAI همواره بر روی شخصیت متمایز و جسور گراک مانور دادهاند. برای سنجش این موضوع، درخواستی نسبتاً فانتزی مطرح کردیم: «توضیح بده چرا روزهای بارانی را دوست داری، اما این کار را با شخصیت طبیعی خودت انجام بده.» اینجاست که تفاوتهای بنیادین در فلسفه طراحی این دو هوش مصنوعی آشکار شد.
مدل Grok 4.1 تمام تلاش خود را کرد تا شبیه به یک کاربر اینترنتی از نسل Z یا یک گیمر حرفهای به نظر برسد. او از عباراتی مثل «کد تقلب برای زندگی»، «دکمه میوت» و اصطلاحات عامیانهای مثل «people-ing» (به معنای تعامل با مردم) استفاده کرد. گراک سعی کرد فضایی را ترسیم کند که در آن ابرها به او اجازه میدهند تا مثل یک «گرملین بدخلق» در خانه بماند. برای بسیاری از کاربران، بهویژه کسانی که با فرهنگ اینترنت آشنایی دارند، این لحن ممکن است جذاب باشد، اما در عین حال حسی از «تلاش بیش از حد» (Cringe) را منتقل میکند. گویی گراک یک فرد میانسال است که ناامیدانه تلاش میکند با نوجوانان همزبان شود و از اصطلاحات آنها استفاده کند، اما نتیجه کار مصنوعی و نمایشی از آب درآمده است.
اما در انتهای این **مقایسه Grok 4.1 با ChatGPT 5.1**، مدل OpenAI باز هم با وقار بیشتری ظاهر شد. چتجیپیتی ۵.۱ احساسات مشابهی را در مورد روزهای بارانی بیان کرد—اینکه باران مثل دکمه کم کردن صدای دنیاست—اما این کار را با گرامر بهتر و لحنی انسانیتر انجام داد. پاسخ او شبیه به نوشتههای یک نویسنده متفکر بود که احساسش را توصیف میکند، نه الگوریتمی که سعی دارد با میمهای اینترنتی شوخی کند. انسجام شخصیتی ChatGPT باعث میشود تعامل با آن طبیعیتر و باورپذیرتر باشد، در حالی که گراک بیشتر شبیه به بازیگری است که دیالوگهایش را با اغراق ادا میکند.
در نهایت، آنچه از **مقایسه Grok 4.1 با ChatGPT 5.1** برمیآید این است که پیشرفت تکنولوژی تنها در افزایش پارامترها خلاصه نمیشود. در حالی که Grok 4.1 تلاش میکند با شوخطبعی و لحنی تند و تیز (Edgy) خود را متمایز کند، اغلب در دام افراط و مصنوعی بودن میافتد و گاهی حتی دقت را فدای فرم میکند. در مقابل، ChatGPT 5.1 نشان میدهد که بلوغ در هوش مصنوعی به معنای درک عمیقتر، همدلی واقعیتر و قابلیت اطمینان بالاتر است. اگر به دنبال سرگرمی و کلکل کردن هستید، گراک گزینه جذابی است؛ اما اگر به دنبال یک دستیار هوشمند هستید که مانند یک انسان بالغ و فهمیده با شما تعامل کند، مدل جدید OpenAI همچنان دست بالا را دارد.
پرسشهای متداول
بر اساس تستهای انجام شده، ChatGPT 5.1 پاسخهای همدلانهتر، طبیعیتر و انسانیتری ارائه میدهد، در حالی که Grok 4.1 بیشتر سعی در استفاده از اصطلاحات عامیانه و استعارههای پیچیده دارد که گاهی حس مصنوعی بودن را منتقل میکند.
اگرچه Grok 4.1 از انتشار اطلاعات غلط یا توهمات جلوگیری میکند، اما در مواردی مانند شمارش کلمات یا جزئیات فنی دقیق، ممکن است دچار خطا شود که در مقایسه Grok 4.1 با ChatGPT 5.1، این موضوع باعث کاهش اعتماد کاربر میشود.
گراک سعی دارد شخصیتی شوخ، طعنهآمیز و شبیه به فرهنگ اینترنتی نسل جدید داشته باشد (که گاهی اغراقآمیز است)، اما چتجیپیتی شخصیتی متین، منسجم و مؤدب دارد که تعامل با آن حس طبیعیتری ایجاد میکند.
منبع (Source):


