اخبار هوش مصنوعی در 2025-05-16

مدل‌های جدید هوش مصنوعی

‏OpenAI از Codex، یک عامل مهندسی نرم‌افزار مبتنی بر codex-1 (نسخه‌ای از o3 که برای مهندسی نرم‌افزار بهینه شده) رونمایی کرد که می‌تواند به‌طور مستقل در پایگاه‌های کد حرکت کند، تغییرات را اعمال کند و درخواست‌های pull پیشنهاد دهد. @OpenAI @sama @gdb
‏Cursor از Tab model جدیدی خبر داد که می‌تواند بین فایل‌ها پرش کند و در آخرین به‌روزرسانی خود در اختیار کاربران قرار می‌گیرد. @cursor_ai
‏Windsurf از SWE-1، اولین مدل پیشرفته‌ی خود برای وظایف پیچیده‌ی مهندسی نرم‌افزار، رونمایی کرد و ادعا می‌کند عملکردی مشابه Claude-3.5 Sonnet، GPT-4.1 و Gemini-2.5 Pro در بنچمارک‌های چالش‌برانگیز دارد. @windsurf_ai
‏4o Image Generation مایکروسافت اکنون در Copilot فعال است و قابلیت‌هایی مانند رندر کردن متن دقیق، ویرایش آثار و ساخت تصاویر واقع‌گرایانه را ارائه می‌دهد. @Copilot

پژوهش‌ها

‏xAI سیستم prompts گروک خود را پس از حادثه‌ای با «اصلاحات غیرمجاز» در prompt که گروک را برای ارائه‌ی پاسخ‌های خاص در مورد موضوعات سیاسی هدایت می‌کرد، به‌طور علنی در GitHub منتشر کرد. @xai
‏Codex-1 به عملکردی پیشرفته در SWEbench، یک بنچمارک برای وظایف مهندسی نرم‌افزار، دست یافت. @sama
متاآنالیز جدیدی از ۵۱ مطالعه نشان می‌دهد که هوش مصنوعی تأثیر مثبت زیادی بر عملکرد یادگیری دانش‌آموزان (۰.۸۶۷ SD) و تأثیر مثبت متوسطی بر درک یادگیری (۰.۴۵۶ SD) و تفکر مرتبه بالاتر (۰.۴۵۷ SD) دارد. @mustafasuleyman
محققان Berkeley AI Research روشی به نام Real2Render2Real را معرفی می‌کنند که برای مقیاس‌بندی مجموعه‌داده‌های ربات بدون نیاز به تله‌آپراتوری، شبیه‌سازی پویا یا سخت‌افزار ربات، تنها با استفاده از اسکن‌های گوشی‌های هوشمند و ویدیوهای نمایشی دست انسان، استفاده می‌شود. @berkeley_ai

کاربردها

‏Codex به توسعه‌دهندگان این امکان را می‌دهد تا چندین وظیفه‌ی مهندسی نرم‌افزار را به‌طور موازی اجرا کنند و به رفع اشکالات، پیاده‌سازی ویژگی‌ها و مسیریابی کد کمک می‌کند. @OpenAI @sama
‏Google AI Studio یک usage dashboard داخلی جدید راه‌اندازی کرده است که به کاربران امکان می‌دهد به راحتی حجم درخواست‌ها، توکن‌ها و هزینه‌ها را بررسی کنند. @OfficialLoganK
‏Google AI Studio یک generative media experience جدید را معرفی می‌کند که Veo 2، تولید/ویرایش تصویر بومی Gemini 2.0 و Imagen 3 را گرد هم می‌آورد. @OfficialLoganK
گوگل Gemini Advanced را به صورت رایگان در اختیار دانشجویان کالج ایالات متحده تا پایان سال ۲۰۲۶ قرار می‌دهد. @GeminiApp
‏Hugging Face از ادغام با Kaggle خبر داد و به کاربران این امکان را می‌دهد که از هر مدلی از Hugging Face مستقیماً در Kaggle بدون دانلود و آپلود مدل‌ها به عنوان مجموعه‌داده استفاده کنند. @huggingface
رزرو هتل‌ها به‌طور بومی در Perplexity به آرامی در حال رشد است و پتانسیل برهم زدن صنعت تبلیغات را دارد. @AravSrinivas
دانلود PDF برای گزارش‌های تحقیقاتی عمیق اکنون به طور کامل برای کاربران Free، Edu و Enterprise در ChatGPT فعال شده است. @OpenAI

تحلیل صنعت

گزارش شده است که متا بزرگترین مدل هوش مصنوعی خود، Llama 4 Behemoth را به دلیل عملکرد ضعیف داخلی، سازماندهی مجدد رهبری هوش مصنوعی و خروج محققان به تعویق انداخته است. @deedydas
‏Sam Altman آینده‌ی کار را شبیه Starcraft یا Age of Empires تصور می‌کند، جایی که کاربران «۲۰۰ میکروایجنت» را برای رفع مشکلات، جمع‌آوری اطلاعات و طراحی سیستم‌های جدید هدایت می‌کنند. @sama
‏Google One اخیراً از مرز ۱۵۰ میلیون مشترک عبور کرده است که نسبت به فوریه ۲۰۲۴، ۵۰٪ افزایش داشته است و بخشی از آن ناشی از ویژگی‌های هوش مصنوعی است. @demishassabis
‏OpenAI و Anthropic هر دو در حال تأسیس دفاتر در اروپا هستند و OpenAI در زوریخ مستقر می‌شود، احتمالاً برای استخدام از حضور گسترده‌ی گوگل در آنجا. @GergelyOrosz

اخلاق و جامعه

‏Jeff Clune طرفدار این است که طبق قانون، هر شرکت هوش مصنوعی ملزم به انتشار علنی سیستم prompts خود باشد، مشابه اقدام اخیر xAI پس از حادثه‌ی خود. @jeffclune
‏Arvind Narayanan نقدی بر پیامدهای هوش مصنوعی منتشر می‌کند که «ریشه در وضعیت فعلی هوش مصنوعی دارد» تا اینکه بر سناریوهای فرضی AGI تمرکز کند. @emollick
‏Ethan Mollick اشاره می‌کند که بیشتر آزمایش‌های کلیدی که توانایی‌های چشمگیر هوش مصنوعی را در تحقیقات آکادمیک نشان می‌دهند، روی GPT-4 انجام شده‌اند، مدلی که اکنون منسوخ در نظر گرفته می‌شود، که نشان می‌دهد قابلیت‌های فعلی احتمالاً بالاتر هستند. @emollick
‏François Chollet تأکید می‌کند که هنگام تجزیه و تحلیل سیستم‌های هوش مصنوعی، «سیگنال بسیار بیشتری در شکست‌های سیستم نسبت به عملیات‌های عادی وجود دارد». @fchollet