اخبار هوش مصنوعی در 2025-05-16
مدلهای جدید هوش مصنوعی
- OpenAI از Codex، یک عامل مهندسی نرمافزار مبتنی بر codex-1 (نسخهای از o3 که برای مهندسی نرمافزار بهینه شده) رونمایی کرد که میتواند بهطور مستقل در پایگاههای کد حرکت کند، تغییرات را اعمال کند و درخواستهای pull پیشنهاد دهد. @OpenAI @sama @gdb
- Cursor از Tab model جدیدی خبر داد که میتواند بین فایلها پرش کند و در آخرین بهروزرسانی خود در اختیار کاربران قرار میگیرد. @cursor_ai
- Windsurf از SWE-1، اولین مدل پیشرفتهی خود برای وظایف پیچیدهی مهندسی نرمافزار، رونمایی کرد و ادعا میکند عملکردی مشابه Claude-3.5 Sonnet، GPT-4.1 و Gemini-2.5 Pro در بنچمارکهای چالشبرانگیز دارد. @windsurf_ai
- 4o Image Generation مایکروسافت اکنون در Copilot فعال است و قابلیتهایی مانند رندر کردن متن دقیق، ویرایش آثار و ساخت تصاویر واقعگرایانه را ارائه میدهد. @Copilot
پژوهشها
- xAI سیستم prompts گروک خود را پس از حادثهای با «اصلاحات غیرمجاز» در prompt که گروک را برای ارائهی پاسخهای خاص در مورد موضوعات سیاسی هدایت میکرد، بهطور علنی در GitHub منتشر کرد. @xai
- Codex-1 به عملکردی پیشرفته در SWEbench، یک بنچمارک برای وظایف مهندسی نرمافزار، دست یافت. @sama
- متاآنالیز جدیدی از ۵۱ مطالعه نشان میدهد که هوش مصنوعی تأثیر مثبت زیادی بر عملکرد یادگیری دانشآموزان (۰.۸۶۷ SD) و تأثیر مثبت متوسطی بر درک یادگیری (۰.۴۵۶ SD) و تفکر مرتبه بالاتر (۰.۴۵۷ SD) دارد. @mustafasuleyman
- محققان Berkeley AI Research روشی به نام Real2Render2Real را معرفی میکنند که برای مقیاسبندی مجموعهدادههای ربات بدون نیاز به تلهآپراتوری، شبیهسازی پویا یا سختافزار ربات، تنها با استفاده از اسکنهای گوشیهای هوشمند و ویدیوهای نمایشی دست انسان، استفاده میشود. @berkeley_ai
کاربردها
- Codex به توسعهدهندگان این امکان را میدهد تا چندین وظیفهی مهندسی نرمافزار را بهطور موازی اجرا کنند و به رفع اشکالات، پیادهسازی ویژگیها و مسیریابی کد کمک میکند. @OpenAI @sama
- Google AI Studio یک usage dashboard داخلی جدید راهاندازی کرده است که به کاربران امکان میدهد به راحتی حجم درخواستها، توکنها و هزینهها را بررسی کنند. @OfficialLoganK
- Google AI Studio یک generative media experience جدید را معرفی میکند که Veo 2، تولید/ویرایش تصویر بومی Gemini 2.0 و Imagen 3 را گرد هم میآورد. @OfficialLoganK
- گوگل Gemini Advanced را به صورت رایگان در اختیار دانشجویان کالج ایالات متحده تا پایان سال ۲۰۲۶ قرار میدهد. @GeminiApp
- Hugging Face از ادغام با Kaggle خبر داد و به کاربران این امکان را میدهد که از هر مدلی از Hugging Face مستقیماً در Kaggle بدون دانلود و آپلود مدلها به عنوان مجموعهداده استفاده کنند. @huggingface
- رزرو هتلها بهطور بومی در Perplexity به آرامی در حال رشد است و پتانسیل برهم زدن صنعت تبلیغات را دارد. @AravSrinivas
- دانلود PDF برای گزارشهای تحقیقاتی عمیق اکنون به طور کامل برای کاربران Free، Edu و Enterprise در ChatGPT فعال شده است. @OpenAI
تحلیل صنعت
- گزارش شده است که متا بزرگترین مدل هوش مصنوعی خود، Llama 4 Behemoth را به دلیل عملکرد ضعیف داخلی، سازماندهی مجدد رهبری هوش مصنوعی و خروج محققان به تعویق انداخته است. @deedydas
- Sam Altman آیندهی کار را شبیه Starcraft یا Age of Empires تصور میکند، جایی که کاربران «۲۰۰ میکروایجنت» را برای رفع مشکلات، جمعآوری اطلاعات و طراحی سیستمهای جدید هدایت میکنند. @sama
- Google One اخیراً از مرز ۱۵۰ میلیون مشترک عبور کرده است که نسبت به فوریه ۲۰۲۴، ۵۰٪ افزایش داشته است و بخشی از آن ناشی از ویژگیهای هوش مصنوعی است. @demishassabis
- OpenAI و Anthropic هر دو در حال تأسیس دفاتر در اروپا هستند و OpenAI در زوریخ مستقر میشود، احتمالاً برای استخدام از حضور گستردهی گوگل در آنجا. @GergelyOrosz
اخلاق و جامعه
- Jeff Clune طرفدار این است که طبق قانون، هر شرکت هوش مصنوعی ملزم به انتشار علنی سیستم prompts خود باشد، مشابه اقدام اخیر xAI پس از حادثهی خود. @jeffclune
- Arvind Narayanan نقدی بر پیامدهای هوش مصنوعی منتشر میکند که «ریشه در وضعیت فعلی هوش مصنوعی دارد» تا اینکه بر سناریوهای فرضی AGI تمرکز کند. @emollick
- Ethan Mollick اشاره میکند که بیشتر آزمایشهای کلیدی که تواناییهای چشمگیر هوش مصنوعی را در تحقیقات آکادمیک نشان میدهند، روی GPT-4 انجام شدهاند، مدلی که اکنون منسوخ در نظر گرفته میشود، که نشان میدهد قابلیتهای فعلی احتمالاً بالاتر هستند. @emollick
- François Chollet تأکید میکند که هنگام تجزیه و تحلیل سیستمهای هوش مصنوعی، «سیگنال بسیار بیشتری در شکستهای سیستم نسبت به عملیاتهای عادی وجود دارد». @fchollet