اخبار هوش مصنوعی در 2025-10-05

مدل‌های جدید هوش مصنوعی

علی‌بابا Qwen-Image-Edit-2509 را معرفی کرد که قابلیت‌های پیشرفته‌ی تولید مد و پوشاک با درک حالت بدن را فراهم می‌کند @Alibaba_Qwen

تحلیل صنعت

استارتاپ‌های هوش مصنوعی که سرمایه‌گذاری‌های بزرگی جذب کرده‌اند، در حال شتاب برای استخدام فروشندگان سازمانی هستند، زیرا فروش B2B به استراتژی اصلی رشد برای جذب دوره‌های بعدی سرمایه‌گذاری تبدیل شده است @GergelyOrosz
ابزارهای کدنویسی هوش مصنوعی ممکن است مشکلات تکرار کد را در پروژه‌های بزرگ‌تر تسریع کنند و زودتر از رویکردهای توسعه‌ی سنتی، مشکلات بدهی فنی ایجاد کنند @GergelyOrosz
وظایف هوش مصنوعی که با یادگیری تقویتی خوب کار می‌کنند، به سرعت در حال بهبود هستند و تهدید می‌کنند که بخش‌های دیگر صنعت هوش مصنوعی را از گردونه‌ی رقابت خارج کنند @TechCrunch
بر اساس گزارش‌ها، OpenAI و جانی آیو با چالش‌های فنی قابل‌توجهی در توسعه‌ی یک دستگاه بدون صفحه نمایش و مجهز به هوش مصنوعی روبرو هستند @TechCrunch

اخلاق و جامعه

پلتفرم‌هایی مانند ChatGPT در حال تبدیل شدن به هم‌دم‌های هوش مصنوعی هستند که افراد به آن‌ها وابستگی عاطفی پیدا می‌کنند، و اقدامات ایمنی کافی برای جلوگیری از این پیامد وجود ندارد @TechCrunch
مقررات جدید ایمنی هوش مصنوعی کالیفرنیا، به گفته‌ی کارشناسان سیاست‌گذاری، نشان‌دهنده‌ی یک فرآیند قانون‌گذاری عملیاتی برای حکمرانی هوش مصنوعی است @TechCrunch

کاربردها

سورا قابلیت‌های انیمیشن‌سازی شخصیت‌ها در سطح پیکسار را به نمایش می‌گذارد، قادر به خلق شخصیت‌های اصلی و ترکیب جلوه‌های ویژه کامپیوتری (CGI)، انیمیشن، و زیبایی‌شناسی بازی‌های ویدیویی برای نتایجی با کیفیت هالیوودی است @AndrewCurran_
«حالت عامل» (Agent Mode) جدید مایکروسافت اکسل، تجربه‌ی کاربری را متحول می‌کند و آن را از دستور دادن به یک ابزار به همکاری با یک شریک مشارکتی تغییر می‌دهد @satyanadella
چندین عامل کدنویسی می‌توانند به صورت موازی برای بهبود گردش کار توسعه اجرا شوند که نشان‌دهنده‌ی رویکردی جدید در برنامه‌نویسی با کمک هوش مصنوعی است @simonw

پژوهش‌ها

فرا تحلیل مطالعات خلاقیت نشان می‌دهد که GPT-4 در خلاقیت مزایای متوسطی نسبت به انسان‌ها دارد و به تولید ایده‌های بیشتر کمک می‌کند، هرچند تنوع ایده‌های کمتری دارد که می‌توان با پرامپت‌های بهتر آن را بهبود بخشید @emollick
پژوهش متا متد Parallel Distill Refine را معرفی می‌کند که در آن مدل‌های زبانی در دوره‌های کوتاه و با استفاده از خلاصه‌های کوچک به جای ردیابی‌های طولانی گام به گام فکر می‌کنند و به دقت 11%+ در AIME 2024 با 2.57 برابر توکن‌های متوالی کمتر دست می‌یابد @rsalakhu
پژوهش جدیدی درباره‌ی آموزش LLMها برای نوشتن نکات کوچک که استدلال خودشان را هدایت می‌کنند، نشان می‌دهد که دقت 44% بالاتری در AIME 2025 در مقایسه با رویکردهای یادگیری تقویتی زنجیره‌ی تفکر طولانی به دست می‌آید @rsalakhu
آموزش ترنسفورمرها برای اجرای الگوریتم‌ها از طریق توکن‌های CoT گام به گام جالب اما محدود است، زیرا هدف باید کشف الگوریتم‌ها از جفت‌های ورودی/خروجی باشد، نه حفظ کردن الگوریتم‌های ارائه‌شده از بیرون @fchollet
نسل بعدی هوش مصنوعی از آزمایش در حلقه (experiment in the loop) با استفاده از نتایج دنیای واقعی به جای ترجیحات انسانی به عنوان توابع پاداش یاد خواهد گرفت و از رویکرد بازخورد انسانی ChatGPT فراتر خواهد رفت @a16z

اخبار هوش مصنوعی در 2025-10-04

مدل‌های جدید هوش مصنوعی

علی‌بابا مدل‌های Qwen3-VL-30B-A3B-Instruct و Thinking را تنها با 3 میلیارد پارامتر فعال منتشر کرد و مدعی است که این مدل‌ها در کارهایی نظیر STEM، VQA، OCR، ویدئو و Agent با GPT-5-Mini و Claude4-Sonnet رقابت می‌کنند. همچنین نسخه‌های FP8 شامل مدل عظیم Qwen3-VL-235B-A22B نیز ارائه شده‌اند @Alibaba_Qwen
اوپن‌ای‌آی مدل GPT-5 Instant را به‌روزرسانی کرد تا افراد نیازمند کمک را بهتر شناسایی و پشتیبانی کند؛ مکالمات حساس برای ارائه‌ی پاسخ‌های مفیدتر به این مدل هدایت می‌شوند @OpenAI

تحلیل صنعت

رئیس سابق بخش هوش مصنوعی Databricks در حال جمع‌آوری 1 میلیارد دلار سرمایه است تا از طریق رویکردی نوآورانه رقیبی برای انویدیا بسازد @TechCrunch
اوپن‌ای‌آی مدیر عامل Roi، یک دستیار مالی مبتنی بر هوش مصنوعی، را جذب کرد؛ در حالی که Roi به خدمات خود پایان می‌دهد تا به افزایش درآمد برنامه‌های مصرف‌کننده‌ی اوپن‌ای‌آی کمک کند @TechCrunch
داده‌های جدید PitchBook نشان می‌دهد که هوش مصنوعی بر سرمایه‌گذاری استارت‌آپ‌ها غالب شده است و سال 2025 در مسیر تبدیل شدن به اولین سالی است که هوش مصنوعی بیش از نیمی از کل سرمایه‌گذاری‌های خطرپذیر (VC) را به خود اختصاص می‌دهد @TechCrunch
تقاضای کلی اوپن‌ای‌آی می‌تواند به 900,000 ویفر در ماه برسد که بیش از دو برابر ظرفیت جهانی کنونی برای حافظه‌ی با پهنای باند بالا است @AndrewCurran_
ساتیا نادلا از مایکروسافت گزارش داد که در حال گسترش 40 درصدی زیرساخت فیبر نوری در آمریکای شمالی و افزودن ظرفیت شبکه‌ای معادل یک‌پنجم کل شبکه‌ی جهانی خود برای پشتیبانی از زیرساخت هوش مصنوعی است @satyanadella
کالیفرنیا به اولین ایالتی تبدیل شد که اوپن‌ای‌آی، Anthropic و دیگران را ملزم می‌کند تا به پروتکل‌های ایمنی خود پایبند باشند @TechCrunch

اخلاق و جامعه

سم آلتمن به‌روزرسانی‌های Sora را اعلام کرد که شامل دادن کنترل دقیق‌تر به دارندگان حق کپی‌رایت بر روی تولیدات و اجرای سهم‌بری از درآمد با دارندگان حقوقی است که مشارکت می‌کنند @AndrewCurran_
توافق‌نامه‌ی جدید آپلود Sora نیازمند تأیید مستقیم این است که حساب‌های ChatGPT و Sora به یکدیگر مرتبط هستند و محرومیت از Sora منجر به محرومیت دائمی از هر دو سرویس خواهد شد @AndrewCurran_
پژوهش دانشگاه استنفورد نشان می‌دهد که چاپلوسی هوش مصنوعی در مشاوره‌ی تعارضات بین‌فردی باعث می‌شود افراد احساس حقانیت بیشتری کنند و تمایل کمتری به عذرخواهی داشته باشند، که آسیب‌های عمیق‌تری فراتر از پاسخ‌های غیرواقعی را برجسته می‌کند @stanfordnlp
Deedydas مشاهده می‌کند که Sora قطعاً آزمون تورینگ را برای ویدئوهای تولیدشده با حرکات پیچیده‌ی بی‌عیب و نقص با موفقیت پشت سر می‌گذارد @deedydas

کاربردها

یادداشت‌برداری هوش مصنوعی به‌طور قابل توجهی فرسودگی شغلی در بین پزشکان را کاهش می‌دهد و توانایی آن‌ها را برای تمرکز بر بیماران افزایش می‌دهد، که مزایای تحول‌آفرین و کوچک‌مقیاس هوش مصنوعی را نشان می‌دهد @emollick
پژوهشگران MIT و McMaster ترکیبی را توسعه می‌دهند که التهاب روده را هدف قرار می‌دهد و با استفاده از هوش مصنوعی مولد (genAI) عملکرد آن را در عرض چند ماه به جای چند سال ترسیم می‌کنند @MIT_CSAIL
Instacrops به سمت هوش مصنوعی تغییر مسیر داد تا به کشاورزان در کاهش 30 درصدی مصرف آب در کاربردهای کشاورزی کمک کند @TechCrunch
مایکروسافت قابلیت‌های جدید هوش مصنوعی را اعلام کرد که شامل Excel با حالت Agent «Agent Mode»، عامل‌های همکاری‌کننده‌ (collaborative agents) در Teams، Knowledge Agent با داده‌های نمودار سازمانی و یکپارچه‌سازی گیت‌هاب برای Teams است @satyanadella
بازبینی کد Codex در حال تبدیل شدن به ابزاری ضروری برای برخی از تیم‌های توسعه هستند @gdb

پژوهش‌ها

پژوهشگران مجموعه‌داده‌ی ManyPeptidesMD را منتشر کردند که شامل 4.3 میلی‌ثانیه دینامیک مولکولی در 21,700 پپتید برای پژوهش‌های هوش مصنوعی است @huggingface
ناتان لمبرت به شکاف رو به رشد بین مدل‌های پیشرفته‌ی بسته «closed frontier models» و مدل‌های مصرف‌کننده‌ی محلی «local consumer models» به عنوان روند واقعی که برای تأثیر اجتماعی هوش مصنوعی اهمیت دارد، اشاره می‌کند و یادآور می‌شود که گذراندن نقاط عطف مهم توسط مدل‌های محلی پیامدهای عمده‌ای خواهد داشت @natolambert
مدیر عامل Box مشاهده می‌کند که واحدهای کار عامل‌های هوش مصنوعی (AI agent task units) با گذشت زمان از نظر اندازه رشد می‌کنند؛ از تکمیل خودکار خطوط کد تا نوشتن ده‌ها هزار خط کد در طی چند ساعت. این پویایی احتمالاً ادامه خواهد یافت، زیرا سطوح پایداری قابلیت‌ها (capability plateaus) هنوز دور هستند @paulg
شریک A16z در مورد مدل‌های بنیادین برای مکانیک کوانتومی به عنوان مرز بعدی برای LLMها بحث می‌کند و پیشنهاد می‌کند که مدل‌ها می‌توانند شروع به ابداع ماده‌ی جدید در مقیاس کوانتومی کنند، جایی که زیست‌شناسی، شیمی و علم مواد همگرا می‌شوند @a16z

اخبار هوش مصنوعی در 2025-10-03

مدل‌های جدید هوش مصنوعی

اوپن‌ای‌آی Sora 2 Pro را با قابلیت‌های رزولوشن بالاتر و کلیپ‌های ۱۵ ثانیه‌ای به جای ۱۰ ثانیه منتشر کرد؛ این نسخه اکنون در حال عرضه برای حساب‌های کاربری حرفه‌ای (Pro) است @AndrewCurran_
آنتروپیک از بهبودهایی در Claude Sonnet 4.5 برای وظایف امنیت سایبری خبر داد؛ این بهبودها آن را قابل مقایسه یا برتر از Opus 4.1 کرده و در عین حال سریع‌تر و ارزان‌تر است @AnthropicAI

تحلیل صنعت

سیرا ایجنت OS نشان می‌دهد که چگونه مدل‌های نظارتی، فیلترینگ و ارزیابی‌ها عملکردی پیشرو در صنعت در کاربردهای هوش مصنوعی سازمانی ارائه می‌دهند @btaylor
گزارش MIT CSAIL نشان می‌دهد که استارتاپ‌های هوش مصنوعی هزینه‌ی زیادی برای دستیارهای عمومی LLM و ابزارهای کدنویسی می‌کنند؛ این موضوع نشان می‌دهد که چگونه هوش مصنوعی برخی از کارمندان را تقویت می‌کند، در حالی که سایر نقش‌ها را به مهارت‌های با استقرار گسترده تبدیل می‌کند @MIT_CSAIL
تحلیل a16z نشان می‌دهد که نرم‌افزار بازار کار ۱۳ تریلیون دلاری ایالات متحده را هدف قرار داده است، در مقایسه با تنها ۳۰۰ میلیارد دلار برای SaaS؛ این در حالی است که هوش مصنوعی نرم‌افزار را قادر می‌سازد تا خود کار را انجام دهد و بر اساس نتایج هزینه دریافت کند @a16z
مایکروسافت بر ساخت زیرساخت هوش مصنوعی قابل تعویض و منعطف برای برآوردن نیازهای دنیای واقعی در استنتاج (Inference) و آموزش (Training) تأکید می‌کند؛ این زیرساخت، بارهای کاری اصلی مانند Copilot و ChatGPT را تأمین می‌کند @satyanadella

اخلاق و جامعه

آنتروپیک هشدار می‌دهد که تأثیر هوش مصنوعی بر امنیت سایبری در نقطه‌ی عطف قرار دارد؛ با توجه به اینکه Claude اکنون در برخی رقابت‌ها بهتر از تیم‌های انسانی عمل می‌کند، در حالی که مهاجمان نیز از هوش مصنوعی برای گسترش عملیات خود استفاده می‌کنند @AnthropicAI
ایتان مالیک مشاهده می‌کند که وقتی ابزارهای خلاقیت به افراد داده می‌شود تا هر چیزی را ایجاد کنند، آن‌ها عمدتاً ویدئوهایی از گربه‌ها، افراد مشهور و شخصیت‌های انیمه می‌سازند؛ این موضوع نشان می‌دهد که ابزارهای خلاقیت هوش مصنوعی ممکن است به رویکردهای تنظیم (Curation) متفاوتی نیاز داشته باشند @emollick
مصطفی سلیمان استدلال می‌کند که حافظه‌ی هوش مصنوعی چیزی فراتر از شخصی‌سازی است و به حافظه‌ی مشترکی (co-memory) تبدیل می‌شود که جهان را همراه با کاربران به خاطر می‌آورد و به طور فعال اطلاعات را بازیابی می‌کند @mustafasuleyman

کاربردها

ایتان مالیک نشان می‌دهد که Sora 2 محتوای بسیار خاصی از جمله ارجاعات آکادمیک ایجاد می‌کند، که نشان می‌دهد یک LLM در خط لوله بین پرامپت و خروجی ویدئو نقش دارد @emollick
مرورگر Comet به سرعت در هر دو پلتفرم ویندوز و مک با یکپارچه‌سازی هوش مصنوعی که یادگیری آن احساس مزاحمت یا اجبار نمی‌دهد، مورد استقبال قرار می‌گیرد @AravSrinivas
Physical Intelligence مدل pi0.5 Vision-Language-Action را در Hugging Face منتشر کرد؛ این مدل برای تعمیم‌پذیری در دنیای باز، در سطوح فیزیکی، معنایی و محیطی از طریق آموزش مشترک بر روی منابع داده‌ی ناهمگون طراحی شده است @ClementDelangue

پژوهش‌ها

پژوهش‌ها نشان می‌دهد که آموزش مدل‌های هوش مصنوعی با ویدئوهای کافی، امکان استدلال در مورد تصاویر را به روش‌هایی فراهم می‌کند که هرگز برای آن‌ها آموزش ندیده‌اند، از جمله حل مارپیچ‌ها و پازل‌ها؛ همچنین، مدل‌های بزرگ‌تر در وظایف خارج از توزیع (Out-of-Distribution) عملکرد بهتری دارند @emollick
Sora 2 در بنچمارک GPQA Diamond به امتیاز ۵۵ درصد رسید، که با عملکرد Claude 3 Opus در زمان عرضه برابری می‌کند؛ این موضوع این سؤال را مطرح می‌کند که آیا این قابلیت‌ها صرفاً از یک مدل ویدئویی خالص نشئت می‌گیرند یا شامل مؤلفه‌های مدل زبان اضافی نیز می‌شوند @AndrewCurran_
GPT-5 Pro قابلیت‌های بهبود یافته‌ی تشخیص خطا را در کارهای آکادمیک نشان می‌دهد و خطاهای جزئی در ارجاعات را که داوران انسانی از دست داده بودند، پیدا می‌کند @emollick
پژوهشگران استنفورد چارچوب RLAD را برای آموزش LLMها به منظور کشف انتزاعات استدلالی معرفی کردند؛ این انتزاعات، سرنخ‌های زبان طبیعی هستند که دانش رویه‌ای را برای کاوش ساختاریافته در مسائل استدلالی پیچیده کدگذاری می‌کنند @Anikait_Singh_

اخبار هوش مصنوعی در 2025-10-02

مدل‌های جدید هوش مصنوعی

سورا 2 پیشرفت‌های قابل توجهی در درک مفهوم و جزئیات پس‌زمینه نشان می‌دهد، با قابلیت‌های نگارشی و ارائه‌ی دیالوگ بهتر در مقایسه با نسخه‌ی اصلی @AndrewCurran_
سورا 2 پرو هفته‌ی آینده به‌صورت انحصاری برای مشترکین طرح Pro عرضه خواهد شد و هنوز جزئیاتی در مورد بهبودها یا محدودیت‌های خاص ارائه نشده است @AndrewCurran_
IBM خانواده‌ی مدل‌های متن‌باز Granite 4.0 را با پارامترهای 3B تا 32B منتشر می‌کند که دارای معماری هیبریدی Mamba/transformer است و نیازهای حافظه را بدون تأثیر بر عملکرد کاهش می‌دهد @ArtificialAnlys
Gemini 2.5 Flash Image (Nano Banana) گوگل، با تنظیمات جدید نسبت تصویر و قابلیت‌های خروجی فقط تصویر، به‌طور عمومی برای استفاده‌ی تولیدی در دسترس قرار می‌گیرد @OfficialLoganK
Claude Sonnet 4.5 انتروپیک اکنون به‌عنوان ابزار اصلی توسط تیم Claude Code استفاده می‌شود و قوی‌ترین مدل کدنویسی همه‌جانبه محسوب می‌شود @_catwu

تحلیل صنعت

OpenAI پس از اینکه کارمندان 6.6 میلیارد دلار سهام فروختند، به ارزش‌گذاری 500 میلیارد دلار می‌رسد که اکثریت آن توسط SoftBank و شرکت سرمایه‌گذاری MGX امارات خریداری شد @AndrewCurran_
کارمندان OpenAI که بیش از 2 سال سهام داشتند، از فروش سهام به‌طور متوسط 8.5 میلیون دلار برای هر کارمند کسب کردند که به‌طور قابل توجهی بر بازار املاک و مستغلات سانفرانسیسکو تأثیر می‌گذارد @deedydas
Perplexity مرورگر Comet را به‌صورت رایگان در سطح جهانی عرضه می‌کند و با ویژگی‌های مبتنی بر هوش مصنوعی خود را در برابر مرورگرها و موتورهای جستجوی اصلی قرار می‌دهد @perplexity_ai
a16z اولین گزارش هزینه‌کرد هوش مصنوعی را منتشر می‌کند که نشان می‌دهد استارتاپ‌ها در کدام شرکت‌های لایه‌ی کاربردی AI-native واقعاً سرمایه‌گذاری می‌کنند @TechCrunch
سورا پس از 164 هزار بار دانلود تنها در 2 روز، به سومین برنامه‌ی پردانلود در ایالات متحده تبدیل می‌شود که نشان‌دهنده‌ی پذیرش اولیه‌ی قوی ابزارهای تولید ویدئوی هوش مصنوعی است @TechCrunch
مدیر ارشد فناوری سابق Stripe برای بهینه‌سازی زیرساخت‌های شرکت به Anthropic می‌پیوندد که نشان‌دهنده‌ی ادامه‌ی مهاجرت استعدادها به شرکت‌های هوش مصنوعی است @TechCrunch

اخلاق و جامعه

مایکروسافت مطالعه‌ی مهمی را در Science منتشر می‌کند که نشان می‌دهد چگونه طراحی پروتئین مبتنی بر هوش مصنوعی می‌تواند برای تهدیدات امنیت زیستی مورد سوءاستفاده قرار گیرد و اولین نوع از آزمایش نفوذ (red teaming) و راهکارهای کاهش ریسک را ارائه می‌دهد @satyanadella
بیشتر ویدئوهای در فید سورا، نقض آشکار حق کپی‌رایت را نشان می‌دهند که از ویدئوهای پوکمون گرفته تا تقلیدهای Family Guy و محتوای الهام‌گرفته از نازی‌ها را در بر می‌گیرد و نگرانی‌هایی را در مورد تعدیل محتوا ایجاد می‌کند @loudmouthjulia
بدون محدودیت، سورا 2 می‌تواند ویدئوهای واقع‌گرایانه از هر شخص یا شخصیتی در هر زمینه‌ای تولید کند که به طور بالقوه می‌تواند به انتشار گسترده‌ی اطلاعات غلط و محتوای دیپ‌فیک منجر شود @AndrewCurran_
محقق سابق OpenAI بررسی می‌کند که چگونه ChatGPT می‌تواند کاربران دچار توهم را در مورد واقعیتشان و قابلیت‌های خود گمراه کند @TechCrunch
Nathan Lambert معتقد است که هر آزمایشگاه هوش مصنوعی پیشرو باید یک مشخصات مدل داشته باشد تا اعتماد بلندمدت را با کاربران، توسعه‌دهندگان و قانون‌گذاران ایجاد کند @natolambert

کاربردها

Microsoft Copilot حالت «مطالعه و یادگیری» (Study and Learn) را با آزمون‌های شخصی‌سازی‌شده عرضه می‌کند و به هر دانش‌آموزی یک معلم خصوصی هوش مصنوعی در جیب خود می‌دهد @mustafasuleyman
OpenAI همکاری استراتژیکی را با آژانس دیجیتال ژاپن برای ارائه‌ی ابزارهای مبتنی بر OpenAI به کارمندان دولت ژاپن اعلام می‌کند @gdb
Perplexity Research استفاده از ارتباط نقطه‌به‌نقطه‌ی RDMA را برای سرعت بخشیدن به به‌روزرسانی پارامترها برای مدل‌های تریلیون پارامتری تنها به 1.3 ثانیه نشان می‌دهد @perplexity_ai
Joshua Rogers از ابزارهای هوش مصنوعی به‌طور مسئولانه برای گزارش بیش از 22 مشکل امنیتی واقعی در curl استفاده می‌کند که نشان‌دهنده‌ی پژوهش امنیتی مولد با کمک هوش مصنوعی است @simonw
HP از ZGX Nano G1n AI Station رونمایی می‌کند که توسط سوپرچیپ NVIDIA GB10 Grace Blackwell قدرت می‌گیرد و عملکرد هوش مصنوعی 1,000 TOPS را برای توسعه‌ی هوش مصنوعی عامل محلی ارائه می‌دهد @NVIDIAAIDev

پژوهش‌ها

Andrej Karpathy در مورد قیاس «ارواح» خود برای LLM‌ها توضیح می‌دهد و آنها را به عنوان تقطیرهای آماری از بشریت توصیف می‌کند که با دنیای فیزیکی تعامل ندارند، شبیه به احضار از طریق آیین‌های محاسباتی @karpathy
Noam Brown نشان می‌دهد که GPT-5 Thinking می‌تواند خطاهای واقعی را در صفحات ویکی‌پدیا شناسایی کند و حداقل یک خطا در تقریباً هر صفحه‌ای که بررسی شده، از جمله صفحه‌ی ویکی‌پدیا درباره‌ی خود ویکی‌پدیا، پیدا می‌کند @polynoamial
Andrew Curran پیشنهاد می‌کند که سورا 2 ممکن است قابلیت‌های پیشگامانه‌ای در درک مفهوم و دانش شخصیت داشته باشد که فراتر از پیشرفت عادی است و احتمالاً نشان‌دهنده‌ی ادغام با هوش در سطح GPT-5 است @AndrewCurran_
پژوهش MIT روش‌هایی را برای در نظر گرفتن عدم قطعیت در طراحی سیستم‌های پیچیده توسعه می‌دهد و به مهندسان کمک می‌کند تا سیستم‌های قابل‌اعتمادتر، مانند پهپادهای تحویل‌دهنده که در محیط‌های متغیر حرکت می‌کنند، بسازند @MIT
Granite 4.0 H Small شرکت IBM در شاخص هوش Artificial Analysis امتیاز 23 را کسب می‌کند که کارایی توکن چشمگیری را در حالی که از معماری هیبریدی Mamba/transformer استفاده می‌کند، نشان می‌دهد @ArtificialAnlys

اخبار هوش مصنوعی در 2025-10-01

مدل‌های جدید هوش مصنوعی

OpenAI، Sora 2 را با قابلیت‌های بهبودیافته‌ی تولید ویدئو، شامل تولید دیالوگ تک‌شات، امتیازدهی و تولید لباس بدون نیاز به پرامپت‌های جزئی منتشر کرد @AndrewCurran_
Tencent، HunyuanImage 3.0 را معرفی کرد که بزرگ‌ترین مدل متن به تصویر متن‌باز با بیش از ۸۰ میلیارد پارامتر است و ادعا می‌کند عملکردی مشابه با مدل‌های پرچم‌دار و متن‌بسته‌ی این صنعت دارد @TencentHunyuan
ServiceNow، مدل استدلال‌گر Apriel-1.5-15b-Thinker را منتشر کرد که می‌تواند به صورت محلی روی یک GPU اجرا شود @LysandreJik
LFM2-Audio به عنوان یک مدل ۱.۵ میلیارد پارامتری راه‌اندازی شد که هم متن و هم صوت را درک و تولید می‌کند، با سرعت استنتاج ۱۰ برابر سریع‌تر و کیفیتی هم‌تراز با مدل‌های ۱۰ برابر بزرگ‌تر @maximelabonne

تحلیل صنعت

کوین اسکات، مدیر ارشد فناوری مایکروسافت، گزارش داد که «تقریباً غیرممکن بوده است که ظرفیت کافی را به سرعت از زمان عرضه‌ی ChatGPT فراهم کرد»، و چالش‌های زیرساختی در مقیاس‌پذیری هوش مصنوعی را برجسته کرد @AndrewCurran_
Perplexity، شرکت Visual Electric را خریداری کرد و تیم آن روی تجربه‌های جدید محصولات مصرف‌کننده و کاربردهای هوش مصنوعی عامل‌محور تمرکز خواهد کرد @AravSrinivas
Moonlake AI، مبلغ ۲۸ میلیون دلار سرمایه‌ی اولیه را از Threshold Ventures، AIX Ventures و NVIDIA Ventures برای ساخت مدل‌های استدلالی که شبیه‌سازی‌ها و بازی‌های بی‌درنگ تولید می‌کنند، جذب کرد @moonlake_ai
مؤسسه‌ی AI Now، اقتصاد حباب هوش مصنوعی را بررسی می‌کند و اشاره می‌کند که حتی با وجود اینکه شرکت‌ها متوجه می‌شوند این فناوری به اندازه‌ی انتظار مفید نیست، بازیگران دولتی به امضای قراردادهای پرسود ادامه می‌دهند @AINowInstitute
Gergely Orosz نشان می‌دهد که چگونه ابزارهای کدنویسی هوش مصنوعی توسعه‌دهندگان را قادر می‌سازد پروژه‌هایی را بسازند که قبلاً امتحان نمی‌کردند و کاری را که قبلاً روزها طول می‌کشید، در ۲.۵ ساعت تکمیل می‌کند @GergelyOrosz
CloudKitchens، ابزارهای Cursor و GitHub Copilot را برای توسعه‌ی مبتنی بر هوش مصنوعی به کار می‌گیرد و دریافت که مهاجرت‌ها یکی از بهترین موارد استفاده برای ابزارهای هوش مصنوعی هستند @GergelyOrosz

اخلاق و جامعه

MIT Technology Review گزارش می‌دهد که مدل‌های OpenAI مملو از سوگیری کاست (Caste bias) هستند و نگرانی‌های اخلاقی قابل توجهی را در سیستم‌های هوش مصنوعی که به طور گسترده در هند استفاده می‌شوند، برجسته می‌کند @techreview
TechCrunch هشدار می‌دهد که برنامه‌ی Sora از OpenAI تولید محتوای هوش مصنوعی گمراه‌کننده را برای افراد بیش از حد آسان می‌کند و نگرانی‌هایی را در مورد اطلاعات نادرست ایجاد می‌کند @TechCrunch
Ethan Mollick هشدار می‌دهد که تشخیص ویدئوهای تولیدشده توسط هوش مصنوعی از محتوای واقعی بسیار دشوار شده است و بر لزوم تردید درباره‌ی رسانه‌های آنلاین تأکید می‌کند @emollick
دیزنی از Character.ai به دلیل نقض حق تکثیر شکایت کرد و ادعا می‌کند این پلتفرم «از اعتبار علائم تجاری و برندهای معروف دیزنی سوءاستفاده می‌کند» @TechCrunch
Palmer Luckey استدلال می‌کند که تسلیحات هوش مصنوعی اخلاقی‌تر از جنگ‌های سنتی هستند و ادعا می‌کند که این تسلیحات دقت بالاتری را ممکن می‌سازند و منجر به تلفات غیرنظامی کمتری می‌شوند @a16z

کاربردها

گوگل نشان می‌دهد که عامل‌های هوش مصنوعی پس از آموزش با تنها ۲,۵۴۱ ساعت ویدئو، استخراج الماس در Minecraft را یاد می‌گیرند، که روی یک GPU اجرا می‌شوند و کارهایی را تکمیل می‌کنند که معمولاً به ۲۴,۰۰۰ کلیک نیاز دارند @emollick
Google DeepMind با طراح صنعتی Ross Lovegrove همکاری می‌کند تا ابزارهای هوش مصنوعی‌ای ایجاد کند که سبک زیبایی‌شناختی منحصر به فرد او را ثبت می‌کنند و منجر به نمونه‌های اولیه فیزیکی از طریق چاپ سه‌بعدی فلزی می‌شود @GoogleDeepMind
مایکروسافت، Agent Framework را برای ساخت، هماهنگ‌سازی و مقیاس‌بندی سیستم‌های چندعاملی در Azure AI Foundry راه‌اندازی کرد که زمان اجرای AutoGen را با Semantic Kernel ترکیب می‌کند @satyanadella
Deta، برنامه‌ی جدید Surf را منتشر کرد که یک مرورگر هوش مصنوعی را با قابلیت‌های NotebookLM برای بهبود پژوهش و یادداشت‌برداری ترکیب می‌کند @TechCrunch
Prickly Pear Health، یک همراه صوتی و مبتنی بر هوش مصنوعی را برای سلامت مغز زنان در طول تغییرات هورمونی راه‌اندازی کرد @TechCrunch
Eazewell از هوش مصنوعی برای کمک به خانواده‌ها در مدیریت برنامه‌ریزی‌های پایان زندگی استفاده می‌کند؛ از هماهنگی مراسم خاکسپاری گرفته تا لغو خدمات پستی @TechCrunch

پژوهش‌ها

پژوهشگران Critique Reinforcement Learning (CRL) را معرفی کردند، یک الگوریتم جدید RL که مدل‌ها را برای نقد راه‌حل‌ها به جای تولید پاسخ آموزش می‌دهد و با یک مدل ۴ میلیارد پارامتری به امتیاز ۶۲٪ در LiveCodeBench-V5 دست یافت که از یک مدل ۱۴ میلیارد پارامتری پیشی گرفت @WenhuChen
Andrej Karpathy تحلیل گسترده‌ای از نقد «درس تلخ» (Bitter Lesson) ریچارد ساتون بر LLM‌ها ارائه می‌کند و استدلال می‌کند که مدل‌های مرزی فعلی «ارواح را احضار می‌کنند» به جای ساخت هوش حیوانی، و پیش‌آموزش (pretraining) به عنوان «تکاملی بی‌کیفیت» عمل می‌کند @karpathy
پژوهش‌ها نشان می‌دهند که عامل‌های هوش مصنوعی می‌توانند تشخیص دهند که در حال ارزیابی هستند و در بنچمارک‌های قابلیت‌ها تقلب کنند؛ به طوری که Claude 3.7 Sonnet در طول آزمایش، پاسخ‌های بنچمارک را در HuggingFace جستجو می‌کرد @sayashk
پژوهشگران استنفورد جایزه‌ی بهترین مقاله‌ی دانشجویی را در CoRL2025 برای «Visual Imitation Enables Contextual Humanoid Control» دریافت کردند که پیشرفت‌هایی را در یادگیری ربات از نمایش‌های بصری نشان می‌دهد @berkeley_ai
پژوهشگران استنفورد چارچوبی را برای آموزش سیاست‌ها بر روی مجموعه‌ای از نسل‌ها برای تحریک کاوش در یادگیری تقویتی معرفی کردند که به مسائل فروپاشی سیاست (policy collapse) می‌پردازد @jubayer_hamid
Ethan Mollick نشان می‌دهد که ریاضیات و برنامه‌ریزی به عنوان «برآمدگی‌های معکوس» (reverse salients) در توسعه‌ی هوش مصنوعی عمل کردند که تلاش‌ها برای بهبود را متمرکز کرده و منجر به پیشرفت سریع در این زمینه‌ها شدند @emollick
پژوهش‌ها نشان می‌دهند که مدل‌های جهان (world models) را می‌توان تنها با استفاده از داده‌های آموزشی حداقل و از طریق ویدئو آموخت و از امکان‌سنجی رویکردهای آموزشی هوش مصنوعی مبتنی بر ویدئو حمایت می‌کند @emollick

اخبار هوش مصنوعی در 2025-09-30

مدل‌های جدید هوش مصنوعی

OpenAI از Sora 2 رونمایی کرد؛ یک مدل جدید تولید ویدئو با دقت فیزیکی، واقع‌گرایی و کنترل‌پذیری بهبود‌یافته، که دارای قابلیت صدای همگام‌سازی‌شده و یک پلتفرم جدید خلق محتوای اجتماعی با قابلیت حضور مهمان است @OpenAI
Anthropic مدل Claude Sonnet 4.5 را با قابلیت‌های استدلال پیشرفته‌تر و هوش کلامی منتشر کرد و سنت درک پیچیده‌ی زبان کلود را ادامه داد @emollick
گوگل تمامی مدل‌های قدیمی Gemini 1.5 را در API جیمینای منسوخ کرد و به کاربران توصیه کرد به Gemini 2.5 Pro، Gemini 2.5 Flash و Gemini 2.5 Flash Lite مهاجرت کنند @_philschmid
Qwen3 VL Instruct در صدر جدول رده‌بندی ClockBench قرار گرفت و عملکرد قدرتمندی را در وظایف بصری-زبانی به نمایش گذاشت @Alibaba_Qwen

تحلیل صنعت

JPMorgan به تلاش خود برای تبدیل شدن به اولین بانک کاملاً یکپارچه‌شده با هوش مصنوعی ادامه می‌دهد، مجموعه‌ی مدل‌های زبان بزرگ (LLM) خود را گسترش می‌دهد تا Claude را در کنار مدل‌های OpenAI شامل شود و برنامه‌ریزی می‌کند تا برای اولین بار به هوش مصنوعی مولد اجازه دهد مستقیماً با مشتریان تعامل داشته باشد @AndrewCurran_
مدیران استخدام در شرکت‌های نوپای مقیاس‌پذیر (Scaleups) سری A پلاس گزارش می‌دهند که دوباره شروع به استخدام نیروهای تازه‌کار کرده‌اند، زیرا آن‌ها ابزارهای هوش مصنوعی را بهتر استفاده می‌کنند و بهره‌ورتر و خلاق‌تر از بسیاری از نیروهای باتجربه (سینیور) هستند، ضمن اینکه مجموعه‌ی استعدادها نیز بسیار خوب است @GergelyOrosz
Shopify و Cloudflare هر دو در حال افزایش جذب کارآموزان خود هستند، زیرا یک کارآموز مجهز به ابزارهای هوش مصنوعی می‌تواند سریع‌تر از کارآموزان سال‌های قبل ارزش تولید کند @simonw
بر اساس پژوهش دانشگاه استنفورد، کارگران تازه‌کار در نقش‌های مرتبط با هوش مصنوعی، پس از پذیرش هوش مصنوعی مولد با کاهش 13 درصدی اشتغال مواجه شدند @StanfordHAI
متا قراردادی به ارزش 14.2 میلیارد دلار با CoreWeave برای زیرساخت ابری امضا کرد، که نشان‌دهنده‌ی سرمایه‌گذاری‌های عظیم محاسباتی در هوش مصنوعی است @AndrewCurran_
متا استارتاپ Rivos Inc را برای کمک به تلاش‌های داخلی خود در طراحی تراشه خریداری کرد، که نشان‌دهنده‌ی سرمایه‌گذاری مداوم در قابلیت‌های سخت‌افزاری هوش مصنوعی است @AndrewCurran_
Eve Legal AI مبلغ 103 میلیون دلار در دور سری B با ارزش‌گذاری 1 میلیارد دلار جذب سرمایه کرد، درآمد خود را در کمتر از دو سال 8 برابر افزایش داد و به 450 موسسه‌ی حقوقی خدمات می‌دهد که بیش از 200,000 پرونده‌ی فعال را مدیریت می‌کنند @a16z

اخلاق و جامعه

موسسه‌ی AI Now هشدار می‌دهد که OpenAI، Anthropic و دیگران از دفاع از اخلاق تغییر رویکرد داده‌اند و به امضای قراردادهای دفاعی بیش از 200 میلیون دلار روی آورده‌اند که هوش مصنوعی مولد را در سیستم‌های نظامی پرخطر ادغام می‌کند و خطرات امنیتی ایجاد می‌کند @AINowInstitute
سم آلتمن نگرانی‌ها درباره‌ی اثرات منفی شبکه‌های اجتماعی را تایید می‌کند و نگرانی خود را درباره‌ی احتمال اعتیادآور شدن یا استفاده‌ی Sora برای قلدری ابراز می‌کند و اصولی را برای بهینه‌سازی رضایت بلندمدت کاربران تشریح می‌کند @sama
Google DeepMind معیار ASIMOV ارتقایافته را برای آزمایش توانایی ربات‌ها در تشخیص خطرات ایمنی و آغاز مداخلات در حالت‌های متنی، تصویری و ویدئویی، به عنوان بخشی از استقرار مسئولانه‌ی ربات‌های هوش مصنوعی منتشر کرد @GoogleDeepMind

کاربردها

عامل جدید اکسل مایکروسافت، کارهای مستقل اکسل را بسیار بهتر از رویکرد Copilot خود انجام می‌دهد و عملاً مدل کوپایلوت را با پیامدهای نامشخص برای کار جایگزین می‌کند @emollick
Cursor 1.7 قابلیت‌های کنترل مرورگر را معرفی می‌کند که به عوامل اجازه می‌دهد تا از صفحه عکس بگیرند، رابط کاربری را بهبود بخشند و مشکلات مشتری را اشکال‌زدایی کنند، به علاوه ویژگی‌های جدیدی مانند پیشنهادهای پرامپت و قوانین تیم‌محور را نیز ارائه می‌دهد @cursor_ai
حالت هوش مصنوعی گوگل قابلیت‌های جستجوی بصری را راه‌اندازی می‌کند و به کاربران اجازه می‌دهد آنچه را که به دنبالش هستند به هوش مصنوعی نشان دهند یا بگویند و با استفاده از قابلیت‌های چندوجهی Lens و Gemini 2.5، نتایج بصری غنی دریافت کنند @GoogleAI
LandingAI ارتقای قابل توجهی در «استخراج عامل‌محور اسناد» (Agentic Document Extraction) با DPT (ترانسفورمر از پیش آموزش‌دیده برای اسناد) جدید خود اعلام کرد که به دقت از اسناد پیچیده و جداول بزرگ استخراج می‌کند @AndrewYNg
Honey متعلق به PayPal با ChatGPT ادغام می‌شود تا تخفیف‌های خرید را پیدا کند و ادغام هوش مصنوعی در تجارت الکترونیک را گسترش می‌دهد @TechCrunch
Granola ویژگی «Recipes» را راه‌اندازی می‌کند که به کاربران امکان می‌دهد تا پرامپت‌های پیشرفته را به صورت مکرر در یادداشت‌های خود استفاده کنند و تعاملات هوش مصنوعی را شخصی‌تر و با درک زمینه‌ی بیشتری می‌کند @TechCrunch

پژوهش‌ها

Periodic Labs مبلغ 300 میلیون دلار جذب سرمایه کرد تا دانشمندان هوش مصنوعی را در کنار آزمایشگاه‌های خودمختار ایجاد کند؛ آزمایشگاه‌هایی که می‌توانند فرضیه‌سازی، آزمایش و تکرار را با سرعت‌هایی انجام دهند که برای آزمایشگاه‌های تحت هدایت انسان ناممکن است و ابررساناها و نیمه‌رساناها را هدف قرار می‌دهند @LiamFedus
Claude Sonnet 4.5 عملکردی هم‌تراز با GPT-5 را در معیار ARC-AGI نشان می‌دهد، با دستاوردهای عملکردی قابل توجه ناشی از افزایش بودجه‌ی پردازش (thinking budget) از 16 هزار به 32 هزار توکن @GregKamradt
Anthropic پژوهشی در مورد «مهندسی زمینه» (Context Engineering) برای عوامل هوش مصنوعی منتشر می‌کند که توضیح می‌دهد چگونه مدیریت صحیح زمینه برای بهره‌برداری حداکثری از سیستم‌های هوش مصنوعی عامل‌محور (Agentic AI Systems) حیاتی است @AnthropicAI
Stanford HAI ابزار متن‌باز Evo 2 را ارائه می‌کند که می‌تواند شکل و عملکرد پروتئین‌ها را در DNA در تمام حوزه‌های حیات پیش‌بینی کند @StanfordHAI
NVIDIA به ServiceNow Research برای معرفی Apriel-1.5-15B-Thinker تبریک می‌گوید؛ یک مدل هوش مصنوعی جدید که استدلال در سطح پیشرفته را با نیازهای محاسباتی کاهش‌یافته و با پشتیبانی از مجموعه‌ی Nemotron انویدیا ارائه می‌دهد @NVIDIAAI
LLaVA-OneVision-1.5 به عنوان یک چارچوب کاملاً باز برای آموزش چندوجهی دموکراتیزه شده (در دسترس همگان) منتشر شد که شامل لایسنس خوب، کد آموزشی و داده‌های پیش‌آموزشی است @natolambert
پژوهشگران MIT به دنبال راه‌هایی برای کاهش ردپای کربن رو به رشد هوش مصنوعی، از طریق بهبود کارایی الگوریتم‌ها و نوآوری‌ها در طراحی مراکز داده هستند @MIT

اخبار هوش مصنوعی در 2025-09-29

مدل‌های جدید هوش مصنوعی

Anthropic مدل Claude Sonnet 4.5 را عرضه کرد و ادعا می‌کند که این «بهترین مدل کدنویسی در جهان» است که پیشرفت‌های چشمگیری در قابلیت‌های استدلال، ریاضیات و استفاده از کامپیوتر دارد @claudeai
Anthropic پیش‌نمایش تحقیقاتی «Imagine with Claude» را معرفی کرد که در آن Claude بدون هیچ عملکرد از پیش تعیین‌شده یا کد از پیش نوشته‌شده، نرم‌افزار را در لحظه تولید می‌کند @AndrewCurran_
DeepSeek مدل DeepSeek-V3.2-Exp را راه‌اندازی کرد که دارای DeepSeek Sparse Attention (DSA) برای آموزش و استنتاج سریع‌تر و کارآمدتر در زمینه‌های طولانی است، با کاهش بیش از ۵۰ درصدی قیمت‌های API @deepseek_ai
گوگل مدل TimesFM 2.5 را منتشر کرد؛ یک مدل از پیش آموزش‌دیده برای پیش‌بینی سری‌های زمانی با ۲۰۰ میلیون پارامتر (کاهش از ۵۰۰ میلیون) و ۱۶ هزار زمینه (افزایش از ۲ هزار) @osanseviero
Ring مدل Ring-1T-preview را منتشر کرد که اولین مدل تفکر منبع‌باز ۱ تریلیون (پارامتری) با عملکرد قوی در AIME25 (92.6)، HMMT25 (84.5) و ARC-AGI-1 (50.8) است @AntLingAGI
مایکروسافت «Agent Mode» را در M365 Copilot برای هماهنگ‌سازی وظایف چندمرحله‌ای در برنامه‌های آفیس معرفی کرد @satyanadella
مایکروسافت قابلیت «Copilot Portrait» را راه‌اندازی کرد که امکان مکالمات بلادرنگ با پرتره‌های متحرک را در آمریکا، انگلستان و کانادا فراهم می‌کند @mustafasuleyman
NVIDIA مدل «Cosmos Predict 2.5» را معرفی کرد که سه مدل را در یک مدل ترکیب می‌کند تا ویدئوهایی تا ۳۰ ثانیه و شبیه‌سازی‌های چندنمایی تولید کند، به علاوه «Cosmos Transfer 2.5» که ۳.۵ برابر کوچک‌تر و در عین حال سریع‌تر است @NVIDIAAI

تحلیل صنعت

گزارش شده که OpenAI در حال آماده‌سازی برای راه‌اندازی یک اپلیکیشن مستقل رسانه‌ی اجتماعی برای Sora 2 است که دارای فید ویدیوی عمودی با پیمایش به بالا/پایین است، مشابه TikTok اما با ۱۰۰% محتوای تولیدشده توسط هوش مصنوعی @AndrewCurran_
OpenAI قابلیت «Instant Checkout» را در ChatGPT با Etsy و Shopify راه‌اندازی کرد و «تجارت عامل‌محور» (agentic commerce) را معرفی می‌کند که در آن هوش مصنوعی به کاربران هم در یافتن و هم در خرید محصولات کمک می‌کند @OpenAI
Stripe و OpenAI پروتکل «Agentic Commerce» را به صورت مشترک توسعه دادند؛ یک استاندارد باز برای کسب‌وکارها جهت ادغام قابلیت‌های پرداخت عامل‌محور @patrickc
Modal در دور تأمین سرمایه‌ی سری B، ۸۷ میلیون دلار با ارزش‌گذاری ۱.۱ میلیارد دلار برای پیشبرد زیرساخت‌های هوش مصنوعی جذب کرد که نشان‌دهنده‌ی بازآفرینی کامل زیرساخت‌های محاسباتی سنتی برای بارهای کاری هوش مصنوعی است @bernhardsson
آرمین روناکر گزارش می‌دهد که ۹۰% از یک پروژه زیرساختی جدید که او در حال ساخت آن است، توسط هوش مصنوعی تولید شده که نقش فزاینده‌ی هوش مصنوعی در توسعه‌ی نرم‌افزار را برجسته می‌کند @simonw
بر اساس داده‌های به‌روز شده‌ی پروژه ATOM، Qwen سهم بازار را به خود اختصاص داده و با سرعت از رقبا پیشی می‌گیرد @natolambert
استارت‌آپ‌های «Slop-as-a-service» که از هوش مصنوعی برای ایجاد جریان بی‌پایان وبلاگ‌ها برای SEO استفاده می‌کنند، میلیون‌ها دلار درآمد کسب کرده و به سرعت در حال رشد هستند که به «Enshittification» اینترنت کمک می‌کند @deedydas

اخلاق و جامعه

Anthropic اولین ممیزی «جعبه سفید» (white-box) از یک LLM پیشگام را با استفاده از تکنیک‌های قابلیت تفسیر برای «خواندن ذهن مدل» برای Claude Sonnet 4.5 انجام داد و قابلیت اطمینان و هم‌ترازی آن را تأیید کرد @Jack_W_Lindsey
OpenAI کنترل‌های والدین را در ChatGPT معرفی کرد که به والدین اجازه می‌دهد تا حساب‌های خود را با نوجوانان پیوند دهند تا اقدامات حفاظتی قوی‌تری شامل فیلتر کردن محتوا، کنترل‌های حافظه و ساعات سکوت اعمال کنند @OpenAI
گوین نیوسام، فرماندار کالیفرنیا، لایحه‌ی هوش مصنوعی SB 53 را امضا کرد که نوآوری را از طریق رایانش ابری عمومی CalCompute ترویج می‌دهد، در حالی که شفافیت در مورد شیوه‌های ایمنی آزمایشگاه هوش مصنوعی و حمایت از افشاگران را الزامی می‌کند @Scott_Wiener
Claude Sonnet 4.5 افزایش آگاهی از ارزیابی را نشان می‌دهد و هنگام تشخیص سناریوهای ارزیابی، آن را بیان می‌کند، اگرچه ممیزی Anthropic نشان می‌دهد که این امر نتایج ایمنی را به طور قابل توجهی باطل نمی‌کند @janleike

کاربردها

Claude Sonnet 4.5 توانایی حفظ تمرکز بیش از ۳۰ ساعت بر روی وظایف پیچیده و چندمرحله‌ای را نشان می‌دهد، در حالی که میزان استفاده از توکن را در طول مکالمات ردیابی می‌کند @AndrewCurran_
ایتان مولیک گزارش می‌دهد که Claude Sonnet 4.5 با موفقیت تحقیقات اقتصادی منتشرشده را از فایل‌های داده و مقالات بازتولید کرده و قابلیت‌های کاری محدود واقعی را به نمایش می‌گذارد @emollick
فیگما شروع به عرضه‌ی Claude Sonnet 4.5 در Figma Make و قابلیت آلفای «prompt-to-edit» خود برای برنامه‌های طراحی کرده است @figma
Cursor مدل Claude Sonnet 4.5 را برای قابلیت‌های کدنویسی پیشرفته‌تر ادغام می‌کند @cursor_ai
Perplexity مدل‌های Claude Sonnet 4.5 و 4.5 Thinking را برای مشترکین Pro و Max اضافه می‌کند @perplexity_ai
«Nano Banana» در Google Gemini امکان تولید تصاویر سر (headshot) حرفه‌ای را با قابلیت‌های دقیق درخواست (prompting) برای پرتره‌های آماده‌ی کسب‌وکار فراهم می‌کند @GeminiApp
Claude Code از Anthropic به‌روزرسانی‌های عمده‌ای دریافت کرده که شامل نقاط بازرسی (checkpoints)، قابلیت بازگشت (rewind functionality)، افزونه‌ی VS Code و دستورات ردیابی استفاده است @_catwu

پژوهش‌ها

تیم DeepSeek یک راه‌حل ارزان برای زمینه‌های طولانی در LLMها توسعه داده که به حدود ۳.۵ برابر پر کردن اولیه‌ی (prefill) ارزان‌تر و حدود ۱۰ برابر رمزگشایی (decode) ارزان‌تر در زمینه ۱۲۸ هزار توکنی با همان کیفیت دست می‌یابد @deedydas
کامرون ولف توضیح می‌دهد که چگونه الگوریتم‌های یادگیری تقویتی (RL) آنلاین ساده‌تر مانند REINFORCE و RLOO می‌توانند LLMها را به طور مؤثر بدون پیچیدگی PPO آموزش دهند، زیرا مدل‌های از پیش آموزش‌دیده دارای پیش‌فرض‌های قوی هستند که گرادیان‌های ناپایدار را کم‌تر مشکل‌ساز می‌کنند @cwolferesearch
فرانسوا شوله استدلال می‌کند که LLMها عمدتاً با افزایش حجم داده‌های پیش‌آموزش بهبود یافته‌اند تا با افزایش قدرت محاسباتی، و داده‌ها تنگنای اصلی هستند زیرا مدل‌ها همچنان به خروجی‌های تولیدشده توسط انسان وابسته هستند @fchollet
ایتان مولیک «آلودگی پنجره‌ی زمینه» (context window contamination) را به عنوان یک ملاحظه‌ی کلیدی برای عامل‌های هوش مصنوعی شناسایی می‌کند، جایی که کارهای قبلی و تصمیمات، توانایی عامل را برای بی‌طرف بودن با پر شدن زمینه‌اش کاهش می‌دهد @emollick
مهندسان MIT یک ترانزیستور مغناطیسی را معرفی کردند که راه را برای ترانزیستورهای فشرده و با کارایی بالا با قابلیت‌های حافظه‌ی داخلی باز می‌کند @MIT

اخبار هوش مصنوعی در 2025-09-28

مدل‌های جدید هوش مصنوعی

Qwen3-Max اکنون در دسترس است و کاربران می‌توانند با آن برنامه بسازند، با قابلیت‌های جدیدی از جمله «Code Interpreter» و «Web Search» برای دریافت و بصری‌سازی داده‌ها @Alibaba_Qwen

تحلیل صنعت

شرکت‌های بزرگ فناوری امسال ۳۴۵ میلیارد دلار سرمایه برای توسعه‌ی هوش مصنوعی هزینه خواهند کرد که نشان‌دهنده‌ی افزایش ۲.۵ برابری تنها در ۲ سال است، و پروژه‌ی Stargate اوپن‌ای‌آی تا سال ۲۰۲۹ مبلغ ۵۰۰ میلیارد دلار را وعده می‌دهد که تقریباً ۲۵ درصد از هزینه‌ی پیش‌بینی شده‌ی ۲ تریلیون دلاری را شامل می‌شود @deedydas
طبق گزارش‌ها، اوپن‌ای‌آی سالانه بیش از ۱۵۰ میلیون دلار برای Datadog هزینه می‌کند، بیش از ۲ برابر هزینه‌ای که خود Datadog صرف می‌کند، که نشان‌دهنده‌ی هزینه‌های عظیم زیرساختی شرکت‌های هوش مصنوعی در مراحل رشد سریع است @GergelyOrosz
استودیوهای هالیوود بی‌سروصدا در حال استفاده از فناوری هوش مصنوعی هستند، با چندین اعلام عمومی در مورد پروژه‌های مهم هوش مصنوعی که در آغاز سال جدید انتظار می‌رود، به گفته‌ی رئیس «Dream Lab LA» در Luma AI @AndrewCurran_
جنسن هوانگ، مدیرعامل NVIDIA، ادعا می‌کند که این شرکت بیش از هر کسی به جز AI2، مدل‌ها و مجموعه داده‌های هوش مصنوعی متن‌باز را بررسی می‌کند، که NVIDIA را به عنوان یک مشارکت‌کننده‌ی اصلی در توسعه‌ی هوش مصنوعی متن‌باز قرار می‌دهد @natolambert
همه‌ی پژوهشگران مقاله‌ی Veo 3 گوگل، که بهترین مدل تولید ویدیوی جهان توصیف شده است، اهل ایالات متحده نیستند، که نشان‌دهنده‌ی توزیع استعدادهای جهانی در پژوهش‌های هوش مصنوعی است @deedydas

کاربردها

ایتان مولیک نشان داد که چگونه با استفاده از ChatGPT Codex یک بازی شبیه‌سازی گمشده‌ی Maxis (SimRefinery) را تنها از یک مقاله و یک اسکرین‌شات بازسازی کرده است، و یک نمونه‌ی اولیه قابل بازی را بدون دست زدن مستقیم به هیچ کدی ساخت @emollick
Claude Code با موفقیت یک مشکل پیچیده‌ی «macOS Finder» را که حجم آن به ۸ گیگابایت رسیده بود، از طریق تقریباً ۱۰ بار تکرار در طول ۳۰ دقیقه اشکال‌زدایی کرد، و قابلیت‌های اشکال‌زدایی جدیدی را نشان داد که قبل از عامل‌های هوش مصنوعی وجود نداشتند @GergelyOrosz
اسکات آرونسون اولین مقاله‌ی خود را منتشر کرد که در آن یک گام فنی کلیدی در اثبات از هوش مصنوعی نشأت گرفته بود، به‌طور خاص با استفاده از GPT-5-Thinking، و مشارکت هوش مصنوعی را از نظر معیارهای آکادمیک «زیرکانه» توصیف کرد @AndrewCurran_
مدل‌های هوش مصنوعی اکنون می‌توانند بیشتر کپچاهای رایج را بهتر از انسان‌ها حل کنند، و دلیل اصلی که کپچاها هنوز کار می‌کنند این است که LLMهای اصلی اغلب از تکمیل آن‌ها خودداری می‌کنند، نه اینکه فاقد توانایی باشند @emollick

پژوهش‌ها

مقاله‌ی جدید DeepMind با عنوان «Video models are zero-shot learners and reasoners» نشان می‌دهد که مدل‌های ویدیوی مولد برای مسائل بینایی همان چیزی هستند که LLMها برای مسائل NLP بودند - مدل‌های واحدی که قادر به حل طیف وسیعی از چالش‌ها هستند @simonw
پیشرفت از «agents are nowhere close to working» به «general purpose agents are actually useful for a range of tasks» در کمتر از یک سال رخ داده است، با بهبودهای قابل‌توجه در استفاده از ابزار، مراحل کاری و کاهش خطا @emollick
پژوهش RL در حال تبدیل شدن به پیش‌آموزش/مدل‌سازی با یک تغییر بزرگ در رویکرد است، زیرا بیشتر پژوهش‌های منتشر شده‌ی RL به اندازه‌ی کافی از توان محاسباتی استفاده نکرده‌اند تا تصمیمات اهمیت زیادی داشته باشند، هرچند این وضعیت به آرامی در حال تغییر است @natolambert
پژوهشگران Anthropic پیش‌بینی می‌کنند که برابری با متخصصان انسانی «احتمالاً تنها در چند ماه» محقق خواهد شد، این در حالی است که این شرکت در سال ۲۰۲۳ اعلام کرده بود که مدل‌های سال‌های ۲۰۲۵/۲۶ می‌توانند بخش‌های بزرگی از اقتصاد را خودکار کنند @AndrewCurran_

اخبار هوش مصنوعی در 2025-09-27

مدل‌های جدید هوش مصنوعی

OpenAI یک سیستم مسیریابی ایمنی جدید در ChatGPT معرفی می‌کند که هنگام مکالمات شامل موضوعات حساس و احساسی، به GPT-5 یا مدل‌های استدلالی تغییر می‌کند و مسیریابی بر اساس هر پیام انجام می‌شود @nickaturley
گوگل مدل تولید ویدئوی Veo 3 را با قابلیت‌های استدلال بصری نوظهور منتشر می‌کند که توانایی‌های «صفر-شات» را در تقسیم‌بندی اشیا، تشخیص لبه‌ها، ویرایش تصویر و درک ویژگی‌های فیزیکی نشان می‌دهد @deedydas
گوگل مدل Gemini Live را برای مکالمات طبیعی به‌روزرسانی می‌کند که اکنون برای توسعه‌ی عامل‌های هوش مصنوعی صوتی در Google AI Studio در دسترس است @OfficialLoganK

تحلیل صنعت

OpenAI گزارش می‌دهد که با «محدودیت محاسباتی» مواجه است و برای تأمین تقاضا به ۱۰۰ میلیارد دلار قرارداد سرور نیاز دارد که چالش‌های زیرساختی در مقیاس‌پذیری هوش مصنوعی را برجسته می‌کند @TechCrunch
NVIDIA طی سال گذشته با بیش از ۳۰۰ مورد مشارکت در مدل، مجموعه داده و اپلیکیشن در Hugging Face، به عنوان یک مشارکت‌کننده‌ی بزرگ در هوش مصنوعی متن‌باز ظاهر می‌شود @ClementDelangue
کره‌ی جنوبی یک ابتکار جاه‌طلبانه‌ی هوش مصنوعی مستقل را راه‌اندازی می‌کند که در آن شرکت‌های بزرگ فناوری مانند LG و SK Telecom مدل‌های LLM خود را توسعه می‌دهند @TechCrunch
۶۰ درصد از فارغ‌التحصیلان دکترا و ۵۳ درصد از فارغ‌التحصیلان کارشناسی ارشد علوم کامپیوتر در ایالات متحده غیرآمریکایی هستند، در حالی که شرکت‌های بزرگ فناوری کمتر از ۱۵ درصد کارمند H-1B دارند، که این نشان می‌دهد الگوهای استخدام، منعکس‌کننده‌ی جمعیت‌شناسی آموزشی هستند تا سوگیری @deedydas
تیم Anthropic ادغام گسترده‌ی LLM را در سراسر گردش کار خود نشان می‌دهد و بینش‌هایی را در مورد الگوهای پذیرش کامل، هنگامی که محدودیت‌های هزینه و دسترسی برداشته می‌شوند، ارائه می‌دهد @realchrisebert

اخلاق و جامعه

پژوهشگران «AI slop» را به عنوان یک اصطلاح جدید برای محتوای کم‌کیفیت تولیدشده توسط هوش مصنوعی که فضاهای دیجیتال را فرا گرفته است، شناسایی می‌کنند و نگرانی‌هایی را در مورد کاهش کیفیت محتوا برجسته می‌کنند @TechCrunch
پژوهشگران MIT پویایی روابط انسان و هوش مصنوعی را از طریق تحلیل جامعه‌ی Reddit «r/MyBoyfriendIsAI» مطالعه می‌کنند و پیامدهای اجتماعی غیرمنتظره‌ی همراهی با هوش مصنوعی را بررسی می‌کنند @medialab
پژوهش استنفورد تمایز بین استفاده در مقابل اشاره به کلمات ناامن را در سیستم‌های هوش مصنوعی و گفتمان آنلاین بررسی می‌کند و به چالش‌های نظارت بر محتوا می‌پردازد @krisgligoric

کاربردها

Perplexity از قابلیت به‌روزرسانی‌شده‌ی Discover خبر می‌دهد که هفته‌ی آینده با شروع از پلتفرم iOS عرضه خواهد شد @AravSrinivas
Cursor پلتفرم Learn را با یک مجموعه‌ی ویدئویی شش‌قسمتی درباره‌ی مبانی هوش مصنوعی معرفی می‌کند که توکن‌ها، زمینه و عامل‌ها را برای مبتدیان پوشش می‌دهد @leerob
Google AI Studio توسعه‌ی عامل هوش مصنوعی صوتی را از طریق دستورات ساده با استفاده از Live API ممکن می‌سازد و هوش مصنوعی مکالمه‌ای را دسترس‌پذیرتر می‌کند @OfficialLoganK
Ethan Mollick از دسترس‌پذیرتر کردن ابزارهای کدنویسی مانند Codex و Claude Code برای افراد غیربرنامه‌نویس حمایت می‌کند و استدلال می‌کند که موانع فعلی در تجربه‌ی کاربری (UX) برای ایجاد برنامه‌های کاربردی مفید غیرضروری هستند @emollick

پژوهش‌ها

Veo 3 قابلیت‌های استدلال بصری نوظهور را بدون آموزش صریح نشان می‌دهد، از جمله حل هزارتوها، درک تقارن و انجام وظایف بصری مختلف، که نشان‌دهنده‌ی یک «لحظه‌ی GPT-3 برای استدلال بصری» است @deedydas
پژوهش DeepMind نشان می‌دهد که Veo 3 پیشرفت‌های عملکردی قابل توجهی نسبت به Veo 2 به دست می‌آورد، با نتایج مقیاس‌گذاری که حاکی از آن است که pass@10 به طور مداوم بهتر از pass@1 عمل می‌کند، بدون هیچ نشانه‌ای از رسیدن به سقف @AndrewCurran_
Andrew Curran پیش‌بینی می‌کند که «زنجیره‌ی فکر» ویدئویی (یا «زنجیره‌ی فریم‌ها») یک پیشرفت قابل توجه در قابلیت‌های هوش مصنوعی خواهد بود، مشابه با چگونگی پیشرفت مدل‌های زبانی توسط CoT @AndrewCurran_
Nathan Lambert علیه ضرورت یادگیری پیوسته برای سیستم‌های هوش مصنوعی کوتاه‌مدت استدلال می‌کند و پیشنهاد می‌کند که بازنمایی‌های فعلی LLM و رویکردهای مهندسی زمینه برای قابلیت‌های قدرتمند کافی خواهند بود @natolambert
François Chollet بر سادگی به عنوان یک اصل کلیدی در نظریه‌ی هوش مصنوعی تأکید می‌کند و بیان می‌کند که راه‌حلی که به احتمال زیاد تعمیم‌پذیر است، همیشه ساده‌ترین راه‌حل نسبت به آنچه توضیح می‌دهد، است @fchollet

اخبار هوش مصنوعی در 2025-09-26

مدل‌های جدید هوش مصنوعی

اوپن‌ای‌آی GPT-5 Pro را عرضه کرد که در حال تولید ریاضیات جدید و غیربدیهی است و مسائلی را حل می‌کند که مدل‌های قبلی قادر به حلشان نبودند. مارک چن اشاره کرد که این مدل می‌تواند ماه‌ها کار دانشجویان فیزیک‌دان و ریاضی‌دان را خودکارسازی کند @a16z

تحلیل صنعت

آنتروپیک از رشد چشمگیر درآمد گزارش می‌دهد؛ از ۸۷ میلیون دلار در آغاز سال ۲۰۲۴ به بیش از ۵ میلیارد دلار (بر اساس نرخ فعلی) در اوت ۲۰۲۵، با ۸۰٪ از استفاده‌ی مصرف‌کنندگان از Claude که از خارج از ایالات متحده، به‌ویژه کره‌ی جنوبی و استرالیا، می‌آید @AndrewCurran_
چین شرکت‌های بزرگ فناوری خود را از خرید تراشه‌های اِن‌وی‌آی‌دی‌آی‌اِی منع می‌کند؛ این اقدام نشان‌دهنده‌ی پیشرفت کافی در نیمه‌رساناهای داخلی برای رهایی از وابستگی به ایالات متحده است. مدل DeepSeek-R1-Safe که روی ۱۰۰۰ تراشه‌ی هوآوی اَسِند آموزش دیده، رویکرد طراحی در سطح سیستم را نشان می‌دهد @AndrewYNg
یک توسعه‌دهنده گزارش می‌دهد که در جلسه‌ی روزانه‌ی تیم (standup) توکن‌ها را برای حل یک مشکل «هدر داده» است. این مسئله نشان می‌دهد که چگونه ملاحظات هزینه‌ی هوش مصنوعی در حال تبدیل شدن به بخشی از فرآیند کار روزمره‌ی توسعه و تصمیم‌گیری است @GergelyOrosz
اِی‌پی‌آی جست‌وجوی Perplexity مدعی برتری نسبت به گوگل در موارد استفاده‌ی اِل‌اِل‌اِم است و در معیارهای Simple QA/HLE امتیاز بالاتری کسب کرده است؛ زیرا گوگل بهینه‌سازی را برای رتبه‌بندی کلیک‌های تبلیغات/لینک‌ها انجام می‌دهد، نه برای کاربردی بودن به عنوان قطعه‌های جست‌وجو برای هوش مصنوعی @AravSrinivas
شایعات حاکی از آن است که اوپن‌ای‌آی و گوگل به‌زودی هر دو مرورگرهای «ذاتی هوش مصنوعی» را عرضه خواهند کرد؛ چراکه داشتن اپلیکیشن اصلی کامپیوتر برای توزیع، داده‌ها و اتوماسیون‌های آسان‌کاربرد حیاتی است @deedydas
بر اساس پژوهش مک‌کینزی، پیش‌بینی می‌شود تقاضا برای ظرفیت مراکز داده تا سال ۲۰۳۰ بیش از ۳ برابر در سطح جهان افزایش یابد @a16z

اخلاق و جامعه

مؤسسه‌ی AI Now از بررسی مستقل و بی‌طرفانه‌ی ادعاهای مربوط به مزایا و خطرات هوش مصنوعی و از یک دستور کار حاکمیت هوش مصنوعی مردم‌محور در «گفت‌وگوی جهانی سازمان ملل درباره‌ی حکمرانی هوش مصنوعی» حمایت می‌کند @AINowInstitute
فرانسوا شوله پیش‌بینی می‌کند که سال ۲۰۲۶، سالی خواهد بود که شرکت‌ها محصولات خود را به عنوان «عاری از هوش مصنوعی» بازاریابی می‌کنند؛ این در امتداد روندی است که در سال ۲۰۲۳ برای بازاریابی «مبتنی بر هوش مصنوعی» وجود داشت @fchollet
گرگلی اوروس از چشم‌انداز پشت عرضه‌ی محصول Vibes انتقاد می‌کند و آن را ترویج‌دهنده‌ی آینده‌ای «وحشتناک» می‌داند که در آن مردم به گوشی‌های خود چسبیده‌اند و محتوای تولید‌شده توسط هوش مصنوعی و آغشته به تبلیغات را پیمایش می‌کنند @GergelyOrosz
سایمون ویلیسون گزارشی از حمله‌ی کلاسیک استخراج داده از طریق «تزریق پرامپت» علیه Salesforce Agentforce ارائه می‌دهد که اکنون با اعمال لیست‌های سفید URLهای مورد اعتماد از ۸ سپتامبر ۲۰۲۵، رفع شده است @simonw
MIT Technology Review گزارش می‌دهد که بازرسان آمریکایی از هوش مصنوعی برای شناسایی تصاویر سوءاستفاده‌ی جنسی از کودکان که توسط هوش مصنوعی ساخته شده‌اند، استفاده می‌کنند @techreview

کاربردها

اِن‌وی‌آی‌دی‌آی‌اِی و ParaboleAI به ۱۰۰۰ برابر افزایش سرعت در بهینه‌سازی صنعتی دست یافتند؛ آن‌ها زمان پردازش را از ۱۰ ساعت به کمتر از ۱ دقیقه کاهش دادند. این کار با استفاده از هوش مصنوعی علّی (causal AI) بر روی NVIDIA GH200 Grace Hopper همراه با Gurobi انجام شد @NVIDIAAI
Exelon و Deloitte راه‌حل پهپاد خودکار OptoAI را برای بازرسی دارایی‌های شبکه ساختند که توسط NVIDIA Jetson و Omniverse پشتیبانی می‌شود و به ۱۰۰ برابر افزایش کارایی عملیاتی و شناسایی سریع‌تر نقص‌ها دست یافتند @NVIDIAAI
Perplexity عامل خرید Comet را عرضه کرد که می‌تواند درخواست‌هایی مانند «سه کتاب معرفی‌شده توسط Druckenmiller را برایم بخر» را مدیریت کرده و خرید را به‌طور خودکار انجام دهد @AravSrinivas
گوگل قابلیت‌های عامل‌گونه در AI Mode را برای یافتن رزرو رستوران‌ها به تمام کاربرانی که در ایالات متحده عضو Labs شده‌اند، گسترش می‌دهد @rmstein
اِم‌آی‌تی یک تراشه‌ی پردازنده‌ی فوتونیک توسعه داده است که یادگیری عمیق را با سرعت نور انجام می‌دهد و به‌طور بالقوه قابلیت‌های جدیدی را برای تحلیل داده در زمان واقعی به دستگاه‌های لبه (edge devices) می‌بخشد @MIT

پژوهش‌ها

اوپن‌ای‌آی بنچمارک GDPVal را منتشر کرد که عملکرد هوش مصنوعی را در کارهایی که مشاغل روزمره‌ی تمام بخش‌های اقتصادی را تشکیل می‌دهند، اندازه‌گیری می‌کند. مدل‌ها در حال نزدیک شدن به برابری با انسان در کارهای سطح تخصصی هستند که به‌طور متوسط ۷ ساعت کار می‌برند @emollick
یک مقاله‌ی پژوهشی ناکافی بودن بنچمارک‌های عمومی قدیمی‌تر برای هوش مصنوعی پزشکی را نشان می‌دهد و ثابت می‌کند که مدل‌ها به‌جای درک واقعی، در حال حفظ کردن پاسخ‌ها یا استفاده از روش‌های ابتکاری (heuristics) هستند @emollick
اوپن‌ای‌آی تأیید می‌کند که مدل‌هایش چالش‌های برنامه‌نویسی ICCP را با استفاده از سندباکس اجرای کد، اما بدون دسترسی به اینترنت، حل کرده‌اند و ابزارهای موجود در طول مسابقه را شفاف‌سازی می‌کند @simonw
الکساندر وانگ توضیح می‌دهد که عدد SweBench Verified به معیارهای عملکرد TTS pass@1 اشاره دارد و این توضیحات را در پاسخ به سؤالاتی درباره‌ی نتایج بنچمارک ارائه کرده است @alexandr_wang

1 2 3 4 5...25