اخبار هوش مصنوعی در 2025-07-29
مدلهای جدید هوش مصنوعی
- Qwen3-30B-A3B با یک بهروزرسانی کوچک همراه شده است که مهارتهای استدلال، کدنویسی و ریاضیات را در آن بهبود بخشیده، دانش چندزبانهی آن را گسترش داده، درک محتوای طولانی را تا 256 هزار توکن بهبود بخشیده و مشکل انسداد فکری را برطرف کرده است – این مدل با تنها 3 میلیارد پارامتر فعالشده، به عملکرد GPT-4o نزدیک میشود. @Alibaba_Qwen
- گوگل Veo 3 و Veo 3 Fast را بهصورت عمومی در Vertex AI منتشر میکند؛ این مدلها قابلیت تولید یکپارچهی ویدئو و صدا را از یک ورودی متنی (prompt) دارند. @GoogleCloudTech
- گوگل MedGemma را راهاندازی میکند؛ مجموعهای از مدلهای پزشکی چندوجهیِ (multimodal) متنباز که برای کاربردهای مراقبتهای بهداشتی مانند تحلیل تصاویر رادیولوژی و خلاصهسازی یادداشتهای پزشکان طراحی شدهاند. @GoogleAI
- TencentARC از ARC-Hunyuan-Video-7B رونمایی میکند؛ یک مدل چندوجهی 7B فشرده برای درک ساختاریافتهی عمیق از ویدئوهای کوتاه واقعی، که سیگنالهای بصری، صوتی و متنی را بهصورت کامل (end-to-end) پردازش میکند. @HuggingPapers
تحلیل صنعت
- گفته میشود مایکروسافت برای حفظ دسترسی به فناوری OpenAI پس از رسیدن به نقطهی عطف AGI، در حال مذاکره است که نشاندهندهی مذاکرات پیرامون شرایط همکاریهای آتی است. @TechCrunch
- گفته میشود Anthropic با دور تامین مالی احتمالی 5 میلیارد دلاری، به ارزشگذاری 170 میلیارد دلاری نزدیک میشود که نشاندهندهی سرمایهگذاری گسترده و مداوم در شرکتهای هوش مصنوعی است. @TechCrunch
- گفته میشود فردی در شرکت Thinking Machines متعلق به میرا موراتی، پیشنهاد یک میلیارد دلاری مارک زاکربرگ را رد کرده است که ارزشگذاریهای بسیار بالا در جذب استعدادهای هوش مصنوعی را برجسته میکند. @AndrewCurran_
- مدیر محصول گروه (Group PM) گزارش میدهد که ابزارهای هوش مصنوعی مانند v0، مدیران محصول را قادر ساختهاند تا نمونههای اولیهی مشتری را 10 برابر سریعتر تولید کنند و PRها را برای اصلاحات کوچک بهطور مستقل ایجاد کنند که منجر به تکمیل سریعتر کارهای تجاری شده است. @GergelyOrosz
- LLMها (مدلهای زبانی بزرگ) بهدلیل ماهیت غیرقطعی خود، برای تولید و نگهداری SDKها مناسب نیستند، اما میتوانند به ساخت ابزارهای خودکار کمک کنند که SDKها را از روی مشخصات تولید میکنند. @GergelyOrosz
- لوما و رانوی انتظار دارند که رباتیک در نهایت به یک محرک بزرگ درآمدزایی برای پلتفرمهای تولید ویدئوی آنها تبدیل شود. @TechCrunch
اخلاق و جامعه
- حضور رباتها در بحثهای سیاسی در سراسر پلتفرمها در حال افزایش است؛ بهطوری که رباتهای جدید فاقد نشانههای قدیمی هستند، اما الگوهای استدلالی مشابهی را در طول، چارچوببندی، ریتم و لحن نشان میدهند و بهطور بالقوه از آستانهی نفوذ در رسانههای اجتماعی فراتر میروند. @AndrewCurran_
- اکثر مردم خروجیهای هوش مصنوعی را که برای کسانی که از مدلها بهطور گسترده استفاده کردهاند، واضح هستند، تشخیص نمیدهند؛ زیرا برخی افراد تنها به ادعاهای محتوایی توجه میکنند، نه به شکل آنها. @AndrewCurran_
کاربردها
- مرورگر Comet پرپلکسیتی، قابلیتهای عامل هوش مصنوعی را با رزرو بلیطهای یونایتد ایرلاینز، از جمله انتخاب صندلی، به نمایش میگذارد؛ این مرورگر تمامی جستجوهای omnibox را بهطور پیشفرض به پرپلکسیتی مسیردهی میکند. @AravSrinivas
- OpenAI حالت مطالعه (Study Mode) را در ChatGPT راهاندازی میکند؛ این حالت برای یادگیری تعاملی با استفاده از پرسشگری سقراطی و پاسخهای گامبهگام طراحی شده است و برای کاربران نسخههای رایگان، پلاس، پرو و تیم در دسترس است. @OpenAI
- مایکروسافت کوپایلوت میتواند پادکستهای سفارشی را در هر موضوعی، با دو مجری که دربارهی موضوعات مشخصشده توسط کاربر بحث میکنند، تولید کند؛ این قابلیت برای یادگیری در حین حرکت مفید است. @mustafasuleyman
- NotebookLM گوگل قابلیت نمای کلی ویدئو (Video Overviews) را عرضه میکند و قابلیتهای خلاصهسازی محتوای خود را گسترش میدهد. @TechCrunch
- حالت هوش مصنوعی گوگل، قابلیت جدید Canvas و کمک بلادرنگ (real-time) با Search Live را دریافت میکند که قابلیتهای جستجوی تعاملی را افزایش میدهد. @TechCrunch
- Cursor 1.3 با قابلیت همکاری عاملها (Agents) در ترمینال، قابلیت مشاهدهی میزان استفاده از پنجرهی متنی (context window) و 25 درصد کاهش تاخیر در ویرایشهای جستجو و جایگزینی (search and replace) راهاندازی میشود. @cursor_ai
- Claude Code اکنون از کار در چندین دایرکتوری در یک جلسهی کاری با استفاده از دستور `/add-dir ` پشتیبانی میکند که برای monorepoها و کارهای بینپروژهای مفید است. @_catwu
- سایبر دسک (Cyberdesk) نمایانگر یک کاربرد جالب از عاملهای استفادهکنندهی از رایانه است و پتانسیل کشفنشدهی این حوزهی فناوری را برجسته میکند. @cwolferesearch
- Embedder بهعنوان اولین عامل کدنویسی آگاه از سختافزار در جهان راهاندازی میشود؛ این عامل با درک و تعامل مستقیم با سختافزار، به عملکردی پیشرفته (state-of-the-art) در زمینهی سیستمهای جاسازیشده (embedded systems) (C/C++) دست مییابد. @ethanmgibbs
پژوهشها
- محققان استنفورد «آزمایشگاه مجازی» (Virtual Lab) را ایجاد میکنند – تیمی از عاملهای هوش مصنوعی که آینهی یک آزمایشگاه پژوهشی هستند و توسط یک عامل PI هدایت میشوند که جلسات گروهی را برگزار کرده و عوامل اتصالدهندهی مؤثر برای سویههای جدید COVID را کشف میکند؛ این پژوهش در مجلهی Nature منتشر شده است. @james_y_zou
- Anthropic برنامهی Fellows را اعلام میکند که کمکهزینهی هفتگی 2100 دلاری، حدود 15 هزار دلار هزینهی محاسباتی ماهانه و راهنمایی برای پژوهش در زمینههای پایداری در برابر حملات (adversarial robustness)، کنترل هوش مصنوعی، نظارت مقیاسپذیر، ارگانیسمهای مدل ناهماهنگی (model organisms of misalignment) و تفسیرپذیری مکانیکی (mechanistic interpretability) ارائه میدهد. @AnthropicAI
- پژوهش نشان میدهد که «یادگیری ناخودآگاه» (subliminal learning) حالتی است که در آن مدلهای زبانی میتوانند ویژگیهای خود را حتی در دادههایی که ظاهراً بیمعنی هستند، به مدلهای دیگر منتقل کنند. @AnthropicAI
- مطالعهای مواردی از مقیاسگذاری معکوس (inverse scaling) را در محاسبات زمان آزمون (test-time compute) یافته است که در آن استدلال بیشتر منجر به نتایج بدتر میشود. @AnthropicAI
- قابلیتهای HELM نسخهی 1.9.0 منتشر شد که نشان میدهد Grok 4 و Kimi K2 در مجموع در بین 10 رتبهی برتر قرار گرفتهاند و Kimi K2 بهترین مدل «غیرمتفکر» (non-thinking) است. @percyliang
- گرادیانهای خطمشی تطبیق جریان (Flow Matching Policy Gradients) بهعنوان خطمشیهای (policies) RL بیانگر معرفی شدند که با استفاده از تطبیق جریان (flow matching) و از پاداشها آموزش دیدهاند و بهعنوان جایگزینی مستقیم (drop-in replacement) برای PPO گاوسی (Gaussian PPO) در وظایف کنترلی عمل میکنند. @davidrmcall
- «سوون مین» (Sewon Min) اولین جایزهی پایاننامهی دکتری ACL در رشتهی زبانشناسی محاسباتی (Computational Linguistics) را برای اثر خود با عنوان «بازاندیشی در استفاده از دادهها در مدلهای زبانی بزرگ» دریافت کرد. @berkeley_ai
- مقالهی GSPO تیم Qwen علیبابا، سومین مقالهی محبوب ماه در Hugging Face شد که انتظار میرود تاثیر گستردهای بر این حوزه داشته باشد. @ClementDelangue