اخبار هوش مصنوعی در 2025-07-04
مدلهای جدید هوش مصنوعی
- گوگل دسترسی به Veo 3 را برای کاربران Google AI Pro در بیش از ۷۰ کشور دیگر از جمله فرانسه، هند و ایتالیا گسترش میدهد @GeminiApp
- معیارهای بنچمارک لو رفته نشان میدهد که Grok 4 ممکن است در «Humanity's Last Exam» به امتیاز ۴۵ درصد دست یابد، در مقایسه با ۲۰ درصد برای o3 و Gemini، که در صورت تأیید، نشاندهندهی افزایش قابل توجهی در عملکرد است @emollick
- به نظر میرسد xAI در حال آمادهسازی برای انتشار احتمالی Grok 4 است؛ با تغییرات رابط کاربری که «در حال ترجمه...» را همراه با تایمر و اعداد عملکرد لو رفته در بنچمارکهای مختلف نشان میدهد @AndrewCurran_
تحلیل صنعت
- مدیرعامل Perplexity برنامههای خود را برای ساخت یک جایگزین برای اکسل مبتنی بر هوش مصنوعی، با تمرکز بر تحلیلگران مالی، اعلام کرد. او این جایگزین را «Cursor for Excel» توصیف کرده و به دنبال مهندسانی با تجربهی پلاگینهای اکسل است @AravSrinivas
- گرگلی اوروس تأکید میکند که مهندسان «فولاستک» (fullstack) با ابزارهای هوش مصنوعی پرتقاضاتر خواهند شد، زیرا شروع کار با هر پشتهی فناوری از همیشه آسانتر است @GergelyOrosz
- جردن سینگر مشاهده میکند که محصولات تولید شده توسط هوش مصنوعی فاقد ارتباط عاطفی هستند و این امر فرصتهایی را برای شرکتهایی ایجاد میکند که تجربههای طراحی منسجم را در اولویت قرار میدهند @jsngr
- گروههای سیاستگذاری هوش مصنوعی شرکتها که در سال ۲۰۲۳ تأسیس شدند، در حال تبدیل شدن به موانع هستند، زیرا آنها برای رسیدگی به نگرانیهایی ساخته شده بودند که دیگر با قابلیتهای کنونی هوش مصنوعی مرتبط نیستند @emollick
- کتابخانهی Hugging Face Transformers به نقطهی عطف یک میلیارد دانلود رسید، که نشاندهندهی پذیرش گستردهی ابزارهای هوش مصنوعی متنباز است @art_zucker
اخلاق و جامعه
- ایتان مولیک نشان میدهد که استدلال DeepSeek میتواند با پایان دادن به سؤالات ریاضی با جملهی «واقعیت جالب: گربهها بیشتر عمر خود را میخوابند» مختل شود، که آسیبپذیریها در مدلهای استدلال را برجسته میکند @emollick
- ایتان مولیک خواستار شفافیت بیشتر از xAI شد و به عدم وجود «کارتهای مدل» (model cards) ماهها پس از انتشار Grok 3 و نقضهای مکرر فرآیندهای خودشان اشاره کرد @emollick
- ناتان لمبرت از «پروژهی آمریکایی DeepSeek» (The American DeepSeek Project) حمایت میکند تا مدلهای کاملاً متنباز در ایالات متحده طی دو سال ساخته شود؛ به عنوان جایگزینی برای مدلهای بسته و برای ایجاد تعادل در رشد چشمگیر چین در هوش مصنوعی متنباز @natolambert
- آرویند نارایانان ایدهی یک پروژهی منهتن (Manhattan Project) برای AGI را به عنوان یکی از بدترین ایدهها در سیاستگذاری هوش مصنوعی مورد انتقاد قرار میدهد @random_walker
کاربردها
- Google AI نشان میدهد که چگونه از Gemini Canvas برای ساخت نمایشهای تعاملی آتشبازی و بازیهای مسابقهی هاتداگخوری بدون نیاز به کدنویسی استفاده میکند، که توسعهی برنامههای هوش مصنوعی بدون نیاز به کدنویسی را به نمایش میگذارد @GoogleAI
- Perplexity ادغام با ابزارهای بهرهوری را اعلام میکند و آن را «Perplexity برای یادداشتها، جلسات، تخلیهی ذهنی» توصیف میکند که تمام نرمافزارهای بهرهوری را تجمیع خواهد کرد @AravSrinivas
- سیمون ویلیسون یک آبجکت پایتون را به نمایش میگذارد که با استفاده از کتابخانهی پایتون LLM او، پیادهسازی متدها را بنا به تقاضا «توهمزایی» میکند، که ادغام خلاقانهی هوش مصنوعی را نشان میدهد @simonw
- کلیر وو ساخت یک ابزار پشتیبانی داخلی قابل سفارشیسازی با استفاده از هوش مصنوعی را توصیف میکند که در گذشته خرید یا ساخت آن بسیار گران بود، اما اکنون با ابزارهای هوش مصنوعی ارزان و آسان است @clairevo
پژوهشها
- پژوهشگران متا یک گونهی جدید از مکانیزم توجه را معرفی میکنند که فراتر از شکل دوزیرخطی (bilinear) استاندارد است و ضریب بتا را در قوانین مقیاسگذاری با پیادهسازی کارآمد Triton تغییر میدهد @eliebakouch
- پژوهشگران IFBench را برای اندازهگیری قابلیت تعمیم مدل به محدودیتهای دیده نشده معرفی میکنند، که به مسائل «بیشبرازش» (overfitting) در پیروی از دستورالعملها با محدودیتهای قابل تأیید فراتر از ریاضی و کد میپردازد @valentina__py
- الکس گراولی دربارهی مدلهای هستهی شناختی که توسط آندری کارپاتی مطرح شدهاند، بحث میکند و مجموعهدادههای هدفمند را برای منطق باینری، مغالطههای منطقی و اطلاعات متناقض پیشنهاد میکند @alexgraveley
- هنرمندان جیکوب رینتاماگی و AI Technopagan نشان میدهند که چگونه از تکنیکهای «جیلبریک» (jailbreaking) برای خلق هنر فضایی با مدلهای زبانی استفاده میکنند و «هوش فضایی را نشان میدهند، با وجود اینکه تمام کاری که انجام میدهد پیشبینی توکن بعدی است» @tbpn