اخبار هوش مصنوعی در 2025-05-11

مدل‌های جدید هوش مصنوعی

قابلیت‌های ‏o3 با عنوان «توانمندترین مدل روی زمین» با قابلیت‌های جستجوی پیشرفته، اجرای پایتون و قالب‌بندی برجسته شده است. @aidan_mclau

پژوهش‌ها

پژوهش در مورد «‏RL فقط با یک مثال آموزشی» نشان می‌دهد که مدل‌ها می‌توانند معیارهایی مانند ‏MATH500 را بدون بیش‌برازش (overfitting) بهبود بخشند، وقتی که به طور مکرر یک مسئله را حل می‌کنند. @alexgraveley
مقاله در مورد «تشخیص توکن جایگزین‌شده» به عنوان یک وظیفه پیش‌آموزشی با نمونه‌گیری کارآمدتر با استفاده از معماری مولد-تمیزدهنده، که از نظر محاسباتی کارآمدتر از مدل‌سازی زبان پوشانده‌شده است. @stanfordnlp
عملکرد ‏OLMo 32B بهتر از ‏Nemotron 340B و ‏Llama 3 70B است، که نشان می‌دهد مدل‌های کاملاً باز از نظر عملکرد به آن‌چه عموماً تصور می‌شود، نزدیک‌تر هستند. @natolambert

کاربردها

‏Human Behavior در حال ساخت یک هوش مصنوعی است که بازپخش جلسات را تجزیه و تحلیل می‌کند تا بفهمد چرا مشتریان در محصولات می‌مانند، تبدیل می‌شوند یا آن‌ها را ترک می‌کنند. @ycombinator
‏Claude 3.7 و ‏GPT-4.1 اکنون ساختن عامل‌ها را بسیار آسان‌تر می‌کنند. @alexgraveley
معماری زیرساخت و امنیت ‏Cursor در یادداشت‌هایی بر اساس مستندات پردازشگرهای فرعی آن‌ها به تفصیل شرح داده شده است. @simonw

تحلیل صنعت

گزارش شده است که مایکروسافت و ‏OpenAI در حال بازنگری قرارداد خود هستند و مایکروسافت پیشنهاد داده است که در ازای دسترسی مداوم به مدل‌های توسعه‌یافته پس از سال 2030، بخشی از سهام خود را واگذار کند. @AndrewCurran_ @TechCrunch
‏Gemma گوگل به 150 میلیون بارگیری و بیش از 70000 نوع مختلف در ‏Hugging Face رسیده است. @demishassabis
چارچوب ‏DSPy به عنوان حل‌کننده‌ی انتزاعات کلیدی برای هوش مصنوعی مدرن برجسته شده است، که پیاده‌سازی چندریختی مقیاس‌بندی استنتاج، یادگیری تقویتی ‏LLM و سایر قابلیت‌ها را امکان‌پذیر می‌کند. @stanfordnlp
آمازون از نقش‌های شغلی انسانی جدیدی که در یک محیط کار مبتنی بر هوش مصنوعی در حال ظهور هستند، رونمایی می‌کند. @TechCrunch

اخلاق و جامعه

آندری کارپاتی «یادگیری اعلان سیستمی» را به عنوان یک الگوی گمشده برای یادگیری ‏LLM پیشنهاد می‌کند، جایی که مدل‌ها به جای تکیه صرف بر به‌روزرسانی پارامترها، استراتژی‌های صریح حل مسئله را توسعه می‌دهند. @karpathy
مشخص شده است که اعلان سیستمی ‏Claude حدود 17000 کلمه است و نه تنها شامل ترجیحات رفتاری، بلکه استراتژی‌های دقیق حل مسئله نیز می‌شود. @karpathy
به دانشگاهیان توصیه می‌شود که با وادار کردن ‏o3 یا ‏Gemini 2.5 به نقد مقالات پژوهشی خود، قابلیت‌های هوش مصنوعی را آزمایش کنند. @emollick
نگرانی‌ها در مورد برنامه‌ریزی کارخانه در پرتو پیشرفت‌های بالقوه رباتیک که می‌تواند ترکیب‌های سنتی انسان/اتوماسیون را در عرض 5 سال منسوخ کند. @emollick

اخبار هوش مصنوعی در 2025-05-10

مدل‌های جدید هوش مصنوعی

انتظار می‌رود در ‏Google I/O 2025 (دو هفته‌ی دیگر) نسل بعدی مدل‌های Imagen و Veo به نمایش گذاشته شوند، مدل‌هایی که در نسخه‌های فعلی خود نیز در سطح جهانی قرار دارند. @AndrewCurran_
‏Gemini 2.5 Pro قابلیت‌های چشمگیری در درک ویدیو دارد و به کاربران اجازه می‌دهد لینک‌های ‏YouTube را در ‏AI Studio قرار داده و در مورد محتوای ویدیو سؤال بپرسند. @demishassabis

پژوهش‌ها

یک فراتحلیل از ۵۱ مقاله‌ی تجربی، تأثیرات مثبتی از ChatGPT بر عملکرد یادگیری، درک یادگیری و تفکر مرتبه‌ی بالاتر را در صورت استفاده‌ی مناسب تأیید می‌کند. @emollick
‏Gemini 2.5 Pro اکنون یک حالت ۶۶ توکن در هر فریم (به جای ۲۵۸ توکن) ارائه می‌دهد که امکان پردازش بیش از ۶ ساعت ویدیو (با ۱ فریم در ثانیه) را در محدوده‌ی ۲ میلیون توکن فراهم می‌کند. @JeffDean
محققان ‏MIT در حال پیشرفت در توسعه‌ی فناوری هوش مصنوعی هستند که پیش‌بینی‌های قابل اعتماد و مطمئن را در محیط‌های پرمخاطره مانند مراقبت‌های بهداشتی تضمین می‌کند. @MIT

کاربردها

‏o3 قابلیت‌های چشمگیری در ایجاد محتوای تقلیدی نوستالژیک نشان می‌دهد و اسکرین‌گراب‌های قانع‌کننده‌ای از برنامه‌های تلویزیونی و فیلم‌های تخیلی از دهه‌های مختلف تولید می‌کند. @emollick
‏llama.cpp پشتیبانی جدیدی از مدل‌های بینایی با باینری‌های ‏macOS منتشر کرده است که امکان اجرای مدل‌های بینایی را در یک ترمینال یا به عنوان یک رابط کاربری وب ‏localhost فراهم می‌کند. @simonw
‏Gemma 3 4B برای بینایی، با وجود اینکه فقط یک مدل ۳.۲ گیگابایتی برای دانلود است، قابلیت‌های چشمگیری را نشان می‌دهد. @simonw
‏YouLearn (@youlearnai) یک معلم خصوصی هوش مصنوعی است که با تبدیل مطالب به یادداشت‌های مختصر، ارائه‌ی یک معلم خصوصی هوش مصنوعی تعاملی و تولید آزمون‌های شخصی‌سازی‌شده، یادگیری را شخصی‌سازی می‌کند. @paulg @ycombinator
پنل Cascade Plugin از ‏Windsurf اتصال ‏Cascade به ابزارهای دیگر مانند ‏MongoDB و ‏Linear را آسان‌تر می‌کند. @windsurf_ai

تحلیل صنعت

با وجود روایت‌هایی مبنی بر اینکه هوش مصنوعی مشاغل فناوری را از بین می‌برد، شرکت‌هایی که به شدت از هوش مصنوعی استفاده می‌کنند (شرکت‌های بزرگ فناوری، استارت‌آپ‌های تحت حمایت ‏VC و شرکت‌های در حال توسعه) به طور مداوم استخدام فناوری را در دو سال گذشته افزایش داده‌اند. @GergelyOrosz
بنیانگذار ‏Fiverr ایمیلی به کل شرکت ارسال کرد و اعلام کرد: «هوش مصنوعی هر نقشی را مختل خواهد کرد، از جمله نقش خودم، و تنها کسانی که به طور فعال بر ابزارهای جدید هوش مصنوعی مسلط شوند، زنده خواهند ماند» - و به ‏Shopify و ‏Duolingo پیوست تا از کارمندان بخواهد هوش مصنوعی را بپذیرند. @deedydas
به گفته‌ی ‏TechCrunch، به نظر می‌رسد پذیرش سازمانی ‏OpenAI با هزینه‌ی رقبا در حال تسریع است. @TechCrunch
دولت ایالات متحده در حال بررسی سرمایه‌گذاری ‏Benchmark در استارت‌آپ چینی هوش مصنوعی ‏Manus است. @TechCrunch
‏NYT گزارش‌هایی درباره‌ی پیش‌نویس دستورات اجرایی برای تسریع ساخت نیروگاه‌های هسته‌ای ایالات متحده، از جمله تعیین برخی از مراکز داده‌ی هوش مصنوعی به عنوان «زیرساخت‌های حیاتی دفاعی» برای مشارکت ‏DoD و ‏DoE منتشر کرده است. @AndrewCurran_

اخلاق و جامعه

یک آزمون معیار که هوش مصنوعی را در حال اجرای یک دستگاه فروش شبیه‌سازی‌شده آزمایش می‌کند، نشان می‌دهد که Claude 3.5 و o3-mini می‌توانند به طور متوسط از انسان‌ها بهتر عمل کنند، اما با واریانس بالا و شکست‌های تماشایی گاه به گاه، مانند زمانی که ‏Sonnet به اشتباه تلاش کرد تا ‏FBI را در مورد تقلب غیرواقعی مطلع کند. @emollick
یان لکان پستی با عنوان «پنج راه برای اینکه فریب‌خورده، احمق، ناکارآمد یا شرور عمل کنید» به اشتراک گذاشت و در مورد ملاحظات اخلاقی در توسعه‌ی هوش مصنوعی بحث کرد. @ylecun

اخبار هوش مصنوعی در 2025-05-09

مدل‌های جدید هوش مصنوعی

‏Google از Gemini 2.5 Pro (05-06) رونمایی کرد که با اختلاف زیادی به عملکردی بی‌نظیر در درک ویدیو دست یافته است. @JeffDean @sundarpichai @OfficialLoganK

پژوهش‌ها

مقالهٔ WebGPT از سال ۲۰۲۱، با توجه به قابلیت‌های نشان داده شده توسط o3 و جستجوی مبتنی بر هوش مصنوعی، جلوتر از زمان خود به نظر می‌رسد. @natolambert
محققان استنفورد، NNetNav را توسعه داده‌اند، یک عامل هوش مصنوعی متن‌باز که با تعامل مستقیم با وب‌سایت‌ها و در عین حفظ حریم خصوصی، یاد می‌گیرد. @StanfordHAI
تحقیقات نشان می‌دهد که LLMها می‌توانند ابزارهای ارزشمندی برای معلمان ریاضی مقطع راهنمایی باشند تا تجربه‌ی یادگیری را برای دانش‌آموزان با سطوح مهارتی مختلف بهبود بخشند. @StanfordHAI

کاربردها

‏Reinforcement fine-tuning اکنون برای o4-mini در دسترس است و به توسعه‌دهندگان اجازه می‌دهد رفتار مدل را سفارشی کنند. @gdb @OpenAIDevs
قابلیت‌های Deep research برای پایگاه‌های کد اکنون در دسترس است و توسعه‌دهندگان را قادر می‌سازد تا کد خود را بهتر درک کنند. @gdb @OpenAIDevs
‏Qwen Chat ویژگی Web Dev را معرفی کرد که امکان ساخت صفحات وب و برنامه‌های کاربردی فرانت‌اند را با استفاده از دستورات ساده و تنها با یک خط متن فراهم می‌کند. @Alibaba_Qwen
‏Copilot Assistant اکنون در اندروید در دسترس است و به کاربران اجازه می‌دهد از طریق فشار طولانی دکمه پاور یا کشیدن انگشت برای راه‌اندازی جلسات صوتی در متن فعالیت فعلی به آن دسترسی داشته باشند. @Copilot
‏Gemini 2.5 اکنون به‌طور خودکار ۷۵٪ تخفیف توکن‌های کش‌شده را اعمال می‌کند و به‌طور بالقوه صرفه‌جویی قابل توجهی در هزینه‌ها برای برنامه‌هایی که دستورات را در برابر همان متن طولانی اجرا می‌کنند، ارائه می‌دهد. @simonw
‏Perplexity on WhatsApp اکنون محاوره‌ای‌تر است و در صورت عدم نیاز، جستجو را نادیده می‌گیرد. @AravSrinivas
‏Windsurf Reviews با بررسی اولیه درخواست‌های pull، فرآیند بررسی کد را ساده می‌کند. @windsurf_ai
‏Zero یک کلاینت ایمیل متن‌باز و بومی هوش مصنوعی است که صندوق ورودی شما را به‌طور خودکار مدیریت می‌کند. @garrytan @ycombinator
‏Scout اکنون استقرار بی‌نقص وب‌سایت را ارائه می‌دهد - کاربران می‌توانند به سادگی از آن بخواهند «وب‌سایت من را مستقر کن». @ycombinator
‏YouLearn یک معلم خصوصی هوش مصنوعی است که مطالب یادگیری را به یادداشت‌های مختصر تبدیل می‌کند، یک معلم خصوصی هوش مصنوعی برای گفتگو ارائه می‌دهد و آزمون‌های شخصی‌سازی‌شده ایجاد می‌کند. @ycombinator
‏Klavis AI در حال ساخت یکپارچه‌سازی‌های MCP متن‌باز برای برنامه‌های کاربردی هوش مصنوعی با یک API است که سرورهای MCP میزبانی‌شده و امن را ارائه می‌دهد. @ycombinator
‏MorphoAI نرم‌افزار مبتنی بر هوش مصنوعی را برای رباتیک و مهندسی ماشین ارائه می‌دهد تا سخت‌افزار را با سرعت نرم‌افزار توسعه دهد. @ycombinator
‏Sai یک دستیار تجزیه و تحلیل آزمایش‌های آزمایشگاهی و بهینه‌سازی سلامت مبتنی بر هوش مصنوعی است که در داشبورد SiPhox قرار دارد و از بارگذاری از هر آزمایشگاهی پشتیبانی می‌کند. @ycombinator

تحلیل صنعت

شرکای YC در مورد اینکه چگونه ابزارهای کدنویسی هوش مصنوعی در حال تغییر توسعه نرم‌افزار هستند و تیم‌های کوچک را قادر می‌سازند تا کاری را انجام دهند که زمانی به ارتشی از مهندسان نیاز داشت، بحث می‌کنند. @garrytan @ycombinator
‏Rippling مبلغ ۴۵۰ میلیون دلار با ارزش ۱۶.۸ میلیارد دلار جمع‌آوری کرد که نشان‌دهنده سرمایه‌گذاری قوی مداوم در پلتفرم‌های منابع انسانی و مالی مبتنی بر هوش مصنوعی است. @TechCrunch @ycombinator
‏PyTorch Foundation به یک بنیاد فراگیر با پذیرش vLLM و DeepSpeed به عنوان پروژه‌های میزبانی‌شده، گسترش یافته است و هوش مصنوعی مبتنی بر جامعه را در کل چرخه‌ی عمر پیش می‌برد. @PyTorch
‏Google قراردادی را برای توسعه ۱.۸ گیگاوات انرژی هسته‌ای پیشرفته امضا کرد که احتمالاً از نیازهای رو به رشد زیرساخت هوش مصنوعی پشتیبانی می‌کند. @TechCrunch
‏SoundCloud سیاست‌ها را تغییر داد تا آموزش هوش مصنوعی را بر روی محتوای کاربر مجاز کند و به روند پلتفرم‌هایی که محتوا را برای توسعه هوش مصنوعی باز می‌کنند، پیوست. @TechCrunch

اخلاق و جامعه

نگرانی‌هایی در مورد استفاده خصمانه از ردیاب‌های هوش مصنوعی مانند Pangram Labs بدون ارزیابی مستقل نرخ مثبت کاذب مطرح شده است. @emollick
‏Microsoft Research در مورد ملاحظات اخلاقی در هوش مصنوعی مراقبت‌های بهداشتی، از جمله چارچوب‌های حکمرانی و کاهش سوگیری، بحث می‌کند. @MSFTResearch
‏Yann LeCun با تصورات غلط رایج در مورد LLMها مقابله می‌کند و خاطرنشان می‌کند که آن‌ها کاربران را تنبل نمی‌کنند، بلکه یادگیری بیشتر و سریع‌تر را تشویق می‌کنند. @ylecun
نگرانی‌هایی در مورد کاهش بودجه NSF مطرح شده است که به طور بالقوه به رهبری فناوری ایالات متحده در هوش مصنوعی در مقایسه با کشورهایی مانند چین که سرمایه‌گذاری‌های هنگفتی در علم انجام می‌دهند، آسیب می‌رساند. @jeffclune @ylecun

1 2 3 4 5...26