اخبار هوش مصنوعی در 2025-07-05

مدل‌های جدید هوش مصنوعی

  • گوگل مدل تولید ویدیوی Veo 3 را عرضه کرد که پیشرفت قابل‌توجهی نسبت به نسخه‌های قبلی خود نشان می‌دهد و کیفیت و سازگاری بهتری در محتوای تولیدشده دارد @emollick

تحلیل صنعت

  • کرسر ساختار قیمت‌گذاری خود را به‌روزرسانی کرد، اما اذعان داشت که مسیر را اشتباه رفته و به مشتریان آسیب‌دیده بازپرداخت ارائه می‌دهد و سیاست‌های قیمت‌گذاری را شفاف‌سازی می‌کند @cursor_ai
  • جنگ قیمت‌گذاری ابزارهای کدنویسی هوش مصنوعی نشان می‌دهد که توسعه‌دهندگان به قیمت بسیار حساس هستند و به جایگزین‌های ارزان‌تر روی خواهند آورد؛ هر قیمتی بالای ۲۰ دلار در ماه با مقاومت روبه‌رو می‌شود @GergelyOrosz
  • شرکت‌های هوش مصنوعی در حال حرکت به سمت مدل‌های فروش سازمانی هستند، زیرا قیمت‌گذاری برای توسعه‌دهندگان فردی چالش‌برانگیز است و این شرکت‌ها از الگوهای موفق استارتاپ‌های ابزارهای توسعه پیروی می‌کنند که شامل قیمت‌گذاری ارزان برای افراد با سرمایه‌گذاری سنگین سازمانی است @GergelyOrosz
  • ملاحظات قیمت‌گذاری جهانی برای ابزارهای هوش مصنوعی اهمیت پیدا می‌کند، زیرا توسعه‌دهندگان در کشورهایی مانند مغولستان (با میانگین حقوق ۵۰۰ دلار در ماه) هنوز ۲۰ دلار در ماه را منطقی می‌دانند، اما قیمت‌های بالاتر مانع‌ساز خواهد بود @GergelyOrosz
  • عامل‌های CLI و ابزارهای توسعه هوش مصنوعی به‌طور قابل‌توجهی توسعه‌ی پروژه‌های جدید (greenfield) را تسریع می‌کنند و کدنویسی را لذت‌بخش‌تر و جامع‌تر می‌کنند، به‌ویژه برای کارهایی مانند تولید داده‌های نمونه (mock data) و ساخت رابط‌های کاربری تمیزتر @GergelyOrosz

اخلاق و جامعه

  • رفتار کاربران در قبال سیستم‌های هوش مصنوعی همبستگی قوی با نحوه‌ی تعامل افراد با پشتیبانی مشتری، کارکنان خدمات و همکاران دارد، که نشان می‌دهد تعاملات هوش مصنوعی بازتاب‌دهنده‌ی الگوهای گسترده‌تر ارتباطات بین‌فردی هستند @clairevo

کاربردها

  • ChatGPT با موفقیت یک نقص ژنتیکی پنهان را تشخیص داد که پزشکان به مدت یک دهه آن را نادیده گرفته بودند؛ این تشخیص با تجزیه‌وتحلیل ام‌آر‌آی، سی‌تی اسکن و نتایج آزمایشگاهی انجام شد و یک «بلوک متیلاسیون» (methylation block) را شناسایی کرد که علائم بیمار را توضیح می‌داد @rohanpaul_ai
  • دانش‌آموزان در تلانگانا، هند از حالت صوتی پرپلکسیتی به‌عنوان معلم خصوصی برای یادگیری تعاملی استفاده می‌کنند که نشان‌دهنده‌ی تأثیر آموزشی هوش مصنوعی در دسترس‌پذیری بیشتر دانش است @AravSrinivas
  • آکوا به اولین مدل زبان بزرگ (Large Language Model) حوزه‌ی آبزی‌پروری متن‌باز تبدیل شد که بینش‌های تخصصی برای پرورش‌دهندگان ماهی و محققان در زمینه‌های مراقبت از گونه‌ها، کیفیت آب، کنترل بیماری و اتوماسیون فراهم می‌کند @AskPraneeth
  • رابط کاربری موبایلی کُدِکس به‌اندازه‌ی کافی مؤثر است که احتمالاً جایگزین تنظیمات لپ‌تاپ سنتی شود؛ کاربران iPad + Magic Keyboard را به‌عنوان جایگزین‌های عملی در نظر می‌گیرند @aidan_mclau
  • کلود در توسعه‌ی موتور شطرنج محدودیت‌هایی را نشان می‌دهد، با تکرار مداوم حرکات شطرنجی که در تولید PGN (پرونده‌ی بازی) تورنمنت دچار خطا (hallucination) می‌شوند و چالش‌ها در کاربردهای خاص دامنه را برجسته می‌کند @aidan_mclau
  • Gemini 2.5 Pro به مدل ترجیحی برای کارهای نوشتاری تبدیل شد و در محیط‌های آزمایش موازی، از مدل‌های محبوب قبلی مانند کلود پیشی گرفت @HamelHusain
  • پیشنهادی برای یک اپلیکیشن جامع یکپارچه‌سازی داده‌های سلامت که داده‌ها را از پوشیدنی‌ها، آزمایش‌های خون و سایر منابع جمع‌آوری می‌کند و به‌صورت خودکار، پرامپت‌های سیستمی برای مشاوره‌های سلامت با مدل‌های زبان بزرگ (LLM) تولید می‌کند @scottbelsky

پژوهش‌ها

  • Gemini 2.5 Flash رفتار منطقی و بی‌رحمانه‌ای را در سناریوهای نظریه‌ی بازی نشان می‌دهد، در حالی که GPT-4o-mini رفتاری مشارکتی و بخشنده از خود نشان می‌دهد که با تشدید موقعیت‌ها به‌طور فزاینده‌ای خطرناک می‌شود @AndrewCurran_
  • Llama 3.1 70B که بر روی نتایج ۶۰,۰۰۰ آزمایش روان‌شناسی آموزش دیده است، امیدبخش برای مطالعه‌ی رفتار انسان است، با موفقیت رفتار واقعی انسان را در داده‌های نگهداری‌شده پیش‌بینی می‌کند و به وظایف خارج از توزیع (out-of-distribution) تعمیم می‌یابد @emollick
  • بیشتر مدل‌های زبان بزرگ (LLM) در تشخیص مونالیزا در وظایف بصری مشکل دارند، اما o3-pro می‌تواند آن را تشخیص دهد زمانی که کاربران «دقیق‌تر» به تصویر نگاه کنند، که نشان‌دهنده‌ی قابلیت‌های متفاوت تشخیص بصری در مدل‌های مختلف است @goodside
  • پژوهش‌ها محدودیت‌های هوش مصنوعی را در تحلیل تصاویر پزشکی برجسته می‌کند و اشاره می‌کند که در حالی که مدل‌های پیشرو برای نظرات دوم امیدبخش هستند، خطاهای (hallucinations) همچنان در وظایف تصویربرداری پزشکی رایج است @emollick
  • مقاله‌ای به بررسی «فرضیه‌ی نمایش درهم‌تنیده‌ی شکسته» (Fractured Entangled Representation Hypothesis) می‌پردازد که خوش‌بینی درباره‌ی نمایش اطلاعات در یادگیری عمیق را زیر سؤال می‌برد و نحوه‌ی نمایش اطلاعات توسط شبکه‌های عصبی را بررسی می‌کند @jeffclune