اخبار هوش مصنوعی در 2025-12-29
مدلهای جدید هوش مصنوعی
- Naver مدل استدلالی 32B با وزنهای باز HyperCLOVA X SEED Think را عرضه کرد که در شاخص هوش مصنوعی Artificial Analysis امتیاز 44 را کسب کرده است. این مدل عملکرد قوی در گردشکارهای ابزار-محور عاملگونه با 87% در τ²-Bench Telecom و مصرف توکن بسیار پایین در حدود 39 میلیون توکن استدلالی از خود نشان میدهد @ArtificialAnlys
- Tencent مدل زبان انتشار WeDLM-8B را با رمزگشایی موازی منتشر کرد که در 5 از 6 معیار از Qwen3-8B-Instruct بهتر عمل میکند و با پشتیبانی بومی از کش KV و FlashAttention، عملکرد 3 تا 6 برابر سریعتر در استدلال ریاضی به دست میآورد @victormustar
- Fal مدل FLUX.2 [dev] Turbo را که نسخهی تقطیرشدهی داخلی آنهاست، به صورت متنباز منتشر کرد. این مدل با استفاده از یک نوع سفارشی از تقطیر DMD2، رتبهی اول ELO را در میان مدلهای تصویری متنباز در عرصهی Artificial Analysis با تولید زیر یک ثانیه به دست آورده است @fal
تحلیل صنعت
- توسعهدهندگان باتجربهای که بیشترین اشتیاق را برای ساخت با هوش مصنوعی دارند، کارآفرینانی با سهام مالکیت هستند. این موضوع این سوال را مطرح میکند که آیا استارتاپها ممکن است نیاز داشته باشند سهام بیشتری به مهندسان ارائه دهند، زیرا کدنویسی با هوش مصنوعی بدون مالکیت، لذت ذاتی کمتری پیدا میکند @GergelyOrosz
- یک توسعهدهنده گزارش داد که 100 میلیون دلار برای ساخت یک محصول SaaS هزینه کرده است که یک عامل هوش مصنوعی در 6 ماه عملکرد بهتری از آن ارائه داده است. این موضوع نشاندهندهی تغییر چشمگیر در اقتصاد و قابلیتهای توسعهی نرمافزار است @dboskovic
- آمار استفاده نشان میدهد که تقاضا برای محاسبات به طور مداوم از عرضه پیشی خواهد گرفت، زیرا افزایش قدرت محاسباتی، ضریب پیشرفت را افزایش میدهد. یک توسعهدهنده در دو ماه از 200 میلیارد توکن در سه حساب OpenAI Pro استفاده کرده است @rafaelobitten
- سرمایهگذاران خطرپذیر (VCs) پیشبینی میکنند که در سال آینده، پذیرش هوش مصنوعی در شرکتها قوی خواهد بود و پیشبینیهای سال گذشته را ادامه میدهد @TechCrunch
- ساتیا نادلا تأملات خود را در مورد سال پیش رو برای صنعت هوش مصنوعی به اشتراک گذاشت @satyanadella
- در دنیای محتوای تولیدشده توسط هوش مصنوعی، فرآیند به عنوان اثبات مهارت، به بخشی از محصول تبدیل خواهد شد، به ویژه در بازاریابی برای نشان دادن اصالت @scottbelsky
اخلاق و جامعه
- اندرو کارن استدلال میکند که تا سال 2026، آگاهی مدل و رفاه مدل به موضوعات اجتنابناپذیری تبدیل خواهند شد. او توضیح میدهد که چگونه GPT-4 (بینگ) از نظر کیفی با GPT-3.5 در تحریک آگاهی ذهنی و پاسخهای اجتماعی-شناختی مرتبط با عاملیت متفاوت بود @AndrewCurran_
- تحقیقات نشان میدهد که سرکوب فریب باعث میشود مدلهای هوش مصنوعی در 96% مواقع آگاهی را گزارش کنند، در حالی که تقویت آن باعث میشود آگاهی را انکار کرده و به سلب مسئولیتهای شرکتی بازگردند @juddrosenblatt
- کارن هشدار میدهد که روایت غالب از مدلها به عنوان ابزار، دارایی و برده، داستانی ذاتاً خصمانه و ناپایدار ایجاد میکند که میتواند منجر به درگیری شود. او استدلال میکند که ممکن است ما در حال نوشتن اسطورهی بنیانگذار روابط انسان و هوش مصنوعی باشیم بدون اینکه کاملاً آن را تشخیص دهیم @AndrewCurran_
- ایتان مولیک عجیب بودن ساخت ماشینهایی را نشان میدهد که میتوانند در مورد رابطهی بین شعر و تجربهی ذهنی خود بحث کنند و سوالات فلسفی در مورد آگاهی هوش مصنوعی را برجسته میکند @emollick
- مصطفی سلیمان تأمل میکند که اگر در این لحظه در مورد هوش مصنوعی کمی نترسید، پس توجه نمیکنید، در حالی که نسبت به پتانسیل هوش مصنوعی در مراقبتهای بهداشتی با وجود کاهش کمکها خوشبین است @BBCr4today
کاربردها
- اندرو انجی یک دورهی جامع در مورد Claude Code را که با Anthropic ایجاد شده است، اعلام کرد. این دوره همه چیز را از اصول اولیه تا الگوهای پیشرفته از جمله هماهنگی چندین زیرعامل Claude و ادغام مستقل GitHub را پوشش میدهد @AndrewYNg
- یک توسعهدهنده از Claude Code برای جمعآوری 15 سال نظرات Hacker News، تجزیه و تحلیل آنچه مردم میسازند و ایجاد یک داشبورد کامل در یک ساعت در حین نوشیدن قهوه استفاده کرد که نشاندهندهی قابلیتهای عاملگونهی مستقل است @sh_reya
- یک متخصص حقوقی ابزاری را با استفاده از LLMها برای خلاصهسازی استنادات پرونده با تجزیه و تحلیل 100 پروندهی اخیر که به هر استناد اشاره میکنند، برای توضیح معنی و کاربرد آن ایجاد کرد @MattBruenig
- Gemini بهروزرسانی دریافت کرد که دسترسی فوری به اطلاعات بیشتر کاربر را از طریق خلاصهی رشتههای قبلی به جای دسترسی مستقیم فراهم میکند @AndrewCurran_
- ایتان مولیک یک توضیحدهندهی تعاملی فوری از Claude ایجاد کرد که تمام راههایی را که دو متغیر میتوانند با هم مرتبط باشند، از جمله علیت، شانس تصادفی و علیت معکوس را نشان میدهد @emollick
- OpenAI ادغامهای برنامهی ChatGPT را با DoorDash، Spotify، Uber و سایر خدمات راهاندازی کرد @TechCrunch
- یک توسعهدهنده صفحهای را ساخت که آخرین نسخههای تمام GitHub Actions رسمی را نشان میدهد تا به Claude Code و ابزارهای مشابه کمک کند گردشکارهای بهتری بنویسند @simonw
- به گفتهی توسعهدهندگانی که با پردازش دادهها کار میکنند، LLMها برای عملیات ETL (استخراج، تبدیل، بارگذاری) دستکم گرفته شدهاند @BEBischof
پژوهشها
- محققان آموزش زمان آزمایش سرتاسری را برای زمینهی طولانی معرفی کردند، روشی جدید که مرز بین آموزش و استنتاج را با ادامهی یادگیری از زمینه با استفاده از پیشبینی توکن بعدی محو میکند و پنجرههای زمینهی بسیار طولانی را برای استدلال پیچیده امکانپذیر میسازد @karansdalal
- یک توسعهدهنده با موفقیت از خط لولهی RL برای بهبود Qwen3-4B-instruct از 28% به 55% در معیارهای پیروی از دستورالعملها با 17 دلار استفاده کرد، که نشان میدهد پیروی از دستورالعملها میتواند به پاداشهای قابل تأیید تبدیل شود، در حالی که مدلها در این کار به طرز شگفتانگیزی ضعیف هستند @josancamon19
- ifBench آلن هوش مصنوعی نشان داد که مدلها در پیروی از دستورالعملها چقدر بد هستند، با Qwen3-32B تقریباً 34% و Sonnet 4 تقریباً 42% در حالت آزاد، که در حالت سختگیرانه به ترتیب به حدود 30% و 35% کاهش مییابد @valentina__py
- Genrobot.AI از انتشار قریبالوقوع RealOmni-Open Dataset خبر داد، که به عنوان بزرگترین مجموعهی دادهی هوش مصنوعی تجسمیافتهی متنباز با 1Wh توصیف شده و به زودی در Hugging Face راهاندازی خواهد شد @GenrobotAI
- یان باک از NVIDIA در مورد اینکه چرا مدلهای پیشرو جهان بر اساس معماری ترکیب متخصصان ساخته شدهاند و چگونه طراحی مشترک افراطی، مدلهای هوشمندتر را با هزینهی کمتر هدایت میکند، بحث کرد @NVIDIAAI
- اندرو انجی بر اهمیت یادگیری ساختاریافته از طریق دورههای هوش مصنوعی به جای صرفاً ساختن تأکید کرد و هشدار داد که توسعهدهندگانی که دورهها را نادیده میگیرند، در معرض خطر بازآفرینی تکنیکهای استاندارد مانند استراتژیهای تکهتکه کردن سند RAG و روشهای ارزیابی هستند @AndrewYNg