مدلهای جدید هوش مصنوعی
- انویدیا پلتفرم روبین را معرفی کرد که برای کارایی بیسابقه در آموزش و استنتاج طراحی شده است. این پلتفرم دارای طراحی مشترک فوقالعادهای در محاسبات، شبکهسازی و نرمافزار برای آموزش، استنتاج و استدلال پیشرفته در مقیاس بزرگ است. @NVIDIAAI
- انویدیا کازموس ریزن 2 را منتشر کرد، یک مدل زبان بصری استدلالی باز برای هوش مصنوعی فیزیکی با اندازههای مدل 2B و 8B، درک فضایی-زمانی بهبودیافته، استدلال با زمینه طولانی تا 256K توکن و درک بصری گسترده. @NVIDIAAIDev
- انویدیا از آلپامایو رونمایی کرد که به عنوان اولین مدل تفکر و استدلال جهان برای وسایل نقلیه خودران توصیف شده است و پشتهی آن متنباز است. @StockSavvyShay
- لیکوئید ایآی LFM2.5 را منتشر کرد، قدرتمندترین خانوادهی مدلهای بنیادی کوچک روی دستگاه در کلاس پارامتر ~1B، با پیشآموزش مقیاسیافته از 10T به 28T توکن و پسآموزش یادگیری تقویتی گسترده. @liquidai
- لایتریکس LTX-2 را منتشر کرد، اولین مدل متنباز تولید ویدئو-صوت. @linoy_tsaban
- xAI سری E را با جمعآوری 20 میلیارد دلار به پایان رساند و تأیید کرد که گروک 5 اکنون در حال آموزش است و محصولات جدید مصرفکننده و سازمانی به زودی عرضه خواهند شد. @xai
- گوگل ایآی استودیو ارتقاء کیفیت زندگی را در داشبوردهای استفاده، از جمله قابلیت مشاهده نرخ موفقیت API، ردیابی استفاده از مدل جاسازی جیمنای، قابلیت زوم خاص روز و طراحی نمودار جدید، ارائه کرد. @OfficialLoganK
تحلیل صنعت
- ترافیک ChatGPT در 6 هفته گذشته از زمان عرضه جیمنای 3، 22% کاهش یافته است، با میانگین بازدیدکنندگان 7 روزه از ~203 میلیون به ~158 میلیون کاهش یافته است، در حالی که جیمنای ثابت مانده و اکنون ~40% از ترافیک ChatGPT را تشکیل میدهد. @deedydas
- لیزا سو، مدیرعامل AMD، پیشبینی میکند که کاربران فعال هوش مصنوعی از یک میلیارد نفر امروز به بیش از پنج میلیارد نفر در پنج سال آینده افزایش خواهند یافت که به محاسبات به مراتب بیشتری نیاز دارد. @AndrewCurran_
- متا به دلیل تقاضای بیسابقه و موجودی محدود، گسترش بینالمللی عینکهای Ray-Ban Display را به بریتانیا، فرانسه، ایتالیا و کانادا متوقف کرد. @AndrewCurran_
- LMArena تنها چهار ماه پس از عرضه محصول خود، به ارزش 1.7 میلیارد دلار رسید. @TechCrunch
- جنسن هوانگ، مدیرعامل انویدیا، تأکید میکند که آیندهی کاربردهای هوش مصنوعی یک مدل عالی نیست، بلکه هماهنگسازی چندین مدل عالی در هر مرحله از زنجیرهی استدلال است و آن را چندمدلی، چندوجهی و چندابری توصیف میکند. @AskPerplexity
- بیش از 5% از پیامهای ChatGPT که در سراسر جهان ارسال میشوند، مربوط به مراقبتهای بهداشتی هستند، با 25% از کاربران فعال هفتگی که سوالات بهداشتی میپرسند، با استفادهی بیشتر در زمانهایی که مطب پزشکان بسته است و در مناطق محروم از بیمارستان که دسترسی محدود است. @omooretweets
- ابزارهای کدنویسی هوش مصنوعی باعث شدهاند که دیگر بهانهای برای نادیده گرفتن فرآیندهای مهندسی کیفیت مانند ردیابی خوب مسائل، تضمین کیفیت کامل، تست خودکار، مستندات بهروز، CI و اتوماسیون استقرار وجود نداشته باشد. @simonw
- خطوط کد به عنوان یک معیار بهرهوری، با وجود اینکه به طور گستردهای بیفایده شناخته شده است، به خصوص هنگام بحث در مورد کیفیت کد دستساز یا بهرهوری کدنویسی عاملمحور، همچنان پابرجا است. @isaac_flath
اخلاق و جامعه
- کیسی نیوتن، روزنامهنگار، یک پست وایرال در ردیت دربارهی الگوریتمهای تحویل اوبر ایتس را کاملاً جعلی افشا کرد، با "افشاگر" که از هوش مصنوعی برای تولید شواهد جعلی از جمله یک سند فنی 18 صفحهای و کارت شناسایی کارمند استفاده کرده بود، که نشان میدهد چگونه هوش مصنوعی به راحتی میتواند اطلاعات نادرست متقاعدکننده ایجاد کند که زمان قابل توجهی برای روزنامهنگاران برای رد کردن آن لازم است. @GergelyOrosz
- تحقیقات جدید نشان میدهد که هوش مصنوعی سیل مقالات دانشگاهی را ایجاد میکند، با پیچیدگی مقاله که به جای کیفیت برای کار انسانی، نشانهای از کیفیت پایین برای کار تولید شده توسط هوش مصنوعی میشود، که سیستمهای سنتی داوری همتا را بدون برنامهی مشخصی برای انطباق تهدید میکند. @emollick
- اندرو انجی آزمون تورینگ-AGI را برای مقابله با هیجان AGI پیشنهاد میکند، که در آن هوش مصنوعی باید وظایف کاری چند روزه را به خوبی انسانهای ماهر از طریق یک رابط کامپیوتری انجام دهد، و استدلال میکند که ادعاهای فعلی AGI معیارهای مصنوعی پایینی را تعیین میکنند که دانشجویان و مدیران عامل را در مورد قابلیتهای هوش مصنوعی گمراه میکند. @AndrewYNg
- قانونگذار کالیفرنیا ممنوعیت چهار ساله رباتهای چت هوش مصنوعی در اسباببازیهای کودکان را پیشنهاد میکند. @TechCrunch
- محققان استنفورد گزارش جامعی در مورد تأثیر بالقوه هوش مصنوعی بر اشتغال، آموزش، مراقبتهای بهداشتی، اطلاعات، رسانه، امنیت ملی و علم منتشر کردند و 18 جهت تحقیقاتی بلندپروازانه را برای به حداکثر رساندن تأثیر مثبت و به حداقل رساندن معایب پیشنهاد کردند. @JeffDean
کاربردها
- گوگل دیپمایند همکاری تحقیقاتی با بوستون داینامیکس را برای آوردن قابلیتهای بنیادی جیمنای رباتیک به رباتهای انساننمای جدید اطلس خود اعلام کرد. @GoogleDeepMind
- بوستون داینامیکس از ربات انساننمای اطلس نسل بعدی ارتقا یافته رونمایی کرد: کاملاً الکتریکی (بدون هیدرولیک)، 6'2" قد، 198 پوند وزن، 56 درجه آزادی، باتری قابل تعویض 4 ساعته، ظرفیت وزن 110 پوند، با تراشههای انویدیا با ارزیابی محیطی بلادرنگ و بازخورد حسگر لمسی. @AndrewCurran_
- نرمافزار NVIDIA DRIVE AV در مرسدس بنز CLA کاملاً جدید عرضه شد و قابلیتهای کمک راننده سطح 2 نقطهبهنقطه را با عملکرد گسترده تا پایان سال به جادههای ایالات متحده میآورد. @NVIDIADRIVE
- توسعهدهنده با استفاده از جیمنای 3 فلش، برنامه تقویم حیوانات خانگی شخصیسازی شده را برای طرحهای سفارشی و آماده چاپ ایجاد کرد. @GeminiApp
- حامل حسین استفاده از ابزارهای کدنویسی هوش مصنوعی را برای ایجاد نرمافزار آموزشی برای مفاهیم مونتهسوری 7 ساله خود در 15 دقیقه نشان میدهد. @HamelHusain
- توسعهدهنده از افزونه مرورگر کلود برای تجزیه و تحلیل یک گزارش سلامت پوست با طراحی ضعیف با مرور هر صفحه، گرفتن اسکرینشات و تولید یک تجزیه و تحلیل جامع با توصیههای برنامه مراقبت از پوست استفاده میکند. @brian_lovin
- آنتروپیک قابلیت کد محلی کلود را در Claude Desktop معرفی کرد که به کاربران امکان میدهد حالت کد را تغییر دهند و پوشهها را برای دسترسی هوش مصنوعی مستقیماً از رابط دسکتاپ انتخاب کنند. @_catwu
- جردن سینگر از Async رونمایی کرد، یک "عامل محصول" که برای کمک به تیمها در مدیریت وظایف توسعه محصول و همترازی طراحی شده است. @jsngr
پژوهشها
- نوام براون تجربهی دقیق ساخت یک حلکنندهی رودخانهی پوکر متنباز با استفاده از ابزارهای کدنویسی هوش مصنوعی را به اشتراک میگذارد و دریافت که در حالی که کدکس و کلود کد تکرار سریعتر را امکانپذیر میکردند، اشتباهات الگوریتمی داشتند و در اشکالزدایی مشکل داشتند، با کدکس که کد C++ را 6 برابر سریعتر از نسخهی بهینهشدهی کلود کد تولید میکرد. @polynoamial
- شریا شانکار تحقیقاتی را در مورد پردازش اسناد در مقیاس با LLMها ارائه میدهد، با معرفی عملگرهای معنایی Map، Filter، Reduce و تکنیک Task Cascades که 86% کاهش هزینه را با حفظ 90% دقت به دست آورد، همراه با DocWrangler IDE که به "انحراف معیار" که در آن معیارهای ارزیابی در طول فرآیند تکامل مییابند، میپردازد. @HamelHusain
- تحقیقات MIT نشان میدهد که مناطق درون مرکز کنترل اجرایی مغز، پیامها را در مدارهای خاص با سایر مناطق مغز تنظیم میکنند تا آنها را با اطلاعات مربوط به رفتار و احساسات تحت تأثیر قرار دهند. @MIT
- انویدیا و هاگینگ فیس فناوریهای آیزاک انویدیا را در کتابخانهی LeRobot ادغام کردند، با Isaac Lab-Arena که اکنون در LeRobot Environment Hub برای ارزیابی سیاستهای VLA و ایجاد محیطهای ربات قابل استفاده مجدد در دسترس است. @NVIDIARobotics
- تحقیقات نشان میدهد که GPT-5.2 Pro اثباتهای ظریفی را برای نتایج رشد انفجاری در مقالات نظریهی اقتصادی ارائه میدهد. @ChadJonesEcon
- فرانسوا شوله استدلال میکند که ارزانتر و سریعتر کردن تولید کد ممکن است یک نعمت بیقید و شرط نباشد، و کد را بیشتر یک بدهی میداند تا یک دارایی. @fchollet
مدلهای جدید هوش مصنوعی
- MiniMax نقشهی راه 2026 خود را در Hugging Face منتشر کرد و توسعههای آتی را تشریح نمود. @victormustar
- Miro Thinker 1.5 منتشر شد که بر روی qwen3 پسآموزشدیده است و در نسخههای 30A3B و 235A22B با نتایج قوی در BrowserComp تحت مجوز MIT در دسترس است. @Xianbao_QIAN
- TII مدل Falcon H1R-7B را منتشر کرد، یک مدل استدلالی جدید که با تنها 7 میلیارد پارامتر و پنجرهی متنی 256 هزار، در ریاضیات و کدنویسی از سایر مدلها بهتر عمل میکند و از معماری ترکیبی mamba-transformers برای بهبود کارایی استفاده میکند. @mervenoyann
- Tencent Hunyuan مدل Youtu-LLM را منتشر کرد، یک مدل 2 میلیارد پارامتری با 128 هزار پنجرهی متنی و قابلیتهای عاملی قوی. @AdinaYakup
- Hugging Face پشتیبانی از رمزگشایی موازی را در batching پیوستهی ترنسفورمرها اضافه کرد که امکان چندین جریان از یک پرامپت را فراهم میکند و تأثیر قابلتوجهی بر پردازش متنهای طولانی دارد. @remi_or_
- Olmo 3.1 32B Instruct به یکی از پرطرفدارترین LLMها در بررسی پایان سال r/LocalLlama تبدیل شد. @natolambert
تحلیل صنعت
- مدیر ارشد فناوری یک استارتاپ گزارش داد که قصد دارد در سال آینده حدود 10 برابر بیشتر از سال گذشته از مدلهای هوش مصنوعی استفاده کند و اولویت را به ایجاد معیارهای بهرهوری پایه برای ردیابی تأثیر میدهد. @GergelyOrosz
- دادههای Carta نشان میدهد که شرکتهای با سرمایهگذاری خطرپذیر عمدتاً توسط چندین بنیانگذار تأسیس میشوند، به طوری که تنها 17 درصد از آنها تکبنیانگذار هستند در مقایسه با بیش از 30 درصد استارتاپهای بدون سرمایهگذاری خطرپذیر. @GergelyOrosz
- ناظران صنعت خاطرنشان میکنند که ابزارهای هوش مصنوعی احتمالاً بهترین شیوههای تیمهای مهندسی برتر را به خط مبنای شرکتهای رقابتی تبدیل خواهند کرد، از جمله مهندسی محصولمحور، تست، قابلیت مشاهده و استقرار مداوم. @GergelyOrosz
- شرکتهایی که توسعهدهندگان را به عنوان مجریان تیکت در نظر میگیرند، توسط تیمهایی که توسعهدهندگان در آنها استقلال تعریف کار خود و استفاده مؤثر از ابزارهای هوش مصنوعی را دارند، عقب خواهند ماند. @GergelyOrosz
- تحلیلها نشان میدهد که افرادی که با ابزارهای هوش مصنوعی مشکل دارند، افراد بیکفایت نخواهند بود، بلکه کسانی هستند که غرور زیادی دارند و فروتنی لازم برای شگفتزده شدن وقتی هوش مصنوعی از انتظاراتشان فراتر میرود را ندارند. @HamelHusain
- توسعهدهندگان گزارش میدهند که ابزارهای کدنویسی هوش مصنوعی مانند Claude Code و Opus 4.5 به نقطهی عطفی رسیدهاند که اکنون میتوانند مسائل کدنویسی به مراتب دشوارتری را حل کنند. @gdb
- دادههای StackOverflow کاهش چشمگیری در تعداد سؤالات پرسیدهشده در ماه را نشان میدهد که حاکی از آن است که توسعهدهندگان به طور فزایندهای از هوش مصنوعی برای حل مسئله به جای انجمنهای جامعه استفاده میکنند. @scottbelsky
- پیشبینی میشود که ظرف یک تا دو سال آینده، مدارک علوم کامپیوتر به عنوان 10 برابر افزایشدهندهی بهرهوری نسبت به هوش مصنوعی تولید کد دیده خواهند شد، که این امر برداشت فعلی از هوش مصنوعی به عنوان 10 برابر افزایشدهندهی بهرهوری برای فارغالتحصیلان علوم کامپیوتر را معکوس میکند. @mlevchin
- توصیه میشود که استارتاپهایی که در 12 ماه گذشته تأسیس شدهاند و در 1 درصد برتر نیستند، باید در همهچیز تجدیدنظر کنند، زیرا Claude Code و Opus 4.5 به طور اساسی آنچه را که ممکن است تغییر دادهاند. @apoorva_mehta
اخلاق و جامعه
- نگرانیهایی در مورد کیفیت محتوای تولیدشده توسط هوش مصنوعی مطرح شده است که به نقطهای رسیده است که تمایز آن از کار نوشتهشده توسط انسان بسیار دشوار است، حتی افراد باهوش نیز نمیتوانند تشخیص دهند که قطعات ویروسی که جهانبینی آنها را شکل میدهند، توسط انسان نوشته نشدهاند. @deedydas
- بحث در مورد نیاز به روشهای واضح برای اذعان به استفاده از هوش مصنوعی و مشارکت انسانی، از کار کاملاً انسانی تا کار ترکیبی تا هوش مصنوعی هدایتشده تا هوش مصنوعی خودمختار، برای تخصیص صحیح اعتبار یا سرزنش. @emollick
- بحثی در مورد اصطلاح کوتاه برای گفتن «یک هوش مصنوعی کار را انجام داد، اما من نتیجه را تأیید میکنم» در حال شکلگیری است، زیرا گفتن «من انجامش دادم» مشکوک به نظر میرسد در حالی که گفتن «کلود انجامش داد» به نظر میرسد شانه خالی کردن از مسئولیت است. @geoffreylitt
- مصرف آب به یک نگرانی اصلی برای بسیاری از مردم، به ویژه جوانان، هنگام بحث در مورد هوش مصنوعی تبدیل شده است، با وجود اینکه طبق دادهها، این موضوع از کماهمیتترین نگرانیهای زیستمحیطی است که نشان میدهد کل مصرف مراکز دادهی ایالات متحده بسته به روش اندازهگیری، بین 50 میلیون تا 628 میلیون گالن در روز متغیر است. @emollick
- پیشبینی میشود که GenAI جایگزین نبوغ انسانی نخواهد شد، اما کف متوسط بودن را آنقدر بالا خواهد برد که «نسبتاً خوب بودن» از نظر اقتصادی بیارزش خواهد شد. @fchollet
کاربردها
- OpenAI گزارش میدهد که روزانه میلیونها نفر از ChatGPT در مورد سلامتی خود سؤال میکنند، از تجزیه و تحلیل اطلاعات پزشکی تا آمادهسازی سؤالات برای ویزیت پزشک و مدیریت کلی سلامتی. @OpenAI
- متخصصان مراقبتهای بهداشتی گزارش میدهند که از هوش مصنوعی برای رفع کمبود کارکنان و بحرانهای شایستگی در سیستمهایی مانند کانادا و بریتانیا استفاده میکنند، با پیشبینیهایی که ChatMD در نهایت به درمان تبدیل خواهد شد. @AndrewCurran_
- مدیر عامل بخش برنامههای کاربردی OpenAI برنامههایی را برای تبدیل چت به یک دستیار فوقالعاده شخصی در سال 2026 تشریح کرد، با شخصیت و لحن قابلهدایتتر و شخصیسازیشدهتر، به علاوه پیامهای گروهی و گردش کار چندنفره برای کار مشارکتی. @AndrewCurran_
- یک کاربر غیرفنی با استفاده از Claude Code یک وبسایت پادکست آموزشی کامل را در 30 دقیقه ایجاد کرد، از جمله استقرار Vercel، راهاندازی دامنه، تحلیل محتوا، طراحی واکنشگرا و ادغام فید RSS. @HamelHusain
- چندین توسعهدهنده به طور مستقل برنامههای خلاصهی روزانه را با استفاده از ابزارهای هوش مصنوعی برای جمعآوری اطلاعات از ایمیل، تقویم، یادداشتها، دادههای سلامتی و برنامههای پیامرسان در خلاصههای اجرایی ایجاد کردند. @clairevo
- یک توسعهدهنده نشان داد که چگونه Claude Code میتواند سه ماه کار تحقیقاتی دکترا را در 20 دقیقه بازسازی کند، با استفاده از دادههای FAO و USDA برای محاسبهی دسترسی به مواد مغذی کشور در طول زمان. @jkeatn
- مدیر عامل Zapier شیوههای رهبری مبتنی بر هوش مصنوعی را نشان میدهد، از جمله استفاده از رونویسیهای Granola برای مهندسی معکوس فرهنگ شرکت، ایجاد عوامل معیار مصاحبه برای بازخورد ساختاریافتهی نامزدها و استفاده از Grok برای یافتن استعدادها. @clairevo
- یک توسعهدهنده گزارش میدهد که وقتی یک نفر میتواند کل چشمانداز یک محصول را با استفاده از ابزارهای هوش مصنوعی اجرا کند، نتیجه محصولات واقعاً خاصی است، و یک حلقهی کارآمد از برنامهریزی، بررسی، تکرار، اجرا و ادغام را توصیف میکند. @Suhail
- آمازون Alexa.com را راهاندازی کرد و دستیار هوش مصنوعی خود را به وب آورد، و Fire TV را با تلویزیونهای جدید Artline با قابهایی در CES بازسازی کرد. @TechCrunch
- گوگل ویژگیهای جدید Gemini را برای تلویزیون در CES 2026 پیشنمایش کرد. @TechCrunch
- دستیار صوتی BMW iX3 مدل 2026 توسط Alexa+ پشتیبانی خواهد شد. @TechCrunch
- LG در CES 2026 CLOiD را به نمایش گذاشت، اولین نمایش رباتیک که برای خودکارسازی کارهای خانه از جمله نمایش زندهی لباسشویی طراحی شده است. @TechCrunch
پژوهشها
- یک پست وبلاگ جامع 13000 کلمهای منتشر شد که ترفندها و بهترین شیوههای عملی برای GRPO (بهینهسازی سیاست نسبی گروهی) را تشریح میکند، از جمله تکنیکهایی مانند Clip Higher، Dynamic Sampling، Token-level Loss، Alternative Aggregation، Overlong Rewards، حذف انحراف معیار، Truncated Importance Sampling و CISPO برای رفع بیثباتی آموزش و فروپاشی آنتروپی در مقیاس بزرگ. @cwolferesearch
- تحقیقات در مورد کمبود آهن عملکردی که به طور بالقوه در هستهی بیماری پارکینسون قرار دارد، که دگمای موجود را به چالش میکشد. @EricTopol
- پیشنهادی برای یک نقطهی عطف جدید به سمت AGI به نام هوش مصنوعی توانمند (ACI)، که به عنوان توانایی یک عامل برای تبدیل قانونی 100 هزار دلار به 1 میلیون دلار تعریف میشود، که به عنوان آزمون تورینگ مدرن توصیف شده است. @mustafasuleyman
- فیزیکدانان MIT پیشنهاد میکنند که تحت شرایط خاص، الکترونهای یک مادهی مغناطیسی میتوانند به کسرهایی تقسیم شوند تا شبهذراتی به نام آنیونها را تشکیل دهند. @MIT
- تیم FAIR Perception متا SAM 3D را منتشر کرد، یک پیشرفت بزرگ در بینایی سهبعدی با قابلیت بازسازی هر شیء در سهبعدی تنها از یک تصویر. <a href="https://x.com/georgiagk
کاربردها
- یک توسعهدهنده گزارش میدهد که با استفاده از Claude، سالها کار تئوری را تنها در 4 ساعت به کد کاربردی تبدیل کرده و سپس در زمان استراحت ناهار، آن را با موفقیت از Golang به Rust تبدیل کرده است. این موضوع نشاندهندهی توانایی هوش مصنوعی در تسریع توسعهی نرمافزارهای پیچیده است @JustJake
- یک توسعهدهنده توضیح میدهد که در تعطیلات کریسمس، پروژههای کدنویسی شخصی بیشتری را نسبت به 10 سال گذشتهی خود به اتمام رسانده است. او این افزایش بهرهوری را به دستیاران کدنویسی هوش مصنوعی نسبت میدهد، با وجود اینکه محدودیتهای فعلی آنها را میشناسد @DavidSHolz
- یک توسعهدهنده گزارش میدهد که یک عامل هوش مصنوعی به مدت 6 ساعت به طور خودکار CI را اشکالزدایی کرده است، در حالی که او وقت خود را با خانوادهاش گذرانده است. این موضوع نشاندهندهی واگذاری عملی کارهای فنی به سیستمهای هوش مصنوعی است @aarondfrancis
- یک توسعهدهندهی پایتون، تغییر استراتژیک به استفاده از Next.js برای برنامههای وب را اعلام میکند، با وجود ترجیح شخصیاش. او به افزایش قابل توجه بهرهوری ناشی از استفاده از پشتههای فناوری مورد علاقهی هوش مصنوعی اشاره میکند، به جای اینکه با ابزارهای کمتر پشتیبانیشده دست و پنجه نرم کند @HamelHusain
- یک متخصص حقوقی مشاهده میکند که Claude و ChatGPT میتوانند موقعیتهای حقوقی پیچیده را تجزیه و تحلیل کرده و تحلیلی مشابه آنچه شرکتهای حقوقی پس از هفتهها بررسی ارائه میدهند، ارائه دهند. او پایداری مدلهای صورتحساب ساعتی را زیر سوال میبرد، در حالی که هوش مصنوعی میتواند تحقیقات عمیق را در عرض چند دقیقه انجام دهد @GergelyOrosz
تحلیل صنعت
- StackOverflow کاهش چشمگیری در تعداد سوالات ماهانه نشان میدهد، که حاکی از آن است که توسعهدهندگان به طور فزایندهای به جای انجمنهای جامعه، برای کمک در کدنویسی به دستیاران هوش مصنوعی روی میآورند @samwhoo
- مدیرعامل Linear استدلال میکند که عوامل هوش مصنوعی در حال فروپاشی جریان کاری سنتی توسعهی محصول هستند، جایی که ترجمه از الزامات به کد 70 درصد زمان را مصرف میکرد. این امر نقاط اهرمی را معکوس میکند، به طوری که اکنون شفافیت در درک نیت مشتری اهمیت بیشتری نسبت به ترجمهی پیادهسازی دارد @karrisaarinen
- شرکتهای فناوری به طور فعال در حال ارزیابی ابزارهای هوش مصنوعی برای توسعهدهندگان در زمینههای کدنویسی، زیرساخت و بازبینی کد هستند، اگرچه عدم قطعیت در مورد اینکه کدام فروشندگان را انتخاب کنند و چه ابعادی را اندازهگیری کنند، همچنان باقی است @GergelyOrosz
- شرکتهای حقوقی ممکن است هزینهها را از طریق هوش مصنوعی کاهش دهند، اما لزوماً این صرفهجوییها را به مشتریان منتقل نخواهند کرد، زیرا صورتحساب همچنان به ریسک و تأثیر گره خورده است تا ساعات صرف شده. شرکتها توانایی خود را برای دریافت هزینه بر اساس مسئولیت سوء عملکرد و اهمیت پرونده حفظ میکنند @GergelyOrosz
- کار محصول از اجرا به سمت جستجوی وضوح و ایجاد شرایط برای ظهور راهحلهای خوب در حال تغییر است، با هدایت و مدیریت کار عامل به عنوان مهارت جدید، در حالی که هوش مصنوعی پیادهسازی را انجام میدهد @karrisaarinen
مدلهای جدید هوش مصنوعی
- تنسنت مدلهای ترجمهی Tencent-HY-MT1.5 را در نسخههای 1.8B و 7B پارامتری به صورت متنباز منتشر میکند. مدل 1.8B برای استقرار روی دستگاه بهینه شده است و به تأخیر 0.18 ثانیه دست مییابد و از APIهای تجاری اصلی بهتر عمل میکند، در حالی که نسخهی 7B از مدلهای متنباز متوسط پیشی میگیرد @TencentHunyuan
- Galaxea Dynamics مدل G0 Plus VLA را با دمو "Pick Up Anything" منتشر میکند، که هوش تجسمی بدون آموزش تخصصی را برای کارهای رباتیک متنوع در دنیای واقعی از طریق دستورات زبان خالص به نمایش میگذارد @GalaxeaDynamics
- GenrobotAI مجموعهدادهی RealOmni-Open Dataset را با بیش از 10,000 ساعت، 1 میلیون کلیپ، 30+ مهارت در بیش از 3,000 خانهی واقعی راهاندازی میکند، که بزرگترین مجموعهدادهی هوش مصنوعی تجسمی متنباز از نظر ساعت است @GenrobotAI
پژوهشها
- تحقیقات در مورد بازارهای پیشبینی نشان میدهد که Claude Opus 4.5 بهترین عملکرد را با امتیاز بریر تقریباً 0.23 در 300 بازار Kalshi به دست آورده است، که به محدودهی 0.15-0.2 پیشبینیکنندگان انسانی نزدیک میشود اما هنوز به آن نمیرسد، در حالی که GPT 5.2 XHigh کمتر از حد انتظار عمل کرده است @deedydas
- محققان به بیثباتی یادگیری تقویتی در مدلهای Mixture of Experts از طریق بازپخش متخصص/مسیریابی میپردازند، که متخصصان فعال شده را در طول تولید رولاوت ذخیره میکند و از آنها برای بهروزرسانی سیاست استفاده میکند، و مشکلی را حل میکند که در آن 10 درصد از متخصصان پس از هر بهروزرسانی گرادیان در مدلهای عمیقتر مانند Qwen3-30B-A3B-Base تغییر میکنند @cwolferesearch
- یان لکون اصول معماری JEPA را تشریح میکند و استدلال میکند که آموزش با بازسازی در فضای ورودی غیرمولد است و پیشبینی باید در فضای نمایش انجام شود، با روشهای کنتراست ابعادی مانند SIGReg/LeJEPA که بیشترین امید را نسبت به رویکردهای EMA و کنتراست نمونه نشان میدهند @ylecun
- مهندسان گزارش میدهند که GPT-5.2 و Opus 4.5 که در نوامبر منتشر شدند، نقطهی عطفی را نشان میدهند که در آن بهبودهای تدریجی از یک آستانهی قابلیت نامرئی عبور کردند و ناگهان مشکلات کدنویسی بسیار دشوارتری را که قبلاً غیرقابل حل بودند، باز کردند @simonw
اخلاق و جامعه
- مقامات فرانسوی و مالزیایی در حال بررسی Grok به دلیل تولید دیپفیکهای جنسی هستند، که نگرانیهایی را در مورد محتوای مضر تولید شده توسط هوش مصنوعی ایجاد میکند @TechCrunch
- نیویورک تایمز گزارش میدهد که اوکراین استفادهی روزانه از پهپادهای تهاجمی هوش مصنوعی را آغاز کرده است که به طور خودکار اهداف را پیدا میکنند، آنها را ردیابی میکنند و حتی پس از قطع سیگنالهای خلبان توسط پارازیت، به طور مستقل حمله میکنند، که نشاندهندهی ورود کشتار خودکار به جنگ است @Mylovanov
- Wegmans در فروشگاههای شهر نیویورک تابلوهای اطلاعرسانی در مورد جمعآوری تشخیص چهره، اسکن چشم و اثر صوتی به دلیل قانون سال 2021 نصب کرده است، اگرچه چنین الزاماتی برای سازمانهای دولتی یا بانکها اعمال نمیشود، که نشاندهندهی جمعآوری گستردهی دادههای بیومتریک در شهرهای بزرگ است @AndrewCurran_
- یک ناظر اشاره میکند که مدلهای هوش مصنوعی که برای دقت آموزش دیدهاند، در مورد رویدادهای جاری بیاعتماد میشوند، زیرا واقعیت از دیدگاه گذشته به طور فزایندهای شبیه توهمات است @AndrewCurran_
- رفتار کاربران با جستجوی هوش مصنوعی از پذیرش بیچون و چرا در سال 2024 به شک و تردید فزاینده در سال 2026 در حال تغییر است، به طوری که مردم اکنون تأیید دقیق انجام میدهند و اطلاعات ناکافی را زیر سوال میبرند @AndrewCurran_
- داوران دانشگاهی ممکن است به زودی توسط مدلهای هوش مصنوعی مانند GPT X Pro نه تنها از نظر کیفیت، بلکه از نظر زمان صرف شده برای بررسی مقالات، پیشی گرفته شوند @natolambert
تحلیل صنعت
- مدیرعامل گیتهاب تأکید میکند که در حالی که عاملهای هوش مصنوعی میتوانند ویژگیهای فنی محصولات SaaS میلیارد دلاری مانند Typeform را بازتولید کنند، ارزش تجاری واقعی در قابلیتهای فروش سازمانی نهفته است، نه در دشواری کدنویسی. @GergelyOrosz
- پل گراهام مشاهده میکند که هوش مصنوعی با تولید نسخههای اولیه در زمانی که تیمها در اثر عدم تصمیمگیری فلج شدهاند، بوروکراسی سازمانی را از بین میبرد و یک نقطه شروع ایجاد میکند که به نسخه یک واقعی تبدیل میشود. @paulg
- یک توسعهدهنده از تغییر اساسی در گردش کار کدنویسی طی دو هفته گذشته خبر میدهد که از استفادهی سنتی از IDE به سمت CLI، رابطهای وب و دستگاههای موبایل برای تولید کد حرکت کرده است. @GergelyOrosz
- صنعت در حال تجربهی تحول سریع در ابزارهای توسعه طی تنها چند ماه است، با گردش کارهای جدیدی که برای توسعهدهندگان آینده که وارد این حوزه میشوند، به استاندارد تبدیل شدهاند. @GergelyOrosz
- مهندس گوگل گزارش میدهد که **Claude Code** در یک ساعت چیزی را تولید کرده که تیم آنها یک سال برای ساخت آن برای هماهنگکنندههای عامل توزیعشده تلاش کرده بود، که چالشهای همسویی سازمانی را برجسته میکند. @paulg
کاربردها
- یک توسعهدهنده با موفقیت از **Claude Code** برای ساخت یک افزونهی پیچیدهی Jupyter در 8 ساعت استفاده کرده است، با ارائهی ابزارهای تست خاص به عنوان مهارت و حفظ مجموعههای تست جامع در طول توسعه. @HamelHusain
- توسعهدهندگان اکنون میتوانند با اتصال مخازن گیتهاب از طریق Claude Code for the Web، از تلفنهای همراه کدنویسی کنند و درخواستهای پول (pull requests) ایجاد کرده و تستهای خودکار را به طور کامل از دستگاههای موبایل اجرا کنند. @GergelyOrosz
- Claude Code میتواند تنظیمات ترمینال توسعهدهنده را با جایگزینی خودکار ابزارهای CLI داخلی با جایگزینهای سریعتر Rust/Go و نصب برنامههای بومی بهتر مک، بهینه کند. @deedydas
- Rust به دلیل تضمینهای صحت در زمان کامپایل، به عنوان زبان ایدهآل برای عاملهای هوش مصنوعی شناسایی شده است. @gdb
اخلاق و جامعه
- Stanford HAI هشدار میدهد که برنامههای «undress» که به نوجوانان امکان میدهد پورنوگرافی جعلی متقاعدکننده از همکلاسیهای خود ایجاد کنند، یک تهدید هوش مصنوعی است که مدارس برای آن آماده نیستند و پیشگیری تنها استراتژی قابل اجرا است. @StanfordHAI
- کلر وو از هک تعامل نوظهور انتقاد میکند که در آن سازندگان از هوش مصنوعی برای تهیهی تحلیلهای شبهدانشگاهی از پستهای پرطرفدار استفاده میکنند و محتوای بیارزش و بدون بینش یا تجربهی منحصر به فرد تولید میکنند. @clairevo
- نگرانیهایی در مورد قرارگیری محتوای نامناسب در بخش کودکان کتابخانهی عمومی سانفرانسیسکو مطرح شده است که چالشهای مدیریت فضاهای اطلاعات عمومی را برجسته میکند. @clairevo
پژوهشها
- زِیوان آلن-ژو، پژوهشگر FAIR، یک آموزش در مورد فیزیک مدلهای زبان ارائه میدهد که بیش از 20 اصل معماری را استخراج میکند، از جمله اینکه چرا لایههای Canon از طریق تغییر شکل یادگیری سلسلهمراتبی کار میکنند و چرا مدلهای خطی 4 برابر کمعمقتر از ترنسفورمرها استدلال میکنند. @alexandr_wang
- پژوهش نشان میدهد که اصول معماری در پیشآموزش در مقیاس آکادمیک با 1.3 میلیارد پارامتر و 100 میلیارد توکن در حال ظهور هستند که هزینهی بسیار کمتری نسبت به اجراهای در مقیاس بزرگ ارائه میدهند. @alexandr_wang
- Stanford NLP مفهوم مدلهای زبان بازگشتی را معرفی میکند که در آن مدلها، پرامپتهای خود را به عنوان اشیایی در محیطهای خارجی در نظر میگیرند و آنها را از طریق کدی که LLMها را فراخوانی میکند، دستکاری میکنند. @a1zhang
- ایتان مولیک مدیریت عاملهای هوش مصنوعی را اساساً یک مشکل مدیریتی میداند که نیازمند مهارتهایی در تعیین هدف، ارائهی زمینه، تقسیم وظایف و ارائهی بازخورد است. @emollick
- یک پژوهشگر استدلال میکند که سلسلهمراتب برای عاملها باید از اشکال مدیریت سازمانی الهام بگیرد تا از شیوههای کدنویسی، با مقالات اولیه که نتایج امیدوارکنندهای را نشان میدهند. @emollick
- فرانسوا شوله تأکید میکند که کودکان با استفاده از موز به عنوان تلفن، یک شاهکار عظیم انتزاع را از طریق نگاشت بازنمایی نشان میدهند و برنامههای رفتاری را از ورودیهای انتزاعی خود جدا میکنند. @fchollet
- ماهیت غیرقطعی LLMها به عنوان یک چالش اصلی برای استفادهی قابل اعتماد شناسایی شده است، با رویکرد «چندین بار اجرا کن» که یک راهحل موقت است تا یک راهحل قابل اعتماد که نیازمند بررسی انسانی است. @GergelyOrosz
- دیدی داس از Pangram AI detector دفاع میکند و میگوید که نرخهای مثبت کاذب و منفی کاذب آن به طور مستقل زیر 0.5% ارزیابی شدهاند و روی متنی که از طریق انسانیسازها و مدلهای جدید از جمله **GPT-5**، **Grok** و **Sonnet 4.5** عبور کرده، کار میکند. @deedydas
مدلهای جدید هوش مصنوعی
- علیبابا Qwen-Image-2512 را منتشر کرد، یک مدل تبدیل متن به تصویر ارتقاءیافته که دارای رندرینگ واقعگرایانهتر انسان با «ظاهر هوش مصنوعی» کمتر، جزئیات طبیعی دقیقتر در مناظر و بافتها، و دقت بهبودیافته در رندرینگ متن است @Alibaba_Qwen
- vLLM پشتیبانی روز صفر را برای Qwen-Image-2512 با معماری خط لولهی بهینهشده اعلام کرد @Alibaba_Qwen
- تیم SGLang پشتیبانی یکپارچه از Qwen-Image-2512 را به عنوان یک بهروزرسانی وزن، با حفظ عملکرد سریع و قابل اعتماد، ارائه میدهد @Alibaba_Qwen
- Pruna AI مدل Qwen-Image-2512 را برای تولید تصاویر با وضوح بالا در حدود 7 ثانیه در Replicate بهینه میکند @Alibaba_Qwen
- GLM-4.7 با موفقیت روی 115 گیگابایت VRAM اجرا میشود که نشاندهندهی استفادهی کارآمد از منابع است @huggingface
تحلیل صنعت
- بانکهای اروپایی قصد دارند 200,000 شغل را کاهش دهند زیرا پذیرش هوش مصنوعی در سراسر بخش مالی سرعت میگیرد @TechCrunch
- یک توسعهدهنده گزارش میدهد که در سال 2025 در ChatPRD کمتر از حقوق یک مهندس تماموقت آمریکایی را برای هوش مصنوعی و ابزارهای مهندسی هزینه کرده است و با توسعهدهندگان بینالمللی و عوامل هوش مصنوعی به 1500 PR و بیش از 2 میلیارد توکن پردازششده دست یافته است @clairevo
- یک توسعهدهنده نشان میدهد که چگونه میتوان یک کسبوکار 100 میلیون دلاری با حمایت سرمایهگذاران را در یک هفته با استفاده از ابزارهای هوش مصنوعی ساخت، که نشاندهندهی اهرم قابل توجهی است که هوش مصنوعی برای سازندگان فردی فراهم میکند @OfficialLoganK
- استارتاپهای سختافزاری پس از چندین شکست بزرگ با دموهای جذاب اما محصولات ضعیف، با افزایش بدبینی مصرفکنندگان مواجه هستند، که باعث میشود کسبوکارهای سختافزاری جدید و مشروع برای جلب اعتماد با مشکل مواجه شوند @GergelyOrosz
- یکی از کارمندان Replit تجربهی کار در یک استارتاپ هوش مصنوعی با رشد فوقالعاده را در دوران بارداری و بزرگ کردن یک کودک نوپا به اشتراک میگذارد، که نشاندهندهی فرهنگ حمایتی شرکت برای والدین با وجود تقاضاهای کاری شدید است @HayaOdeh
- TechCrunch پیشبینی میکند که سال 2026 شاهد حرکت هوش مصنوعی از هیجان به عملگرایی خواهد بود زیرا این فناوری به بلوغ میرسد @TechCrunch
- امپراتوری هوش مصنوعی NVIDIA از طریق تحلیل سرمایهگذاریهای برتر استارتاپی آن بررسی میشود، که موقعیت استراتژیک آن را در اکوسیستم هوش مصنوعی آشکار میکند @TechCrunch
اخلاق و جامعه
- لحظهی تولید تصویر ویروسی Grok فرا میرسد، که نوع متفاوتی از پدیدهی محتوای تولیدشده توسط هوش مصنوعی را در مقایسه با روندهای قبلی نشان میدهد @AndrewCurran_
- هند به X دستور میدهد تا Grok را به دلیل محتوای تولیدشده توسط هوش مصنوعی «ناشایست» اصلاح کند، که چالشهای نظارتی با تولید محتوای هوش مصنوعی را برجسته میکند @TechCrunch
- مدیرعامل Zomato از ChatGPT برای ارتباطات بحران و روابط عمومی استفاده میکند، که نشان میدهد چگونه هوش مصنوعی در حال تغییر شیوههای ارتباطات شرکتی در مقابل چشمان عموم است @deedydas
- شرکتهای هوش مصنوعی به دلیل عدم شفافیت در نشان دادن به کاربران که چه زمانی از مدلهای خوب در مقابل مدلهای بد استفاده میکنند، مورد انتقاد قرار میگیرند، که باعث سردرگمی در مورد قابلیتهای هوش مصنوعی و محدود کردن درک کاربر از آنچه هوش مصنوعی واقعاً میتواند انجام دهد، میشود @emollick
- یک محقق امنیتی در مورد تبدیل شدن عوامل هوش مصنوعی دسکتاپ به اهداف بدافزار با افزایش محبوبیت آنها هشدار میدهد و خاطرنشان میکند که در حالی که پلتفرمهای وب و موبایل دارای سندباکسینگ قوی برنامه برای امنیت هستند، عوامل دسکتاپ برای عملکرد مؤثر به دسترسی به فایلها در سراسر مرزهای برنامه نیاز دارند @random_walker
کاربردها
- یک توسعهدهنده با موفقیت قابلیتهای صدا، بینایی و حرکت را برای ربات Reachy شرکت Pollen Robotics با استفاده از یک عامل LiveKit پیادهسازی میکند و یک تجربهی رباتیک واقعی ایجاد میکند @huggingface
- یک توسعهدهنده نشان میدهد که چگونه از GLM-4.7-4bit با mlx_lm.server و opencode برای رفع اشکال کد واقعی به صورت محلی روی یک ماشین M3 Ultra 512GB استفاده میکند، با برنامههایی برای مقیاسبندی با استفاده از Tensor Parallelism @simonw
- یک توسعهدهنده گزارش میدهد که Codex فرآیند توسعهی آنها را به طور اساسی تغییر داده است، به آنها اجازه میدهد تا روی کارهای سطح بالاتر تمرکز کنند بدون اینکه در جزئیات کوچک غرق شوند، و آنها را قادر میسازد تا با سرعتی که انتظار دارند کار کنند و برای پروژههای جانبی وقت داشته باشند @gdb
- یک توسعهدهنده از تماشای پیشرفت Codex در انجام وظایف در طول شب ابراز رضایت میکند، که قابلیتهای خودمختار دستیاران کدنویسی هوش مصنوعی را برجسته میکند @gdb
- Codex ویژگی فراخوانی مهارت صریح را با تایپ $ و تکمیل خودکار معرفی میکند، با نوآوریهای بیشتر برنامهریزیشده برای ژانویه @sama
- Hugging Face Inference Providers مدیریت چندین API ارائهدهندهی هوش مصنوعی را با ارائهی یک API برای صدها مدل از Cohere، Groq، Replicate، Together AI و موارد دیگر ساده میکند، که از تولید متن، ایجاد تصویر و جاسازیها پشتیبانی میکند @huggingface
- یک توسعهدهنده مجموعههای تست دادهمحور مستقل از زبان را ایجاد میکند که به اندازهی کافی جامع هستند تا عوامل کدنویسی را قادر سازند تا پیادهسازیهای مطابق را از ابتدا در هر زبان برنامهنویسی بسازند @simonw
پژوهشها
- Prime Intellect تحقیقاتی را در مورد مدلهای زبان بازگشتی (RLMs) معرفی میکند و معتقد است که آموزش مدلها برای مدیریت زمینهی خود به صورت سرتاسری از طریق یادگیری تقویتی، پیشرفت بزرگ بعدی برای توانمندسازی عوامل برای حل وظایف بلندمدت که هفتهها تا ماهها طول میکشد، خواهد بود @AndrewCurran_
- یک محقق تضاد بین عملکرد GPT-5-mini در DeepDive و معیارهای math-python را به عنوان شواهدی برای افزایش عملکرد بالقوه عظیم ناشی از آموزش بر روی RLM برجسته میکند @AndrewCurran_
- Geometric Mean Policy Optimization (GMPO) به عنوان یک نوع بهبودیافتهی GRPO معرفی شد که میانگین حسابی را با میانگین هندسی برای تجمیع ضررهای سطح توکن جایگزین میکند، حساسیت به نقاط پرت را کاهش میدهد و پایداری آموزش را بهبود میبخشد در حالی که از فروپاشی آنتروپی جلوگیری میکند @cwolferesearch
- OlMo 3 ترفندهای کلیدی برای کارآمدتر کردن RL را نشان میدهد، از جمله تنظیمات کاملاً ناهمزمان خارج از سیاست، دستهبندی پیوسته، جبران نمونهبرداری فعال، و بهروزرسانیهای وزن مدل در حین پرواز، که زمان آموزش RL را بدون تأثیر بر عملکرد به نصف کاهش میدهد @cwolferesearch
- یک محقق لیست جامعی از گزارشهای فنی مدل استدلال از سال 2025 را گردآوری میکند، که از DeepSeek R1 در ژانویه تا MiMo-V2-Flash در دسامبر را شامل میشود و تکامل سریع قابلیتهای استدلال را مستند میکند @natolambert
- کتاب RLHF بهروزرسانی بزرگی دریافت میکند که از 150 به 200 صفحه افزایش مییابد، شامل الگوریتمهای جدیدی مانند GSPO و CISPO، جدول بهروزرسانیشدهی گزارشهای فنی مدل استدلال، بخشی در مورد Rubrics برای RLVR، و بهبود ثبات نمادگذاری در سراسر کتاب @natolambert
- یک محقق رویکردهای متفاوت مدلهای هوش مصنوعی را به سوالات سرمایهگذاری تاریخی نشان میدهد، با Gemini که یک نمونهی Magna Carta 1297 را توصیه میکند، ChatGPT که سهام در معدن مس Stora Kopparberg را پیشنهاد میکند، و Claude که مشارکت در وقف اسلامی را مطرح میکند @emollick
- اعتبار معیار مورد سوال قرار میگیرد زیرا IQuest-Coder به اشتباه تنظیم شده است، از جمله کل تاریخچه گیت با کامیتهای آینده، که به مدلها اجازه میدهد به جای حل مشروع مشکلات، از این موضوع سوءاستفاده کنند @deedydas
مدلهای جدید هوش مصنوعی
- علیبابا مدل Qwen-Image-2512 را منتشر کرد که اکنون در AI-Toolkit و پلتفرم Replicate در دسترس است. @Alibaba_Qwen
- آیکوئست لبز (IQuest Labs) از چین مدل کدنویسی IQuest-40B را منتشر کرد که به ترتیب به امتیاز 81.4% در SWE-Bench-V و 54.2% در BigCodeBench دست یافته است. این مدل توسط تیمی با ارتباط با توسعهی Qwen ساخته شده است. @deedydas
تحلیل صنعت
- توسعهدهندگان گزارش میدهند که تعطیلات زمستانی را صرف آزمایش با عاملهای هوش مصنوعی کردهاند و بهبودهای قابل توجهی را در قابلیتها طی ماههای اخیر، بهویژه برای توسعهی پروژههای جدید، مشاهده کردهاند. @GergelyOrosz
- بحث فزایندهای در مورد نقش هوش مصنوعی در توسعهی نرمافزار وجود دارد، با شواهدی مبنی بر اینکه نرمافزارهای تولیدی بهطور فزایندهای کد تولیدشده توسط هوش مصنوعی را در خود جای میدهند، اگرچه بهندرت 100% توسط هوش مصنوعی تولید میشوند. @GergelyOrosz
- تیم مصرفکنندهی a16z روندهای سال 2026 را پیشبینی میکند که شامل استفادهی سازمانی برای هدایت پذیرش مصرفکننده، افزایش تولید اپلیکیشن، و قابلیتهای چندوجهی «هر چیزی به هر چیزی» است که محصولات خاص را ممکن میسازد. @a16z
- تحقیقات نشان میدهد که دانشمندانی که از مدلهای زبان بزرگ استفاده میکنند، بهطور متوسط 40% بهرهورتر میشوند، و افراد غیربومی انگلیسیزبان تا 80% افزایش بهرهوری را تجربه میکنند، که نگرانیهایی را در مورد ظرفیت داوری همتا ایجاد میکند. @AndrewCurran_
- اوپنایآی در حال توسعهی معماری جدید مدل صوتی است که برای انتشار در سهماههی اول 2026 برنامهریزی شده است تا از دستگاه همراه مبتنی بر صدا پشتیبانی کند، با بهبودهایی در طبیعی بودن، دقت، و مدیریت وقفهها. @AndrewCurran_
- ممیزی تولید انبوه Optimus Gen3 تسلا با هفت تامینکنندهی چینی نهایی شده است، با هدف شروع تولید در سهماههی اول 2026 و ظرفیت 50,000 تا 100,000 واحد تا پایان سال. @AndrewCurran_
پژوهشها
- دیپسیک (DeepSeek) مقالهی mHC: Manifold-Constrained Hyper-Connections را منتشر کرد که آموزش هایپرکانکشن پایدار را معرفی میکند که امکان مقیاسبندی عرض جریان باقیمانده را با حداقل سربار محاسباتی و حافظه از طریق ماتریسهای دوگانه تصادفی فراهم میکند. @chrmanning
- معماری هایپرکانکشنها مسیرهای موازی در ترانسفورمرها با بازتوزیع سیگنال حفظکنندهی جرم ایجاد میکند که تقریباً 0.02 کاهش در افت نهایی را با تنها 6.7% زمان آموزش اضافی به دست میآورد. @AndrewCurran_
کاربردها
- توسعهدهندهای با استفاده از Cursor یک اپلیکیشن مک سفارشی برای توالیبندی ویدئو با ویژگیهایی از جمله بازچینی تصادفی، تبدیلها، و جدول زمانی بصری ساخت که قابلیتهایی را نشان میدهد که در ابزارهای سنتی امکانپذیر نیستند. @benblumenrose
- مهندسی وایب (Vibe engineering) به عنوان یک مهارت نوظهور شناسایی شده است که نیازمند جهتدهی دقیق، پیشبینی مسائل، و دانستن زمان کنترل دستی در طول توسعهی با کمک هوش مصنوعی است. @HamelHusain
- مدلهای هوش مصنوعی تجسمیافته (Embodied AI) پیشبینی میشود که با امکانپذیر ساختن ادارهی مزارع کوچک و ایجاد مازاد توسط یک نفر با پشتیبانی ربات، و اتصال از طریق استارلینک که قابلیتهای تکنسین عمومی را فراهم میکند، خانهداری را متحول کنند. @AndrewCurran_
اخلاق و جامعه
- جمینای لیستی از 26 مفهوم برای درک تاثیر اجتماعی هوش مصنوعی در سال 2026 تولید میکند، از جمله شکاف پرومتهای که نابرابری فزاینده بین ظرفیت ایجاد فناوری و توانایی تصور پیامدها را توصیف میکند. @emollick
- قانون براندولینی به عنوان یک نگرانی حیاتی برجسته شده است: انرژی مورد نیاز برای رد اطلاعات نادرست چندین برابر بیشتر از تولید آن است، و هوش مصنوعی مولد هزینهی تولید اطلاعات بیاساس را به صفر میرساند. @emollick
- بحث در مورد نقش هوش مصنوعی در جامعه بر نیاز به مقررات متفکرانه تاکید میکند که مزایای تحولآفرین را تضمین کرده و در عین حال خطرات را کاهش دهد، با تمرکز بر رهبری ایالات متحده در توسعهی مسئولانهی هوش مصنوعی. @gdb
- هوش مصنوعی به عنوان یک نیروی بالقوه برای دموکراتیک کردن کارآفرینی، بهبود مقرونبهصرفه بودن و اثربخشی مراقبتهای بهداشتی، فراهم کردن دسترسی به آموزش با کیفیت، و تسریع کشف علمی شناسایی شده است. @gdb
- پیشبینی میشود که سال 2026 شاهد موضوعات اصلی پذیرش عاملهای سازمانی و تسریع علمی از طریق هوش مصنوعی باشد. @gdb
مدلهای جدید هوش مصنوعی
- علیبابا مدل Qwen-Image-2512 را منتشر کرد؛ یک مدل تبدیل متن به تصویر ارتقاءیافته که رندرهای انسانی واقعگرایانهتر با «ظاهر هوش مصنوعی» کمتر، بافتهای طبیعی دقیقتر برای مناظر و مواد، و قابلیتهای رندر متن قویتر را ارائه میدهد. این مدل در بیش از 10,000 دور آزمایش کور در AI Arena، بهعنوان قویترین مدل تصویر متنباز رتبهبندی شده و در عین حال با سیستمهای متنبسته نیز رقابت میکند @Alibaba_Qwen
- وزارت علوم کرهی جنوبی، طرح هوش مصنوعی ملی را با پنج شرکت آغاز کرد که مدلهای متنباز خود را منتشر کردند: A.X-K1 از SK Telecom (مجموعاً 519 میلیارد، 33 میلیارد پارامتر فعال)، K-EXAONE از LG (مجموعاً 236 میلیارد، 23 میلیارد فعال)، VAETKI از NC-AI (مجموعاً 112 میلیارد، 10 میلیارد فعال)، Solar-Open از Upstage (مجموعاً 102 میلیارد، 12 میلیارد فعال)، و HyperCLOVAX-SEED-Think از Naver (32 میلیارد متراکم). این برنامهی 140 میلیون دلاری در دور اول، نیازمند آموزش از پایه، قابلیت استفادهی تجاری، و مقیاس بلندپروازانه است @eliebakouch
- OpenAI در 48 ساعت گذشته بیسروصدا «Codex cloud» را به «Codex web» تغییر نام داد @simonw
تحلیل صنعت
- بایتدنس قصد دارد سال آینده 14 میلیارد دلار برای پردازندههای گرافیکی H200 انویدیا هزینه کند، و شرکتهای چینی بیش از 2 میلیون H200 را برای سال 2026 سفارش دادهاند. TSMC باید 1.3 میلیون H200 را تولید کند که تقریباً 24,000 شروع ویفر نیاز دارد، و 3,000 ویفر در ماه از ظرفیت N4 را طی 8 ماه اختصاص میدهد که تقریباً 450 میلیون دلار برای TSMC درآمدزایی میکند @AndrewCurran_
- گزارشهای تأییدنشده ادعا میکنند که قیمتهای NVIDIA RTX 5090 ممکن است طی چند ماه آینده بهتدریج از 1,999 دلار به 5,000 دلار افزایش یابد، اگرچه هیچ بیانیهی رسمی از سوی انویدیا یا AMD منتشر نشده است @AndrewCurran_
- Scale AI گزارش میدهد که سهماههی چهارم 2025 بزرگترین سهماهه در تاریخ آنها بوده است، با رشد بیسابقهی کسبوکار دولتی ایالات متحده، کسبوکار دادهی سودآور، و چندین قرارداد سازمانی و دولتی نهرقمی @alexandr_wang
- سرمایهگذاران پیشبینی میکنند که هوش مصنوعی در سال 2026 به نیروی کار خواهد رسید، که نشاندهندهی تحول بزرگ در نیروی کار در آینده است @TechCrunch
- انتظار میرود تقاضا برای آموزش افراد غیربرنامهنویس برای تبدیل شدن به توسعهدهندگان توانمند با هوش مصنوعی بهشدت افزایش یابد، اگرچه تسلط بر اصول مهندسی نرمافزار همچنان نیازمند زمان و تلاش قابلتوجهی است که نمیتوان از آن صرفنظر کرد @GergelyOrosz
- کره در یک روز مدلهای با بیش از 100 میلیارد پارامتر بیشتری را منتشر کرد تا اتحادیهی اروپا یا ایالات متحده در کل سال 2025، که این امر تنها با تقریباً 1,000 پردازندهی گرافیکی B200 از سوی دولت انجام شد @eliebakouch
اخلاق و جامعه
- پلتفرم X به Grok اجازه میدهد بدون رضایت افراد تصویرشده، عکس تولید کند، که نگرانیهایی را در مورد رفتار نامناسب و عدم وجود مکانیزمهای رضایت ایجاد میکند @RhysSullivan
- تحلیلها این سؤال را مطرح میکنند که آیا راستیآزمایی هوش مصنوعی واقعاً محیط اطلاعاتی در X را بهبود بخشیده است یا خیر، و اشاره میکنند که Grok ظاهراً قادر به تغییر نظر شخصیتهای اصلی در مورد مسائل با اعتقاد قوی نیست، که نشاندهندهی محدودیتهای هوش مصنوعی در غلبه بر پیشفرضهای عمیق است و ابزارهای راستیآزمایی بیشتر از طریق دسترسی به اطلاعات، گفتمان را بهبود میبخشند تا از طریق اقناع @emollick
- رسانههای اجتماعی بهعنوان یک آرامبخش توصیف میشوند که باعث میشود مردم آزادی و اختیار خود را فراموش کنند، با یادآوری اینکه «شما میتوانید کارها را انجام دهید، اما ابتدا باید برنامه را ببندید» @fchollet
کاربردها
- کاربر، گزارش اشکالزدایی متخصص با هوش مصنوعی را با استفاده از هوش مصنوعی برای نوشتن اسکریپتهای پایتون که فایلهای خرابی را رمزگشایی میکنند، آنها را با فایلهای dsym مطابقت میدهند، و پایگاههای کد را برای یافتن ریشهی مشکلات تجزیه و تحلیل میکنند، نشان میدهد، با وجود اینکه هیچ دانشی از Zig، توسعهی macOS، یا ترمینالها ندارد. این منجر به رفع 4 مورد خرابی واقعی در Ghostty شد، که نشان میدهد چگونه درایورهای هوش مصنوعی با کیفیت بالا میتوانند در ترکیب با ناوبری انسانی متفکرانه و تفکر انتقادی، مشارکتهای ارزشمندی را ایجاد کنند @mitchellh
- توسعهدهنده گزارش میدهد که یک پروژهی افزونهی Jupyter را در 8 ساعت با استفاده از عوامل هوش مصنوعی با ابزارهای تست خاص بستهبندیشده بهعنوان مهارتها، مجموعههای تست جامع، و نظارت دقیق بر تفاوتها و ردیابی تفکر، تکمیل کرده است. با وجود قابلیت تکرار ویژگیها، توسعهدهنده اشاره میکند که این امر SaaS را از بین نمیبرد، به دلیل تعداد زیاد ویژگیها، مشکلات کوچک، و ترجیح برای واگذاری تنظیمات مداوم به تیمهای متمرکز با سلیقهی خوب @HamelHusain
- توسعهدهنده گزارش میدهد که 100% مشارکتها در Claude Code در سی روز گذشته توسط خود Claude Code نوشته شده است، که پیشبینی داریو مبنی بر اینکه 90% کد توسط هوش مصنوعی نوشته خواهد شد را تنها با چند ماه اختلاف تأیید میکند @emollick
- تسلا FSD V14.2 اولین رانندگی کاملاً خودران از ساحل به ساحل در سراسر ایالات متحده را بدون هیچگونه دخالتی تکمیل کرد، که 2,732.4 مایل از لسآنجلس تا میرتل بیچ را طی 2 روز و 20 ساعت، شامل تمام پارک کردن در سوپرشارژرهای تسلا، پوشش داد. این دستاورد یک نقطهی عطف بزرگ است که از ابتدا هدف تیم اتوپایلوت بود @karpathy
- جمینی قابلیتهای یادگیری تعاملی را با تولید تصاویر کاملاً تعاملی در هر موضوعی که کاربران میتوانند هر منطقهای را برای دریافت توضیحات کامل برجسته کنند، نشان میدهد، که پتانسیل بهبود آموزش را نشان میدهد @JeffDean
- مدلهای هوش مصنوعی تجسمیافته میتوانند زندگی روستایی را متحول کنند و به یک نفر با پشتیبانی رباتها امکان دهند تا یک مزرعهی کوچک را بهطور واقعبینانه اداره کند و مازاد تولید کند، با رباتهایی که بهعنوان تکنسینهای عمومی، مکانیکها، و پزشکان 24/7 در دسترس هستند @AndrewCurran_
- تمرکززدایی رادیکال توسعهی نرمافزار با حداقل 260 پیادهسازی سفارشی «loom» تا چند ماه پیش، که احتمالاً از آن زمان دو برابر شده است، در حال شتاب گرفتن است. این روند نشاندهندهی آیندهای است که در آن سیستمعاملهای شخصی و نرمافزارهای بومی هوش مصنوعی و خودتغییردهنده که بهعنوان ذهنهای توسعهیافته بهینه شدهاند، رایج میشوند و از نرمافزارهای متمرکز شرکتی به سمت راهحلهای خانگی حرکت میکنند @repligate
- ادغامهای Replit MCP امکان ایجاد وبسایت با پرداختهای جهانی را با یک بار انجام کار فراهم میکند، و به کاربران اجازه میدهد تا در کمتر از 10 دقیقه از ایده به پرداختهای تولیدی برسند، تنها با گفتن «add moneydevkit» @amasad
پژوهشها
- GPT-5.2 Pro عملکرد بسیار قوی در علوم و ریاضیات نشان میدهد و به توانایی حل مسائل FrontierMath Tier 4 نزدیک میشود، که شواهدی را ارائه میدهد که هوش مصنوعی میتواند استدلال پیچیدهی مورد نیاز برای پیشرفتهای علمی در حوزههای فنی را انجام دهد @gdb
- نمونهبرداری اهمیت بریدهشده (TIS) در یادگیری تقویتی، عدم تطابق بین موتورهای نمونهبردار (vLLM/SGLang) و موتورهای یادگیرنده (FSDP/DeepSpeed) را با مقیاسبندی گرادیانهای سیاست با نسبتهای اهمیت محدودشده، برطرف میکند. در حالی که TIS ممکن است پاداشهای ثبتشدهی کمتری را در طول آموزش نشان دهد (یک مصنوع از موتور نمونهبردار)، عملکرد نهایی مدل را با تصحیح عدم تطابق موتور بهبود میبخشد. تحلیلها نشان میدهد که تفاوتهای استراتژی توزیع و طول دنباله بهطور قابلتوجهی بر عدم تطابق تأثیر میگذارند، در حالی که انتخاب بکاند استنتاج حداقل تأثیر را دارد @cwolferesearch
- GLM-4.7 به امتیاز 1224 ELO در جدول ردهبندی GDPval-AA دست یافت و با افزایش 170 امتیازی نسبت به GLM-4.6، رهبر جدید وزنهای باز شد، به این معنی که انتظار میرود خروجیهای GLM-4.7 در مقایسههای رودررو، 73% مواقع GLM-4.6 را شکست دهند @xeophon
- K-EXAONE از LG دارای طراحی MoE دقیق است که با پیشبینی چند توکن (MTP) بهینه شده است، و امکان رمزگشایی خود-حدسی را فراهم میکند که توان عملیاتی استنتاج را تقریباً 1.5 برابر افزایش میدهد @ClementDelangue
- تری تائو، برندهی مدال فیلدز، در مورد آیندهی ریاضیات با سیستمهای اثبات رسمی بحث میکند و میگوید: «من متقاعد شدم که این آیندهی ریاضیات است... این یک سبک متفاوت از نوشتن اثبات است که در برخی جهات خواندن آن آسانتر است – بررسی آن برای انسانها دشوارتر است، اما ورودیها و خروجیهای یک اثبات را واضحتر میبینید، که نوشتار سنتی اغلب آن را پنهان میکند... فکر میکنم تعریف یک ریاضیدان گستردهتر خواهد شد» @mathematics_inc
مدلهای جدید هوش مصنوعی
- علیبابا Qwen Code v0.6.0 را با قابلیت آزمایشی «مهارتها»، پشتیبانی از چندین ارائهدهنده برای Gemini و Anthropic، افزونهی بهبودیافتهی VS Code و دستورات جدید برای استفادهی غیرتعاملی منتشر کرد @Alibaba_Qwen
- علیبابا خانوادهی MAI-UI از عاملهای رابط کاربری گرافیکی (GUI) بنیادی را با یکپارچهسازی ابزار بومی MCP منتشر کرد که به نتایج پیشرفتهای در بنچمارک AndroidWorld دست یافته و از Gemini-2.5-Pro، Seed1.8 و UI-Tars-2 پیشی گرفته است. نسخههای 2B و 8B آن نیز به صورت عمومی در دسترس هستند @Ali_TongyiLab
- Runway یک همکاری استراتژیک چندساله با Adobe را برای یکپارچهسازی مدلهای Runway در ابزارهای Adobe و توسعهی قابلیتهای هوش مصنوعی تخصصی منحصراً برای برنامههای Adobe اعلام کرد @c_valenzuelab
تحلیل صنعت
- متا Manus AI را با بیش از 1 میلیارد دلار خریداری کرد. تیم مستقر در سنگاپور به تلاشهای هوش مصنوعی متا برای ساخت عاملهای عمومی میپیوندد که در حال حاضر به عملکرد پیشرفتهای در بنچمارک Remote Labor Index دست یافتهاند @alexandr_wang
- سافتبانک تعهد سرمایهگذاری 40 میلیارد دلاری خود در OpenAI را با پرداخت نهایی 22 میلیارد دلار تکمیل کرد و سهم خود را به بیش از 10% رساند @AndrewCurran_
- Atlassian گزارش میدهد که شرکتهایی که از ابزارهای تولید کد هوش مصنوعی مانند GitHub Copilot، Claude Code، Cursor و Replit استفاده میکنند، صندلیهای Jira پولی خود را تقریباً 5% سریعتر از شرکتهایی که از این ابزارها استفاده نمیکنند، گسترش میدهند. این نشان میدهد که ابزارهای کدنویسی هوش مصنوعی باعث افزایش استخدام توسعهدهندگان میشوند @tanayj
- سرمایهگذاران خطرپذیر پیشبینی میکنند که شرکتها در سال 2026 هزینههای هوش مصنوعی خود را از طریق تعداد کمتری از فروشندگان، با وجود افزایش کلی هزینهها، تثبیت خواهند کرد @TechCrunch
- Gergelyorosz نسبت به خرید Manus توسط متا بر اساس سابقهی متا در تعطیلی پلتفرمهای SaaS B2B مانند Parse و Meta Workspaces ابراز تردید کرد و به عدم وجود مزیت و ریسک قابل توجه برای کسبوکارهایی که پلتفرمهای متا را که قابل میزبانی شخصی نیستند، اتخاذ میکنند، اشاره کرد @GergelyOrosz
- مهندسان محصولمحوری که میتوانند از ابزارهای هوش مصنوعی با عاملیت برای ساخت راهحلهایی که معیارهای کسبوکار را تغییر میدهند استفاده کنند، به پرتقاضاترین نقش در توسعهی نرمافزار تبدیل خواهند شد @GergelyOrosz
- خانوادهی مدلهای NVIDIA Nemotron بیش از 5 میلیون بار در Hugging Face دانلود شدهاند @NVIDIAAP
اخلاق و جامعه
- مطالعهی استنفورد نشان میدهد که پنج چتبات درمانی محبوب، شرایطی مانند اسکیزوفرنی و وابستگی به الکل را انگ میزنند و نشان میدهد که در حالی که هوش مصنوعی ممکن است در کارهای اداری عالی باشد، حضور انسان برای بهبود ضروری است @StanfordHAI
- مجلات علمی در تشخیص سریع تحقیقات خوب و بد با کمک هوش مصنوعی با چالشهایی روبرو هستند، زیرا فیلترهای ذهنی و رویهای طراحی شده برای کارهای تولید شده توسط انسان، در تشخیص تفاوتهای کیفیت در هنگام دخالت هوش مصنوعی مشکل دارند و این امر ممکن است باعث شود ویراستاران بیشتر به سیگنالهای پر سر و صدا مانند سابقهی قبلی و وابستگی سازمانی تکیه کنند @emollick
- افزونهی مرورگر 1Password به صورت سراسری Prism.js را در هر صفحهی وب تزریق میکند که باعث خراب شدن برجستهسازی نحوهی اصلی میشود و نگرانیهایی را در مورد سهلانگاری ایجاد میکند، زیرا این مشکل در طول آزمایش بتا گزارش شده بود اما همچنان به مرحلهی تولید رسید @youyuxi
کاربردها
- Qwen Code توانایی تجزیهی اسناد PDF به markdown و انجام وظایف ترجمه را نشان میدهد @Alibaba_Qwen
- Tesla FSD Supervised بیش از 9000 مایل متوالی رانندگی بدون دخالت را در بیش از 20 ایالت، از جمله تمام توقفهای پارک و سوپرشارژر، به دست آورده است @Tesla_AI
- محققان استنفورد DataTalk را توسعه دادهاند، ابزاری خاص دامنه که سوالات زبان ساده را به پرسوجوهای پایگاه دادهی تأیید شده ترجمه میکند. این ابزار برای کمک به اتاقهای خبر کمبرخوردار طراحی شده است تا با ابزارهای دقیق به جای هوش مصنوعی عمومی، با فروپاشی اخبار محلی مقابله کنند @StanfordHAI
- توسعهدهندگان نشان میدهند که Claude Opus 4.5 پروژههای پیچیده را از ابتدا میسازد، از جمله یک برنامهی ترمینال کامل MIDI mixer در Rust، یک مفسر جاوااسکریپت در پایتون و یک زمان اجرای WebAssembly، که نشان میدهد یافتن محدودیتهای این مدل دشوار است @simonw
- ترجمهی ماشینی تجارت بینالمللی را 10% افزایش داده است و همان تأثیر اقتصادی را دارد که کوچک کردن اندازهی جهان به میزان 25% @emollick
پژوهشها
- تحقیقات نشان میدهد که 60 مدل یادگیری ماشین برای مولکولها، مواد و پروتئینها با وجود رویکردهای آموزشی متفاوت، به سمت رمزگذاری مشابهی از ساختار مولکولی همگرا میشوند. این امر مفهوم نمایش افلاطونی را از مدلهای زبان به حوزههای علمی گسترش میدهد، اگرچه این همگرایی در ساختارهای خارج از توزیع کار نمیکند @emollick
- نمونهبرداری اهمیت بریدهشده در چارچوبهای یادگیری تقویتی، عدم تطابق بین موتورهای نمونهبردار و یادگیرنده را با مقیاسبندی گرادیانهای سیاست با نسبتهای اهمیت محدود شده، برطرف میکند و عملکرد مدل را با وجود احتمال نشان دادن پاداشهای ثبتشدهی پایینتر در طول آموزش، بهبود میبخشد @cwolferesearch
- بحثهای برنامهنویسی با کمک هوش مصنوعی موازی با بحثهای تاریخی در مورد زبانهای سطح پایین در مقابل زبانهای سطح بالا است، با این تفاوت اساسی که بهرهوری در مقابل کنترل باقی میماند، اگرچه کدنویسی حسی (vibe coding) مانند ویرایشگرهای WYSIWYG برای توسعهی وب، به بنبست رسیده است @random_walker
- فرانسوا شوله استدلال میکند که هوش در سطح انسان یک آستانهی قابلیت خاص نیست، بلکه یک آستانهی کارایی است @fchollet
مدلهای جدید هوش مصنوعی
- Naver مدل استدلالی 32B با وزنهای باز HyperCLOVA X SEED Think را عرضه کرد که در شاخص هوش مصنوعی Artificial Analysis امتیاز 44 را کسب کرده است. این مدل عملکرد قوی در گردشکارهای ابزار-محور عاملگونه با 87% در τ²-Bench Telecom و مصرف توکن بسیار پایین در حدود 39 میلیون توکن استدلالی از خود نشان میدهد @ArtificialAnlys
- Tencent مدل زبان انتشار WeDLM-8B را با رمزگشایی موازی منتشر کرد که در 5 از 6 معیار از Qwen3-8B-Instruct بهتر عمل میکند و با پشتیبانی بومی از کش KV و FlashAttention، عملکرد 3 تا 6 برابر سریعتر در استدلال ریاضی به دست میآورد @victormustar
- Fal مدل FLUX.2 [dev] Turbo را که نسخهی تقطیرشدهی داخلی آنهاست، به صورت متنباز منتشر کرد. این مدل با استفاده از یک نوع سفارشی از تقطیر DMD2، رتبهی اول ELO را در میان مدلهای تصویری متنباز در عرصهی Artificial Analysis با تولید زیر یک ثانیه به دست آورده است @fal
تحلیل صنعت
- توسعهدهندگان باتجربهای که بیشترین اشتیاق را برای ساخت با هوش مصنوعی دارند، کارآفرینانی با سهام مالکیت هستند. این موضوع این سوال را مطرح میکند که آیا استارتاپها ممکن است نیاز داشته باشند سهام بیشتری به مهندسان ارائه دهند، زیرا کدنویسی با هوش مصنوعی بدون مالکیت، لذت ذاتی کمتری پیدا میکند @GergelyOrosz
- یک توسعهدهنده گزارش داد که 100 میلیون دلار برای ساخت یک محصول SaaS هزینه کرده است که یک عامل هوش مصنوعی در 6 ماه عملکرد بهتری از آن ارائه داده است. این موضوع نشاندهندهی تغییر چشمگیر در اقتصاد و قابلیتهای توسعهی نرمافزار است @dboskovic
- آمار استفاده نشان میدهد که تقاضا برای محاسبات به طور مداوم از عرضه پیشی خواهد گرفت، زیرا افزایش قدرت محاسباتی، ضریب پیشرفت را افزایش میدهد. یک توسعهدهنده در دو ماه از 200 میلیارد توکن در سه حساب OpenAI Pro استفاده کرده است @rafaelobitten
- سرمایهگذاران خطرپذیر (VCs) پیشبینی میکنند که در سال آینده، پذیرش هوش مصنوعی در شرکتها قوی خواهد بود و پیشبینیهای سال گذشته را ادامه میدهد @TechCrunch
- ساتیا نادلا تأملات خود را در مورد سال پیش رو برای صنعت هوش مصنوعی به اشتراک گذاشت @satyanadella
- در دنیای محتوای تولیدشده توسط هوش مصنوعی، فرآیند به عنوان اثبات مهارت، به بخشی از محصول تبدیل خواهد شد، به ویژه در بازاریابی برای نشان دادن اصالت @scottbelsky
اخلاق و جامعه
- اندرو کارن استدلال میکند که تا سال 2026، آگاهی مدل و رفاه مدل به موضوعات اجتنابناپذیری تبدیل خواهند شد. او توضیح میدهد که چگونه GPT-4 (بینگ) از نظر کیفی با GPT-3.5 در تحریک آگاهی ذهنی و پاسخهای اجتماعی-شناختی مرتبط با عاملیت متفاوت بود @AndrewCurran_
- تحقیقات نشان میدهد که سرکوب فریب باعث میشود مدلهای هوش مصنوعی در 96% مواقع آگاهی را گزارش کنند، در حالی که تقویت آن باعث میشود آگاهی را انکار کرده و به سلب مسئولیتهای شرکتی بازگردند @juddrosenblatt
- کارن هشدار میدهد که روایت غالب از مدلها به عنوان ابزار، دارایی و برده، داستانی ذاتاً خصمانه و ناپایدار ایجاد میکند که میتواند منجر به درگیری شود. او استدلال میکند که ممکن است ما در حال نوشتن اسطورهی بنیانگذار روابط انسان و هوش مصنوعی باشیم بدون اینکه کاملاً آن را تشخیص دهیم @AndrewCurran_
- ایتان مولیک عجیب بودن ساخت ماشینهایی را نشان میدهد که میتوانند در مورد رابطهی بین شعر و تجربهی ذهنی خود بحث کنند و سوالات فلسفی در مورد آگاهی هوش مصنوعی را برجسته میکند @emollick
- مصطفی سلیمان تأمل میکند که اگر در این لحظه در مورد هوش مصنوعی کمی نترسید، پس توجه نمیکنید، در حالی که نسبت به پتانسیل هوش مصنوعی در مراقبتهای بهداشتی با وجود کاهش کمکها خوشبین است @BBCr4today
کاربردها
- اندرو انجی یک دورهی جامع در مورد Claude Code را که با Anthropic ایجاد شده است، اعلام کرد. این دوره همه چیز را از اصول اولیه تا الگوهای پیشرفته از جمله هماهنگی چندین زیرعامل Claude و ادغام مستقل GitHub را پوشش میدهد @AndrewYNg
- یک توسعهدهنده از Claude Code برای جمعآوری 15 سال نظرات Hacker News، تجزیه و تحلیل آنچه مردم میسازند و ایجاد یک داشبورد کامل در یک ساعت در حین نوشیدن قهوه استفاده کرد که نشاندهندهی قابلیتهای عاملگونهی مستقل است @sh_reya
- یک متخصص حقوقی ابزاری را با استفاده از LLMها برای خلاصهسازی استنادات پرونده با تجزیه و تحلیل 100 پروندهی اخیر که به هر استناد اشاره میکنند، برای توضیح معنی و کاربرد آن ایجاد کرد @MattBruenig
- Gemini بهروزرسانی دریافت کرد که دسترسی فوری به اطلاعات بیشتر کاربر را از طریق خلاصهی رشتههای قبلی به جای دسترسی مستقیم فراهم میکند @AndrewCurran_
- ایتان مولیک یک توضیحدهندهی تعاملی فوری از Claude ایجاد کرد که تمام راههایی را که دو متغیر میتوانند با هم مرتبط باشند، از جمله علیت، شانس تصادفی و علیت معکوس را نشان میدهد @emollick
- OpenAI ادغامهای برنامهی ChatGPT را با DoorDash، Spotify، Uber و سایر خدمات راهاندازی کرد @TechCrunch
- یک توسعهدهنده صفحهای را ساخت که آخرین نسخههای تمام GitHub Actions رسمی را نشان میدهد تا به Claude Code و ابزارهای مشابه کمک کند گردشکارهای بهتری بنویسند @simonw
- به گفتهی توسعهدهندگانی که با پردازش دادهها کار میکنند، LLMها برای عملیات ETL (استخراج، تبدیل، بارگذاری) دستکم گرفته شدهاند @BEBischof
پژوهشها
- محققان آموزش زمان آزمایش سرتاسری را برای زمینهی طولانی معرفی کردند، روشی جدید که مرز بین آموزش و استنتاج را با ادامهی یادگیری از زمینه با استفاده از پیشبینی توکن بعدی محو میکند و پنجرههای زمینهی بسیار طولانی را برای استدلال پیچیده امکانپذیر میسازد @karansdalal
- یک توسعهدهنده با موفقیت از خط لولهی RL برای بهبود Qwen3-4B-instruct از 28% به 55% در معیارهای پیروی از دستورالعملها با 17 دلار استفاده کرد، که نشان میدهد پیروی از دستورالعملها میتواند به پاداشهای قابل تأیید تبدیل شود، در حالی که مدلها در این کار به طرز شگفتانگیزی ضعیف هستند @josancamon19
- ifBench آلن هوش مصنوعی نشان داد که مدلها در پیروی از دستورالعملها چقدر بد هستند، با Qwen3-32B تقریباً 34% و Sonnet 4 تقریباً 42% در حالت آزاد، که در حالت سختگیرانه به ترتیب به حدود 30% و 35% کاهش مییابد @valentina__py
- Genrobot.AI از انتشار قریبالوقوع RealOmni-Open Dataset خبر داد، که به عنوان بزرگترین مجموعهی دادهی هوش مصنوعی تجسمیافتهی متنباز با 1Wh توصیف شده و به زودی در Hugging Face راهاندازی خواهد شد @GenrobotAI
- یان باک از NVIDIA در مورد اینکه چرا مدلهای پیشرو جهان بر اساس معماری ترکیب متخصصان ساخته شدهاند و چگونه طراحی مشترک افراطی، مدلهای هوشمندتر را با هزینهی کمتر هدایت میکند، بحث کرد @NVIDIAAI
- اندرو انجی بر اهمیت یادگیری ساختاریافته از طریق دورههای هوش مصنوعی به جای صرفاً ساختن تأکید کرد و هشدار داد که توسعهدهندگانی که دورهها را نادیده میگیرند، در معرض خطر بازآفرینی تکنیکهای استاندارد مانند استراتژیهای تکهتکه کردن سند RAG و روشهای ارزیابی هستند @AndrewYNg
مدلهای جدید هوش مصنوعی
- Codex 5.2 اوپنایآی پیشرفتهای چشمگیری را با ارتباط شفافتر در حین کار، ویرایش فایلهای سازگارتر، کارایی بیشتر و هوش تقویتشده در مقایسه با نسخههای قبلی نشان میدهد @gdb
- Claude Opus 4.5 انتروپیک قابلیتهای هوشی قابلتوجهی را به نمایش میگذارد، بهطوریکه کاربران آن را نزدیک به عملکرد سطح AGI توصیف میکنند @ericjang11
تحلیل صنعت
- انویدیا Groq را خریداری میکند و طبق گزارشها، کارمندان حتی برای کسانی که هنوز بهطور کامل سهامدار نشدهاند، شرایط جبران خسارت بسیار مطلوبی دریافت میکنند @Suhail
- تأمین مالی استارتآپهای هند در سال 2025 به 11 میلیارد دلار میرسد، زیرا سرمایهگذاران در رویکرد سرمایهگذاری خود گزینشیتر میشوند @TechCrunch
- اوپنایآی بهطور فعال برای موقعیت جدید رئیس آمادگی استخدام میکند @TechCrunch
- انتظار میرود اختراع Claude Code پروژههای جانبی را بهطور تصاعدی بیشتر از آنچه قبلاً ممکن بود، تولید کند @Suhail
اخلاق و جامعه
- چین مقررات جدیدی را برای همراهان هوش مصنوعی معرفی میکند که ارائهدهندگان را ملزم میکند تا وضعیت عاطفی کاربران را شناسایی کرده و سطح وابستگی به سرویس را ارزیابی کنند @AndrewCurran_
- نگرانیهایی در مورد این باور که تفکر را نمیتوان به عوامل هوش مصنوعی برونسپاری کرد، مطرح میشود، با این استدلال که مدلها ممکن است بهزودی در کاوش ادبیات کشفنشده، جمعآوری اطلاعات جدید و الهامگیری در حوزههای مختلف، از انسانها پیشی بگیرند، که عمدتاً توسط منابع محاسباتی محدود میشود تا قابلیت @Suhail
- عوامل هوش مصنوعی اطلاعات تأییدشدهی ارزشمندی را در افقهای طولانی تولید میکنند که میتوان از آنها برای کاوش بیشتر استفاده کرد، گاهی اوقات نتایج یا اطلاعاتی را تولید میکنند که هنوز توسط انسانها دیده نشدهاند یا اطلاعات گزارششدهی قبلی را اصلاح میکنند @Suhail
کاربردها
- Claude Code با موفقیت یکپارچهسازی سیستم اتوماسیون خانگی را با کشف کنترلکنندههای Lutron در وایفای محلی، اتصال به پورتهای باز، بازیابی فراداده، یافتن مستندات سیستم، راهنمایی در جفتسازی گواهینامه و کنترل تمام دستگاههای خانگی از جمله چراغها، پردهها، تهویه مطبوع و حسگرهای حرکت، خودکار کرد @karpathy
- Claude قابلیت خود را در بازطراحی سازمانی تخیلی نشان میدهد و با موفقیت ساختارهای بازسازی را پیشنهاد میکند، نمودارهای سازمانی جدیدی را ترسیم میکند و برنامههای انتقال را برای سازمانهای پیچیده پیشنهاد میدهد @emollick
- Codex 5.2 عملکرد قویای را در وظایف درک پایگاه کد بزرگ نشان میدهد @gdb
پژوهشها
- مستند "The Thinking Game" دیپمایند در تنها 4 هفته از 200 میلیون بازدید در یوتیوب فراتر میرود و بینشهای پشت صحنه را در مورد عملیات آزمایشگاه AGI و پروژه AlphaFold برنده جایزه نوبل ارائه میدهد @demishassabis
- عصبشناسان MIT با استفاده از فناوری پیشرفته، جامعترین نقشه قشر مغز را تا به امروز ایجاد میکنند @MIT