مدلهای جدید هوش مصنوعی
- قابلیتهای o3 با عنوان «توانمندترین مدل روی زمین» با قابلیتهای جستجوی پیشرفته، اجرای پایتون و قالببندی برجسته شده است. @aidan_mclau
پژوهشها
- پژوهش در مورد «RL فقط با یک مثال آموزشی» نشان میدهد که مدلها میتوانند معیارهایی مانند MATH500 را بدون بیشبرازش (overfitting) بهبود بخشند، وقتی که به طور مکرر یک مسئله را حل میکنند. @alexgraveley
- مقاله در مورد «تشخیص توکن جایگزینشده» به عنوان یک وظیفه پیشآموزشی با نمونهگیری کارآمدتر با استفاده از معماری مولد-تمیزدهنده، که از نظر محاسباتی کارآمدتر از مدلسازی زبان پوشاندهشده است. @stanfordnlp
- عملکرد OLMo 32B بهتر از Nemotron 340B و Llama 3 70B است، که نشان میدهد مدلهای کاملاً باز از نظر عملکرد به آنچه عموماً تصور میشود، نزدیکتر هستند. @natolambert
کاربردها
- Human Behavior در حال ساخت یک هوش مصنوعی است که بازپخش جلسات را تجزیه و تحلیل میکند تا بفهمد چرا مشتریان در محصولات میمانند، تبدیل میشوند یا آنها را ترک میکنند. @ycombinator
- Claude 3.7 و GPT-4.1 اکنون ساختن عاملها را بسیار آسانتر میکنند. @alexgraveley
- معماری زیرساخت و امنیت Cursor در یادداشتهایی بر اساس مستندات پردازشگرهای فرعی آنها به تفصیل شرح داده شده است. @simonw
تحلیل صنعت
- گزارش شده است که مایکروسافت و OpenAI در حال بازنگری قرارداد خود هستند و مایکروسافت پیشنهاد داده است که در ازای دسترسی مداوم به مدلهای توسعهیافته پس از سال 2030، بخشی از سهام خود را واگذار کند. @AndrewCurran_ @TechCrunch
- Gemma گوگل به 150 میلیون بارگیری و بیش از 70000 نوع مختلف در Hugging Face رسیده است. @demishassabis
- چارچوب DSPy به عنوان حلکنندهی انتزاعات کلیدی برای هوش مصنوعی مدرن برجسته شده است، که پیادهسازی چندریختی مقیاسبندی استنتاج، یادگیری تقویتی LLM و سایر قابلیتها را امکانپذیر میکند. @stanfordnlp
- آمازون از نقشهای شغلی انسانی جدیدی که در یک محیط کار مبتنی بر هوش مصنوعی در حال ظهور هستند، رونمایی میکند. @TechCrunch
اخلاق و جامعه
- آندری کارپاتی «یادگیری اعلان سیستمی» را به عنوان یک الگوی گمشده برای یادگیری LLM پیشنهاد میکند، جایی که مدلها به جای تکیه صرف بر بهروزرسانی پارامترها، استراتژیهای صریح حل مسئله را توسعه میدهند. @karpathy
- مشخص شده است که اعلان سیستمی Claude حدود 17000 کلمه است و نه تنها شامل ترجیحات رفتاری، بلکه استراتژیهای دقیق حل مسئله نیز میشود. @karpathy
- به دانشگاهیان توصیه میشود که با وادار کردن o3 یا Gemini 2.5 به نقد مقالات پژوهشی خود، قابلیتهای هوش مصنوعی را آزمایش کنند. @emollick
- نگرانیها در مورد برنامهریزی کارخانه در پرتو پیشرفتهای بالقوه رباتیک که میتواند ترکیبهای سنتی انسان/اتوماسیون را در عرض 5 سال منسوخ کند. @emollick
مدلهای جدید هوش مصنوعی
- انتظار میرود در Google I/O 2025 (دو هفتهی دیگر) نسل بعدی مدلهای Imagen و Veo به نمایش گذاشته شوند، مدلهایی که در نسخههای فعلی خود نیز در سطح جهانی قرار دارند. @AndrewCurran_
- Gemini 2.5 Pro قابلیتهای چشمگیری در درک ویدیو دارد و به کاربران اجازه میدهد لینکهای YouTube را در AI Studio قرار داده و در مورد محتوای ویدیو سؤال بپرسند. @demishassabis
پژوهشها
- یک فراتحلیل از ۵۱ مقالهی تجربی، تأثیرات مثبتی از ChatGPT بر عملکرد یادگیری، درک یادگیری و تفکر مرتبهی بالاتر را در صورت استفادهی مناسب تأیید میکند. @emollick
- Gemini 2.5 Pro اکنون یک حالت ۶۶ توکن در هر فریم (به جای ۲۵۸ توکن) ارائه میدهد که امکان پردازش بیش از ۶ ساعت ویدیو (با ۱ فریم در ثانیه) را در محدودهی ۲ میلیون توکن فراهم میکند. @JeffDean
- محققان MIT در حال پیشرفت در توسعهی فناوری هوش مصنوعی هستند که پیشبینیهای قابل اعتماد و مطمئن را در محیطهای پرمخاطره مانند مراقبتهای بهداشتی تضمین میکند. @MIT
کاربردها
- o3 قابلیتهای چشمگیری در ایجاد محتوای تقلیدی نوستالژیک نشان میدهد و اسکرینگرابهای قانعکنندهای از برنامههای تلویزیونی و فیلمهای تخیلی از دهههای مختلف تولید میکند. @emollick
- llama.cpp پشتیبانی جدیدی از مدلهای بینایی با باینریهای macOS منتشر کرده است که امکان اجرای مدلهای بینایی را در یک ترمینال یا به عنوان یک رابط کاربری وب localhost فراهم میکند. @simonw
- Gemma 3 4B برای بینایی، با وجود اینکه فقط یک مدل ۳.۲ گیگابایتی برای دانلود است، قابلیتهای چشمگیری را نشان میدهد. @simonw
- YouLearn (@youlearnai) یک معلم خصوصی هوش مصنوعی است که با تبدیل مطالب به یادداشتهای مختصر، ارائهی یک معلم خصوصی هوش مصنوعی تعاملی و تولید آزمونهای شخصیسازیشده، یادگیری را شخصیسازی میکند. @paulg @ycombinator
- پنل Cascade Plugin از Windsurf اتصال Cascade به ابزارهای دیگر مانند MongoDB و Linear را آسانتر میکند. @windsurf_ai
تحلیل صنعت
- با وجود روایتهایی مبنی بر اینکه هوش مصنوعی مشاغل فناوری را از بین میبرد، شرکتهایی که به شدت از هوش مصنوعی استفاده میکنند (شرکتهای بزرگ فناوری، استارتآپهای تحت حمایت VC و شرکتهای در حال توسعه) به طور مداوم استخدام فناوری را در دو سال گذشته افزایش دادهاند. @GergelyOrosz
- بنیانگذار Fiverr ایمیلی به کل شرکت ارسال کرد و اعلام کرد: «هوش مصنوعی هر نقشی را مختل خواهد کرد، از جمله نقش خودم، و تنها کسانی که به طور فعال بر ابزارهای جدید هوش مصنوعی مسلط شوند، زنده خواهند ماند» - و به Shopify و Duolingo پیوست تا از کارمندان بخواهد هوش مصنوعی را بپذیرند. @deedydas
- به گفتهی TechCrunch، به نظر میرسد پذیرش سازمانی OpenAI با هزینهی رقبا در حال تسریع است. @TechCrunch
- دولت ایالات متحده در حال بررسی سرمایهگذاری Benchmark در استارتآپ چینی هوش مصنوعی Manus است. @TechCrunch
- NYT گزارشهایی دربارهی پیشنویس دستورات اجرایی برای تسریع ساخت نیروگاههای هستهای ایالات متحده، از جمله تعیین برخی از مراکز دادهی هوش مصنوعی به عنوان «زیرساختهای حیاتی دفاعی» برای مشارکت DoD و DoE منتشر کرده است. @AndrewCurran_
اخلاق و جامعه
- یک آزمون معیار که هوش مصنوعی را در حال اجرای یک دستگاه فروش شبیهسازیشده آزمایش میکند، نشان میدهد که Claude 3.5 و o3-mini میتوانند به طور متوسط از انسانها بهتر عمل کنند، اما با واریانس بالا و شکستهای تماشایی گاه به گاه، مانند زمانی که Sonnet به اشتباه تلاش کرد تا FBI را در مورد تقلب غیرواقعی مطلع کند. @emollick
- یان لکان پستی با عنوان «پنج راه برای اینکه فریبخورده، احمق، ناکارآمد یا شرور عمل کنید» به اشتراک گذاشت و در مورد ملاحظات اخلاقی در توسعهی هوش مصنوعی بحث کرد. @ylecun
مدلهای جدید هوش مصنوعی
- Google از Gemini 2.5 Pro (05-06) رونمایی کرد که با اختلاف زیادی به عملکردی بینظیر در درک ویدیو دست یافته است. @JeffDean @sundarpichai @OfficialLoganK
پژوهشها
- مقالهٔ WebGPT از سال ۲۰۲۱، با توجه به قابلیتهای نشان داده شده توسط o3 و جستجوی مبتنی بر هوش مصنوعی، جلوتر از زمان خود به نظر میرسد. @natolambert
- محققان استنفورد، NNetNav را توسعه دادهاند، یک عامل هوش مصنوعی متنباز که با تعامل مستقیم با وبسایتها و در عین حفظ حریم خصوصی، یاد میگیرد. @StanfordHAI
- تحقیقات نشان میدهد که LLMها میتوانند ابزارهای ارزشمندی برای معلمان ریاضی مقطع راهنمایی باشند تا تجربهی یادگیری را برای دانشآموزان با سطوح مهارتی مختلف بهبود بخشند. @StanfordHAI
کاربردها
- Reinforcement fine-tuning اکنون برای o4-mini در دسترس است و به توسعهدهندگان اجازه میدهد رفتار مدل را سفارشی کنند. @gdb @OpenAIDevs
- قابلیتهای Deep research برای پایگاههای کد اکنون در دسترس است و توسعهدهندگان را قادر میسازد تا کد خود را بهتر درک کنند. @gdb @OpenAIDevs
- Qwen Chat ویژگی Web Dev را معرفی کرد که امکان ساخت صفحات وب و برنامههای کاربردی فرانتاند را با استفاده از دستورات ساده و تنها با یک خط متن فراهم میکند. @Alibaba_Qwen
- Copilot Assistant اکنون در اندروید در دسترس است و به کاربران اجازه میدهد از طریق فشار طولانی دکمه پاور یا کشیدن انگشت برای راهاندازی جلسات صوتی در متن فعالیت فعلی به آن دسترسی داشته باشند. @Copilot
- Gemini 2.5 اکنون بهطور خودکار ۷۵٪ تخفیف توکنهای کششده را اعمال میکند و بهطور بالقوه صرفهجویی قابل توجهی در هزینهها برای برنامههایی که دستورات را در برابر همان متن طولانی اجرا میکنند، ارائه میدهد. @simonw
- Perplexity on WhatsApp اکنون محاورهایتر است و در صورت عدم نیاز، جستجو را نادیده میگیرد. @AravSrinivas
- Windsurf Reviews با بررسی اولیه درخواستهای pull، فرآیند بررسی کد را ساده میکند. @windsurf_ai
- Zero یک کلاینت ایمیل متنباز و بومی هوش مصنوعی است که صندوق ورودی شما را بهطور خودکار مدیریت میکند. @garrytan @ycombinator
- Scout اکنون استقرار بینقص وبسایت را ارائه میدهد - کاربران میتوانند به سادگی از آن بخواهند «وبسایت من را مستقر کن». @ycombinator
- YouLearn یک معلم خصوصی هوش مصنوعی است که مطالب یادگیری را به یادداشتهای مختصر تبدیل میکند، یک معلم خصوصی هوش مصنوعی برای گفتگو ارائه میدهد و آزمونهای شخصیسازیشده ایجاد میکند. @ycombinator
- Klavis AI در حال ساخت یکپارچهسازیهای MCP متنباز برای برنامههای کاربردی هوش مصنوعی با یک API است که سرورهای MCP میزبانیشده و امن را ارائه میدهد. @ycombinator
- MorphoAI نرمافزار مبتنی بر هوش مصنوعی را برای رباتیک و مهندسی ماشین ارائه میدهد تا سختافزار را با سرعت نرمافزار توسعه دهد. @ycombinator
- Sai یک دستیار تجزیه و تحلیل آزمایشهای آزمایشگاهی و بهینهسازی سلامت مبتنی بر هوش مصنوعی است که در داشبورد SiPhox قرار دارد و از بارگذاری از هر آزمایشگاهی پشتیبانی میکند. @ycombinator
تحلیل صنعت
- شرکای YC در مورد اینکه چگونه ابزارهای کدنویسی هوش مصنوعی در حال تغییر توسعه نرمافزار هستند و تیمهای کوچک را قادر میسازند تا کاری را انجام دهند که زمانی به ارتشی از مهندسان نیاز داشت، بحث میکنند. @garrytan @ycombinator
- Rippling مبلغ ۴۵۰ میلیون دلار با ارزش ۱۶.۸ میلیارد دلار جمعآوری کرد که نشاندهنده سرمایهگذاری قوی مداوم در پلتفرمهای منابع انسانی و مالی مبتنی بر هوش مصنوعی است. @TechCrunch @ycombinator
- PyTorch Foundation به یک بنیاد فراگیر با پذیرش vLLM و DeepSpeed به عنوان پروژههای میزبانیشده، گسترش یافته است و هوش مصنوعی مبتنی بر جامعه را در کل چرخهی عمر پیش میبرد. @PyTorch
- Google قراردادی را برای توسعه ۱.۸ گیگاوات انرژی هستهای پیشرفته امضا کرد که احتمالاً از نیازهای رو به رشد زیرساخت هوش مصنوعی پشتیبانی میکند. @TechCrunch
- SoundCloud سیاستها را تغییر داد تا آموزش هوش مصنوعی را بر روی محتوای کاربر مجاز کند و به روند پلتفرمهایی که محتوا را برای توسعه هوش مصنوعی باز میکنند، پیوست. @TechCrunch
اخلاق و جامعه
- نگرانیهایی در مورد استفاده خصمانه از ردیابهای هوش مصنوعی مانند Pangram Labs بدون ارزیابی مستقل نرخ مثبت کاذب مطرح شده است. @emollick
- Microsoft Research در مورد ملاحظات اخلاقی در هوش مصنوعی مراقبتهای بهداشتی، از جمله چارچوبهای حکمرانی و کاهش سوگیری، بحث میکند. @MSFTResearch
- Yann LeCun با تصورات غلط رایج در مورد LLMها مقابله میکند و خاطرنشان میکند که آنها کاربران را تنبل نمیکنند، بلکه یادگیری بیشتر و سریعتر را تشویق میکنند. @ylecun
- نگرانیهایی در مورد کاهش بودجه NSF مطرح شده است که به طور بالقوه به رهبری فناوری ایالات متحده در هوش مصنوعی در مقایسه با کشورهایی مانند چین که سرمایهگذاریهای هنگفتی در علم انجام میدهند، آسیب میرساند. @jeffclune @ylecun