مدل های خیلی زیاد | TechCrunch

چند مدل هوش مصنوعی خیلی زیاد است؟ بستگی به این دارد که شما چگونه به آن نگاه کنید … اما 10 در هفته احتمالاً کمی زیاد است. تعداد ما در چند روز گذشته، یا بیشتر، این تعداد بوده است، و تشخیص اینکه آیا این مدل‌ها با یکدیگر مقایسه می‌شوند یا نه، به طور فزاینده‌ای دشوار است – اگر این امکان وجود داشت که شروع کنیم. بنابراین، آن را برای چیست؟

ما در زمان عجیبی در تکامل هوش مصنوعی هستیم، اگرچه، البته، در تمام مدت بسیار عجیب بوده است. ما شاهد گسترش مدل‌های بزرگ و کوچک، از توسعه‌دهندگان خاص تا توسعه‌دهندگان بزرگ و با بودجه خوب هستیم.

بیایید لیست این هفته را مرور کنیم، درست است؟ من سعی کردم تا حد امکان آنچه را که هر مدل را متمایز می کند، فشرده کنم.

  • LLaMa-3: آخرین مدل پرچمدار متا با زبان بزرگ “باز”. (اصطلاح “باز” ​​در حال حاضر مورد بحث است، اما با این وجود این پروژه به طور گسترده توسط جامعه استفاده می شود.)
  • Mistral 8×22: یک مدل نسبتاً بزرگ «ترکیب تخصصی» از یک شرکت فرانسوی که تمایلی به دور شدن از فضای باز که زمانی آن را پذیرفته بود، نداشت.
  • Stable Diffusion 3 Turbo: SD3 ارتقا یافته تا با API باز جدید Stability همراه شود. قرض گرفتن “توربو” از نامگذاری مدل OpenAI کمی عجیب است، اما خوب است.
  • دستیار هوش مصنوعی Adobe Acrobat: “با اسناد خود صحبت کنید” از گوریل سند 800 پوندی. با این حال، من تقریباً مطمئن هستم که این در درجه اول یک پوشش برای ChatGPT است.
  • Reka Core: از یک تیم کوچک که قبلاً توسط هوش مصنوعی بزرگ استفاده می شد، یک مدل چند وجهی ساخته شده از ابتدا که حداقل به طور اسمی با سگ های بزرگ قابل رقابت است.
  • Idefics2: یک مدل چندوجهی بازتر، ساخته شده بر روی مدل های اخیر و کوچکتر Mistral و Google.
  • OLMo-1.7-7B: یک نسخه بزرگتر از AI2 LLM، در میان بازترین های موجود در بازار، و سکوی پرشی به سوی مدل آینده در مقیاس 70B.
  • Pile-T5: نسخه ای از مدل قدیمی قابل اعتماد T5 که در پایگاه داده کد Pile پالایش شده است. همان T5 که می شناسید و دوست دارید، اما با کدنویسی بهتر.
  • Cohere Compass: یک “مدل یکپارچه سازی” (اگر از قبل نمی دانید، نگران نباشید) متمرکز بر یکپارچه سازی انواع داده های متعدد برای پوشش موارد استفاده بیشتر.
  • Imagine Flash: آخرین مدل تولید تصویر متا، با استفاده از روش تقطیر جدید برای سرعت بخشیدن به تحویل بدون افت کیفیت.
  • نامحدود: «هوش مصنوعی شخصی‌شده با آنچه دیده‌اید، گفته‌اید یا شنیده‌اید. مناین یک برنامه وب، یک برنامه مک، یک برنامه ویندوز و یک دستگاه قابل حمل است. 😬
  واکنش نمایندگان مجلس و دولتمردان به افزایش قیمت اینترنت موبایل چیست؟

این می شود 11، همانطور که یکی از آنها اعلام شد که من این را نوشتم. و بیایید روشن باشیم، این است نه همه مدل های منتشر شده یا پیش نمایش این هفته! اینها فقط مواردی هستند که ما دیده ایم و در مورد آنها صحبت کرده ایم. اگر شرایط گنجاندن را کمی آرام کنیم، ده ها مدل وجود خواهد داشت: مدل های موجود تصفیه شده، ترکیب هایی مانند Idefics 2، نمونه های تجربی یا طاقچه و غیره. ناگفته نماند ابزارهای جدید این هفته برای ساخت (تورچتون) و مبارزه با (Glaze 2.0) هوش مصنوعی مولد!

نظر ما در مورد این بهمن بی پایان چیست؟ چون در هفته آینده اگرچه ممکن است ده یا بیست نسخه ای که در نسخه قبلی دیدیم را نداشته باشد، اما مطمئناً حداقل پنج یا شش سطح از سطح ذکر شده در بالا را خواهد داشت. ما نمی توانیم همه آنها را “بررسی” کنیم. پس چگونه می توانیم به شما، خوانندگان خود، کمک کنیم تا همه این موارد را درک کرده و پیگیری کنید؟

خوب… حقیقت این است که خیر نیاز دنبال ،، و به ندرت هیچ ، دیگری. تغییری در فضای هوش مصنوعی رخ داده است: برخی از مدل‌ها، مانند ChatGPT و Gemini، به کل پلتفرم‌های وب که موارد استفاده و نقاط پایانی متعددی را شامل می‌شوند، تکامل یافته‌اند. سایر مدل‌های زبان اصلی مانند LLaMa یا OLMo، اگرچه از نظر فنی، معماری پایه را به اشتراک می‌گذارند، اما در واقع همان نقش را ایفا نمی‌کنند. آنها قرار است در پس زمینه به عنوان یک سرویس یا جزء زندگی کنند، نه در پیش زمینه به عنوان یک برند.

  CES 2024 یا شکست، اسکوترهای برقی Superpedestrian به بلوک حراج رسیدند و Fisker در تلاش برای رسیدن به اهداف فروش است.

یک سردرگمی عمدی بین این دو مورد وجود دارد، زیرا توسعه دهندگان مدل می‌خواهند برخی از هیاهویی را که ما تمایل داریم با نسخه‌های اصلی پلتفرم‌های هوش مصنوعی مانند GPT-4V یا Gemini Ultra مرتبط کنیم، قرض بگیرند. همه از شما می خواهند که فکر کنید آزادی آنها مهم است. و اگرچه احتمالاً مهم است کسیکه کسی قطعا شما نیستید

آن را به معنای دسته بندی بزرگ و متنوع دیگری مانند خودروها در نظر بگیرید. هنگامی که آنها اختراع شدند، شما فقط “یک ماشین” خریدید. سپس، کمی بعد، می توانید بین یک ماشین بزرگ، یک ماشین کوچک و یک تراکتور یکی را انتخاب کنید. امروزه صدها خودرو سالانه عرضه می‌شوند، اما احتمالاً نیازی به دانستن یک خودرو از هر ده خودرو ندارید، زیرا از هر ده خودرو، 9 تا خودروی مورد نیاز شما یا حتی خودرویی به معنایی که می‌شنوید نیست. . ما از عصر هوش مصنوعی بزرگ/کوچک/تراکتوری به دوران تکثیر در حال حرکت هستیم، و حتی متخصصان هوش مصنوعی نیز نمی‌توانند هر مدلی را که به بازار می‌آید همراهی کرده و آزمایش کنند.

طرف دیگر این ماجرا این است که ما مدت ها قبل از انتشار ChatGPT و سایر مدل های اصلی در این مرحله بودیم. افراد بسیار کمتری 7 یا 8 سال پیش در مورد آن مطالعه می کردند، اما با این وجود ما در مورد آن صحبت کردیم زیرا به وضوح یک فناوری منتظر لحظه تعیین کننده خود بود – که در زمان معین از راه رسید. مقاله‌ها، مدل‌ها و تحقیقات دائماً منتشر می‌شدند و کنفرانس‌هایی مانند SIGGRAPH و NeurIPS با مهندسان یادگیری ماشینی پر می‌شد که یادداشت‌ها را مقایسه می‌کردند و بر اساس کار یکدیگر می‌ساختند. در اینجا یک داستان درک بصری است که در سال 2011 نوشتم!

  هکرها اطلاعات بیشتری از 23andMe را فاش می کنند، X ، را سرکوب می کند و آندریسن مانیفست می نویسد

این فعالیت هر روز ادامه دارد. اما از آنجایی که هوش مصنوعی به تجارت بزرگ تبدیل شده است – مسلماً بزرگترین در حال حاضر در فناوری – این پیشرفت ها کمی وزن بیشتری به خود گرفته است، زیرا مردم کنجکاو هستند که آیا یکی از آنها می تواند جهش بزرگی از ChatGPT باشد که ChatGPT از پیشینیان خود بود یا خیر.

حقیقت ساده این است که هیچ یک از این مدل‌ها چنین پیشرفتی نخواهند داشت، زیرا پیشرفت OpenAI متکی بر تغییر اساسی در معماری یادگیری ماشین است که اکنون هر شرکت دیگری اتخاذ کرده است و جایگزین نشده است. پیشرفت‌های تدریجی مانند یک یا دو نقطه بهتر در یک معیار مصنوعی، یا زبان یا تصاویر کمی متقاعدکننده‌تر، تنها چیزی است که در حال حاضر باید به آن امیدوار باشیم.

آیا این به این معنی است که هیچ کدام از این مدل ها مهم نیست؟ قطعا. بدون نسخه های 2.1، 2.2، 2.2.1 و غیره نمی توانید از 2.0 به 3.0 ارتقا دهید. – و این همان چیزی است که محققان و مهندسان با پشتکار روی آن کار می کنند. و گاهی این پیشرفت‌ها قابل توجه هستند و کاستی‌های جدی را اصلاح می‌کنند یا آسیب‌پذیری‌های غیرمنتظره را آشکار می‌کنند. ما سعی می کنیم جالب ترین آنها را پوشش دهیم، اما این تنها کسری از تعداد کل است. ما در حال حاضر روی مقاله‌ای کار می‌کنیم که تمام مدل‌هایی را که فکر می‌کنیم افراد کنجکاو ML باید در مورد آن بدانند، جمع‌آوری می‌کند، و این به ترتیب یک دوجین است.

نگران نباشید: وقتی مشکل بزرگی رخ می دهد، شما در مورد آن می دانید، و نه فقط به این دلیل که TechCrunch آن را پوشش می دهد. این به همان اندازه که برای ما واضح است برای شما نیز آشکار خواهد بود.

منبع: https://techcrunch.com/2024/04/19/too-many-models/