چند مدل هوش مصنوعی خیلی زیاد است؟ بستگی به این دارد که شما چگونه به آن نگاه کنید … اما 10 در هفته احتمالاً کمی زیاد است. تعداد ما در چند روز گذشته، یا بیشتر، این تعداد بوده است، و تشخیص اینکه آیا این مدلها با یکدیگر مقایسه میشوند یا نه، به طور فزایندهای دشوار است – اگر این امکان وجود داشت که شروع کنیم. بنابراین، آن را برای چیست؟
ما در زمان عجیبی در تکامل هوش مصنوعی هستیم، اگرچه، البته، در تمام مدت بسیار عجیب بوده است. ما شاهد گسترش مدلهای بزرگ و کوچک، از توسعهدهندگان خاص تا توسعهدهندگان بزرگ و با بودجه خوب هستیم.
بیایید لیست این هفته را مرور کنیم، درست است؟ من سعی کردم تا حد امکان آنچه را که هر مدل را متمایز می کند، فشرده کنم.
- LLaMa-3: آخرین مدل پرچمدار متا با زبان بزرگ “باز”. (اصطلاح “باز” در حال حاضر مورد بحث است، اما با این وجود این پروژه به طور گسترده توسط جامعه استفاده می شود.)
- Mistral 8×22: یک مدل نسبتاً بزرگ «ترکیب تخصصی» از یک شرکت فرانسوی که تمایلی به دور شدن از فضای باز که زمانی آن را پذیرفته بود، نداشت.
- Stable Diffusion 3 Turbo: SD3 ارتقا یافته تا با API باز جدید Stability همراه شود. قرض گرفتن “توربو” از نامگذاری مدل OpenAI کمی عجیب است، اما خوب است.
- دستیار هوش مصنوعی Adobe Acrobat: “با اسناد خود صحبت کنید” از گوریل سند 800 پوندی. با این حال، من تقریباً مطمئن هستم که این در درجه اول یک پوشش برای ChatGPT است.
- Reka Core: از یک تیم کوچک که قبلاً توسط هوش مصنوعی بزرگ استفاده می شد، یک مدل چند وجهی ساخته شده از ابتدا که حداقل به طور اسمی با سگ های بزرگ قابل رقابت است.
- Idefics2: یک مدل چندوجهی بازتر، ساخته شده بر روی مدل های اخیر و کوچکتر Mistral و Google.
- OLMo-1.7-7B: یک نسخه بزرگتر از AI2 LLM، در میان بازترین های موجود در بازار، و سکوی پرشی به سوی مدل آینده در مقیاس 70B.
- Pile-T5: نسخه ای از مدل قدیمی قابل اعتماد T5 که در پایگاه داده کد Pile پالایش شده است. همان T5 که می شناسید و دوست دارید، اما با کدنویسی بهتر.
- Cohere Compass: یک “مدل یکپارچه سازی” (اگر از قبل نمی دانید، نگران نباشید) متمرکز بر یکپارچه سازی انواع داده های متعدد برای پوشش موارد استفاده بیشتر.
- Imagine Flash: آخرین مدل تولید تصویر متا، با استفاده از روش تقطیر جدید برای سرعت بخشیدن به تحویل بدون افت کیفیت.
- نامحدود: «هوش مصنوعی شخصیشده با آنچه دیدهاید، گفتهاید یا شنیدهاید. مناین یک برنامه وب، یک برنامه مک، یک برنامه ویندوز و یک دستگاه قابل حمل است. 😬
این می شود 11، همانطور که یکی از آنها اعلام شد که من این را نوشتم. و بیایید روشن باشیم، این است نه همه مدل های منتشر شده یا پیش نمایش این هفته! اینها فقط مواردی هستند که ما دیده ایم و در مورد آنها صحبت کرده ایم. اگر شرایط گنجاندن را کمی آرام کنیم، ده ها مدل وجود خواهد داشت: مدل های موجود تصفیه شده، ترکیب هایی مانند Idefics 2، نمونه های تجربی یا طاقچه و غیره. ناگفته نماند ابزارهای جدید این هفته برای ساخت (تورچتون) و مبارزه با (Glaze 2.0) هوش مصنوعی مولد!
نظر ما در مورد این بهمن بی پایان چیست؟ چون در هفته آینده اگرچه ممکن است ده یا بیست نسخه ای که در نسخه قبلی دیدیم را نداشته باشد، اما مطمئناً حداقل پنج یا شش سطح از سطح ذکر شده در بالا را خواهد داشت. ما نمی توانیم همه آنها را “بررسی” کنیم. پس چگونه می توانیم به شما، خوانندگان خود، کمک کنیم تا همه این موارد را درک کرده و پیگیری کنید؟
خوب… حقیقت این است که خیر نیاز دنبال ،، و به ندرت هیچ ، دیگری. تغییری در فضای هوش مصنوعی رخ داده است: برخی از مدلها، مانند ChatGPT و Gemini، به کل پلتفرمهای وب که موارد استفاده و نقاط پایانی متعددی را شامل میشوند، تکامل یافتهاند. سایر مدلهای زبان اصلی مانند LLaMa یا OLMo، اگرچه از نظر فنی، معماری پایه را به اشتراک میگذارند، اما در واقع همان نقش را ایفا نمیکنند. آنها قرار است در پس زمینه به عنوان یک سرویس یا جزء زندگی کنند، نه در پیش زمینه به عنوان یک برند.
یک سردرگمی عمدی بین این دو مورد وجود دارد، زیرا توسعه دهندگان مدل میخواهند برخی از هیاهویی را که ما تمایل داریم با نسخههای اصلی پلتفرمهای هوش مصنوعی مانند GPT-4V یا Gemini Ultra مرتبط کنیم، قرض بگیرند. همه از شما می خواهند که فکر کنید آزادی آنها مهم است. و اگرچه احتمالاً مهم است کسیکه کسی قطعا شما نیستید
آن را به معنای دسته بندی بزرگ و متنوع دیگری مانند خودروها در نظر بگیرید. هنگامی که آنها اختراع شدند، شما فقط “یک ماشین” خریدید. سپس، کمی بعد، می توانید بین یک ماشین بزرگ، یک ماشین کوچک و یک تراکتور یکی را انتخاب کنید. امروزه صدها خودرو سالانه عرضه میشوند، اما احتمالاً نیازی به دانستن یک خودرو از هر ده خودرو ندارید، زیرا از هر ده خودرو، 9 تا خودروی مورد نیاز شما یا حتی خودرویی به معنایی که میشنوید نیست. . ما از عصر هوش مصنوعی بزرگ/کوچک/تراکتوری به دوران تکثیر در حال حرکت هستیم، و حتی متخصصان هوش مصنوعی نیز نمیتوانند هر مدلی را که به بازار میآید همراهی کرده و آزمایش کنند.
طرف دیگر این ماجرا این است که ما مدت ها قبل از انتشار ChatGPT و سایر مدل های اصلی در این مرحله بودیم. افراد بسیار کمتری 7 یا 8 سال پیش در مورد آن مطالعه می کردند، اما با این وجود ما در مورد آن صحبت کردیم زیرا به وضوح یک فناوری منتظر لحظه تعیین کننده خود بود – که در زمان معین از راه رسید. مقالهها، مدلها و تحقیقات دائماً منتشر میشدند و کنفرانسهایی مانند SIGGRAPH و NeurIPS با مهندسان یادگیری ماشینی پر میشد که یادداشتها را مقایسه میکردند و بر اساس کار یکدیگر میساختند. در اینجا یک داستان درک بصری است که در سال 2011 نوشتم!
این فعالیت هر روز ادامه دارد. اما از آنجایی که هوش مصنوعی به تجارت بزرگ تبدیل شده است – مسلماً بزرگترین در حال حاضر در فناوری – این پیشرفت ها کمی وزن بیشتری به خود گرفته است، زیرا مردم کنجکاو هستند که آیا یکی از آنها می تواند جهش بزرگی از ChatGPT باشد که ChatGPT از پیشینیان خود بود یا خیر.
حقیقت ساده این است که هیچ یک از این مدلها چنین پیشرفتی نخواهند داشت، زیرا پیشرفت OpenAI متکی بر تغییر اساسی در معماری یادگیری ماشین است که اکنون هر شرکت دیگری اتخاذ کرده است و جایگزین نشده است. پیشرفتهای تدریجی مانند یک یا دو نقطه بهتر در یک معیار مصنوعی، یا زبان یا تصاویر کمی متقاعدکنندهتر، تنها چیزی است که در حال حاضر باید به آن امیدوار باشیم.
آیا این به این معنی است که هیچ کدام از این مدل ها مهم نیست؟ قطعا. بدون نسخه های 2.1، 2.2، 2.2.1 و غیره نمی توانید از 2.0 به 3.0 ارتقا دهید. – و این همان چیزی است که محققان و مهندسان با پشتکار روی آن کار می کنند. و گاهی این پیشرفتها قابل توجه هستند و کاستیهای جدی را اصلاح میکنند یا آسیبپذیریهای غیرمنتظره را آشکار میکنند. ما سعی می کنیم جالب ترین آنها را پوشش دهیم، اما این تنها کسری از تعداد کل است. ما در حال حاضر روی مقالهای کار میکنیم که تمام مدلهایی را که فکر میکنیم افراد کنجکاو ML باید در مورد آن بدانند، جمعآوری میکند، و این به ترتیب یک دوجین است.
نگران نباشید: وقتی مشکل بزرگی رخ می دهد، شما در مورد آن می دانید، و نه فقط به این دلیل که TechCrunch آن را پوشش می دهد. این به همان اندازه که برای ما واضح است برای شما نیز آشکار خواهد بود.
منبع: https://techcrunch.com/2024/04/19/too-many-models/