او می گوید: «سیما از این هم فراتر رفته و تعمیم قوی تری به بازی های جدید نشان می دهد. «تعداد محیطها هنوز بسیار کم است، اما من فکر میکنم سیما در مسیر درستی قرار دارد.
یک روش جدید برای بازی
سیما نشان می دهد که DeepMind تغییر جدیدی را به عوامل بازی ارائه می دهد، یک فناوری هوش مصنوعی که این شرکت در گذشته پیشگام بوده است.
در سال 2013، قبل از اینکه گوگل DeepMind را تصاحب کند، استارت آپ مستقر در لندن نشان داد که چگونه تکنیکی به نام یادگیری تقویتی که شامل آموزش الگوریتمی با بازخورد مثبت و منفی در مورد عملکرد آن است، می تواند به رایانه ها در بازی ، بازی ها کمک کند. بازی های ویدیویی کلاسیک Atari. در سال 2016، در داخل گوگل، DeepMind برنامه AlphaGo را توسعه داد، برنامه ای که از همان رویکرد برای شکست دادن یک قهرمان جهان در Go استفاده می کند، یک بازی تخته باستانی که نیاز به مهارت های ظریف و غریزی دارد.
برای پروژه SIMA، تیم Google DeepMind با چندین استودیو بازی برای جمعآوری دادههای صفحه کلید و ماوس از انسانهایی که 10 بازی مختلف را با محیطهای سه بعدی انجام میدهند، همکاری کرد. No Man’s Sky، تخریب، هیدرونیرو رضایت بخش. سپس DeepMind برچسبهای توصیفی را به این دادهها اضافه کرد تا کلیکها و ضربهها را با اقداماتی که کاربران انجام میدهند مرتبط کند، مانند اینکه آیا بزی در جستجوی جت پک خود است یا یک شخصیت انسانی در جستجوی طلا.
سپس دادههای بازیکنان انسانی به یک مدل زبانی از نوع رباتهای گفتگوی مدرن که توانایی پردازش زبان را با هضم پایگاه داده عظیمی از متن به دست آوردهاند، وارد میشود. سیما سپس می تواند اقداماتی را در پاسخ به دستورات تایپ شده انجام دهد. در نهایت، انسانها تلاشهای سیما را در بازیهای مختلف ارزیابی کردند و دادههایی را تولید کردند که برای اصلاح عملکرد آن استفاده شد.
پس از تمام این آموزش ها، سیما قادر است در پاسخ به صدها فرمان داده شده توسط یک بازیکن، اقداماتی مانند «به چپ بپیچ» یا «به سفینه فضایی برو» یا «از درب برو» یا «درخت را شلیک کن» انجام دهد. . » این برنامه می تواند بیش از 600 عمل انجام دهد، از اکتشاف گرفته تا جنگ و استفاده از ابزار. طبق دستورالعملهای اخلاقی هوش مصنوعی گوگل، محققان از بازیهایی با اقدامات خشونتآمیز اجتناب کردند.
تیم هارلی، یکی دیگر از اعضای تیم Google DeepMind می گوید: «این هنوز یک پروژه تحقیقاتی است. با این حال، می توان تصور کرد که روزی عواملی مانند سیما در کنار شما در بازی با شما و دوستانتان بازی کنند. »
بازیهای ویدیویی محیط نسبتاً امنی را برای درخواست از عوامل هوش مصنوعی برای تکمیل وظایف فراهم میکنند. برای اینکه نمایندگان بتوانند کارهای اداری یا اداری مفید روزانه را انجام دهند، باید قابل اعتمادتر شوند. هارلی و بس از دیپ مایند می گویند که روی تکنیک هایی کار می کنند تا نمایندگان را قابل اعتمادتر کنند.
به روز شده در 3/13/2024، ساعت 10:20 صبح به وقت شرقی: نظر از طرفداران Linxi “Jim” اضافه شد.
منبع: https://www.wired.com/story/google-deepmind-ai-agent-learned-to-play-goat-simulator-3/