ما از برخی منابع دارای حق چاپ برای آموزش هوش مصنوعی استفاده کردیم

مدتی است که آموزش مدل های پیشرفته هوش مصنوعی با محتوای انحصاری به موضوعی بحث برانگیز تبدیل شده است. بسیاری از شرکت ها با شکایت نویسندگان و رسانه های مختلف روبرو هستند. متا اکنون اعتراف کرده است که از کتاب های دارای حق چاپ در مجموعه ای به نام “Books3” استفاده کرده است، اما این شرکت آمادگی پرداخت غرامت به نویسندگان را ندارد.

بر اساس یک گزارش جدید، گروهی از نویسندگان شکایتی را علیه متا تنظیم کرده اند، به دلیل استفاده غیرقانونی از مطالب دارای حق چاپ در توسعه مدل های زبان بزرگ Llama 1 و Llama 2. در پاسخ، این شرکت به نویسنده و کمدین سارا سیلورمن، ریچارد گفت. Kadri، و سایر صاحبان آثار دارای حق چاپ، مدل های هوش مصنوعی خود را با استفاده از کتاب های دارای حق چاپ آموزش دادند.

متا و کپی رایت

فراشناخت و استفاده منصفانه از منابع دارای حق چاپ

متا استفاده از مجموعه Books3 را برای آموزش مدل های زبان بزرگ Llama 1 و Llama 2 تایید کرده است. Books3 مجموعه شناخته شده ای است که شامل متن ساده بیش از 195000 کتاب با حجم کلی حدود 37 گیگابایت است. این آرشیو توسط یک محقق هوش مصنوعی در سال 2020 به عنوان راهی برای ارائه یک منبع داده بهتر برای بهبود الگوریتم های یادگیری ماشین ایجاد شد.

متا اکنون اعتراف کرده است که از بخش‌هایی از مجموعه داده Books3 استفاده می‌کند. استدلال متا این است که استفاده از آثار دارای حق چاپ برای آموزش مدل های هوش مصنوعی نیازی به تایید یا غرامت از نویسندگان ندارد. این شرکت ادعاهای شاکیان در مورد نقض حق چاپ را رد می کند و می گوید که هرگونه استفاده از آثار دارای حق چاپ در Books3 باید “استفاده منصفانه” تلقی شود. این بدان معناست که شرکت ها می توانند از منابع خود برای آموزش هوش مصنوعی بدون کسب مجوز از مالک استفاده کنند.

  ByteDance از صنعت بازی های ویدیویی کناره گیری کرد

OpenAI همچنین به صراحت اعلام کرده است که پس از شکایت نیویورک تایمز، آموزش مدل های هوش مصنوعی بدون استفاده از مطالب دارای حق چاپ غیرممکن است.

منبع: https://digiato.com/artificial-intelligence/meta-admits-using-copyrighted-books-to-train-ai