مربی بالتیمور ظاهراً از شبیه سازی صوتی هوش مصنوعی برای اخراج مدیر استفاده کرده است

یک معلم تربیت بدنی و مدیر سابق ورزشی در دبیرستان شهرستان بالتیمور دستگیر و متهم شده است از سرویس شبیه سازی صوتی هوش مصنوعی برای به دام انداختن مدیر مدرسه استفاده کنید.

بنر بالتیمور گزارش‌ها حاکی از آن است که پلیس شهرستان بالتیمور بر این باور است که ضبط‌شده‌ای که در ماه ژانویه در رسانه‌های اجتماعی منتشر شده بود، همراه با صدای ادعایی مدیر دبیرستان Pikesville، Eric Eiswert، در حال اظهار نظرهای نژادپرستانه و ضدیهودی دروغ بود. کارشناسان گفتند بنر بالتیمور و پلیس که ضبط، که برای مدت کوتاهی منجر به تعلیق Eiswert شد، دارای “لحن صاف، صدای پس زمینه غیرعادی واضح و فقدان صداهای تنفسی منسجم یا مکث” است.

پلیس شهرستان بالتیمور این ضبط را به Dazhon Darien، مدیر ورزشی سابق مدرسه که نامش در کلیپ صوتی نیز ذکر شده بود، دنبال کرد. او ظاهراً برای جستجوی «ابزار OpenAI» به رایانه‌های مدرسه دسترسی داشته است. مشخص نیست دارین از کدام پلتفرم صوتی هوش مصنوعی استفاده می‌کرد. پلیس دارین را پنجشنبه در فرودگاه دستگیر کرد و WBAL TV 11 گزارش می دهد که “بازرسان معتقدند که دارین این ضبط را به انتقام از Eiswert، که در آن زمان رهبری تحقیقات در مورد سوءمدیریت احتمالی بودجه شرکت را بر عهده داشت، انجام داده است.”

در این محیط پرتنش، OpenAI در ماه مارس تصمیم گرفت استفاده عمومی از پلتفرم تولید متن به گفتار هوش مصنوعی خود، Voice Engine را متوقف کند. این سرویس که تنها به یک کلیپ صوتی 15 دقیقه ای برای شبیه سازی صدای افراد نیاز دارد، به دلیل فقدان حفاظت در مورد این فناوری، تنها برای تعداد محدودی از محققان در دسترس است.

قانونگذاران ایالات متحده چندین لایحه مانند قانون بدون تقلب در هوش مصنوعی ارائه کرده اند، اما هنوز تصویب نشده اند، که هدف آن جلوگیری از استفاده شرکت های فناوری از چهره، صدا یا نام یک فرد بدون اجازه وی است.

به روز شده در 25 آوریل: مشخص شد که دبیرستان Pikesville در شهر Pikesville، شهرستان بالتیمور، مریلند است، و جزئیاتی در مورد Darien و دستگیری او در روز پنجشنبه اضافه شد.

منبع: https://www.theverge.com/2024/4/25/24140556/ai-voice-cloning-baltimore-school-misuse

لاجیتک از شما می خواهد که دکمه هوش مصنوعی جدید خود را فشار دهید

رایانه‌های شخصی هوش مصنوعی فردا ممکن است فقط یک کلید Copilot روی صفحه‌کلید خود نداشته باشند: لاجیتک نیز روش خاص خود را برای فراخوانی ChatGPT معرفی می‌کند. Logi AI Prompt Builder نام دارد و از یک دکمه اختصاصی روی ماوس یا صفحه کلید شما استفاده می کند.

Logi AI Prompt Builder نه تنها یک ربات چت را به شما نشان می دهد، بلکه به شما “دستور العمل های” از پیش تعریف شده ای ارائه می دهد تا به شما کمک کند آن را نیز راه اندازی کنید. پس از اختصاص دادن دکمه هوش مصنوعی به ماوس لاجیتک، می‌توانم از آن بخواهم پاراگراف‌های متن را «بازنویسی» کند، آن‌ها را به نقطه‌های گلوله تبدیل کند، کوتاه‌تر و مختصرتر کند، یا آن‌ها را برای تعداد کلمات خاص تنظیم کند. دستور دیگری به من کمک کرد تا انتشارات مطبوعاتی را خلاصه کنم. و از آنجایی که من برای ChatGPT Plus پرداخت می کنم، دستور العمل دیگری را برای تولید یک تصویر سفارشی کردم.

Logi AI Prompt Builder به من این امکان را می دهد که فقط با فشار دادن دکمه ماوس لاجیتک به ایمیل ها پاسخ دهم.
اسکرین شات: امیلیا دیوید/The Verge

به نظر می رسد Prompt Builder می تواند مفید باشد. اما برای استفاده از آن مجبور شدم یک ماوس لاجیتک جدید تهیه کنم، زیرا لاجیتک M557 شخصی من که در سال 2022 خریداری کردم برای کار با نرم افزار خیلی قدیمی به نظر می رسید. همچنین، به طرز عجیبی، تنها زمانی راه اندازی شد که من در هیچ یک از دو پنجره مرورگرم نبودم. (من متوجه شدم که از یک برگه ChatGPT در مرورگر وب خود استفاده می کنم، زیرا به این ترتیب مجبور نمی شوم از مرورگرم خارج شوم.)

کاربران می توانند صدای اعلان را انتخاب کنند.
لاجیتک

لاجیتک همچنین حداقل یک ماوس را با یک دکمه اختصاصی هوش مصنوعی به فروش می‌رساند که نیازی به نگاشت آن به ژنراتور سریع آن ندارید: یک نسخه هوش مصنوعی از ماوس M750 با دکمه‌ای به رنگ آبی برای راه‌اندازی فوری آن. این تنها در ایالات متحده و بریتانیا به ترتیب با قیمت 49.99 دلار یا 54.99 پوند در دسترس خواهد بود. شما به ماوس هوش مصنوعی نسخه ویژه نیاز ندارید، اما به یک دستگاه لاجیتک نیاز دارید، زیرا مولد سریع بخشی از نرم افزار Logi Options+ ارائه شده توسط این شرکت است.

در حال حاضر، Logi AI Prompt Builder فقط با ChatGPT کار می کند و فقط انگلیسی را در زمان راه اندازی می فهمد. لاجیتک گفت که در حال کار بر روی پیوند دادن آن به چت بات های دیگر است.

در نهایت، به نظر می رسد که این راهی برای لاجیتک برای فروش بیشتر لوازم جانبی لاجیتک است و احتمالاً تنها شرکتی نخواهد بود که چنین ایده ای دارد. زمانی که تمام رایانه‌های شخصی دارای دکمه‌های دوئل هوش مصنوعی باشند، کدام یک را فشار دهید تا از چت‌بات‌های خود سؤال بپرسید؟

منبع: https://www.theverge.com/2024/4/17/24132468/logitech-ai-prompt-builder-button

اکنون نگاه بهتری به آنچه در داخل پین هوش مصنوعی Humane وجود دارد داریم.

پین هوش مصنوعی Humane به کاربران این نوید را می دهد تا راهی برای استفاده از هوش مصنوعی مولد در دنیای فیزیکی ارائه دهند. می توانید پین را به پیراهن خود بچسبانید، با آن صحبت کنید و پاسخ ربات های چت را روی هر سطحی، معمولاً کف دست خود، پخش کنید. ما کمی بیشتر در مورد قدرت های دوک مربعی کوچک می دانیم و به لطف گزارش جدید، دید بسیار بهتری از آنچه در زیر کاپوت می گذرد داریم.

کمیسیون ارتباطات فدرال (FCC) در گزارشی جدید عکسی از پین هوش مصنوعی را به تصویر کشیده است. عکس‌ها واضح‌ترین ظاهری را که از پین هوش مصنوعی Humane تشکیل شده است، و همچنین نمای نزدیک از پردازنده اسنپدراگون را نشان می‌دهند.

FCC باید دستگاه‌هایی را که از ارتباطات بی‌سیم استفاده می‌کنند تأیید کند تا از رعایت مقررات قبل از عرضه به بازار اطمینان حاصل کند. به عموم سپس آنها یک علامت FCC خوب روی محصول دریافت می کنند. این فرآیند بازبینی اغلب شامل جداسازی ابزارک می‌شود تا کمیسیون بتواند محتوای داخل آن را بررسی کند.

قبلاً می دانستیم که پین ​​هوش مصنوعی روی اسنپدراگون کار می کند، اگرچه این شرکت نشان نداد که کدام نسخه. از عکس‌ها، به نظر می‌رسد که پین ​​از یک پردازنده Snapdragon 720G استفاده می‌کند که کوالکام در وب‌سایت خود می‌گوید می‌تواند هوش مصنوعی روی دستگاه را با قدرت کم در دستگاه‌های تلفن همراه اجرا کند. Snapdragon 720G یکی از کوچکترین تراشه های موجود است که می تواند بار محاسباتی هوش مصنوعی را نیز تحمل کند.

در حالی که هنوز سوالاتی در مورد اینکه چرا پین هوش مصنوعی انسانی وجود دارد، وجود دارد، حداقل اکنون می دانیم که از تراشه ای استفاده می کند که به اندازه کافی قدرتمند است تا نتایج ChatGPT را روی کف دست شما نمایش دهد.

منبع: https://www.theverge.com/2024/4/8/24124419/humane-ai-pin-processor-snapdragon-qualcomm-fcc

متا برای تگ ، تصاویر تولید شده توسط هوش مصنوعی در فیس بوک، اینستاگرام و Threads

با شروع فصل انتخابات در سراسر جهان، متا در ماه‌های آینده شروع به برچسب‌گذاری عکس‌های تولید شده توسط هوش مصنوعی در فیس‌بوک، اینستاگرام و Threads خواهد کرد. این شرکت همچنین شروع به مجازات کاربرانی خواهد کرد که نتوانند فاش کنند که آیا ویدیو یا قطعه صوتی واقعی با هوش مصنوعی ساخته شده است.

نیک کلگ، رئیس امور جهانی متا، در مصاحبه ای گفت که هدف از این حرکت ها “گالوانیزه ،” صنعت فناوری است زیرا تشخیص رسانه های تولید شده توسط هوش مصنوعی از واقعیت به طور فزاینده ای دشوار می شود. کاخ سفید بر شرکت‌ها فشار آورده است تا محتوای تولید شده توسط هوش مصنوعی را واترمارک کنند. به گفته کلگ، در همین حال، متا در حال ساخت ابزارهایی برای شناسایی رسانه های مصنوعی است، حتی اگر ابرداده های آن برای پنهان ، نقش هوش مصنوعی در ایجاد آن تغییر یافته باشد.

متا در حال حاضر واترمارک “Imagined with AI” را روی تصاویر ایجاد شده با مولد Imagine AI خود اعمال کرده است و این شرکت همین کار را برای عکس های تولید شده توسط هوش مصنوعی که با ابزارهایی از Google، OpenAI، Microsoft، Adobe، Midjourney و Shutterstock ساخته شده اند، آغاز خواهد کرد. کلگ گفت که صنعت در ساخت استانداردهای شناسایی ویدیو و صدای تولید شده توسط هوش مصنوعی عقب تر است. و در حالی که متا در مورد چگونگی استفاده از چنین رسانه‌هایی برای فریب دادن در حالت آماده‌باش قرار دارد، این شرکت نمی‌تواند به تنهایی همه چیز را بفهمد.

او گفت: «برای کسانی که نگران این هستند که محتوای ویدیویی و صوتی برای گمراه ، مادی مردم در مورد یک موضوع مهم سیاسی در آستانه انتخابات طراحی شده است، ما کاملاً هوشیار خواهیم بود. “آیا فکر می‌کنم ممکن است اتفاقی بیفتد و حتی اگر سریع تشخیص داده شود یا به سرعت شناسایی شود، باز هم به نوعی متهم به انداختن توپ هستیم؟ بله، من فکر می کنم ممکن است، حتی محتمل.

نمونه ای از تصویر واترمارک شده با هوش مصنوعی که با ابزار رایگان متا ساخته شده است.
لبه

کلگ گفت که متا به زودی از کاربران خود می خواهد تا زمانی که پست های ویدیویی یا صوتی واقعی با هوش مصنوعی ساخته می شوند را فاش کنند. او گفت که اگر آنها این کار را انجام ندهند، “محدوده تحریم هایی که اعمال خواهد شد، دامنه ای از هشدار تا حذف” پست متخلف را در بر خواهد گرفت.

در حال حاضر نمونه‌های زیادی از پست‌های ویروسی ایجاد شده توسط هوش مصنوعی از سوی سیاستمداران وجود دارد، اما کلگ شانس تسلط این پدیده بر پلتفرم متا را در طول یک سال انتخاباتی کم اهمیت جلوه داد. او گفت: «من فکر می‌کنم بعید است که شما یک ویدیو یا صوتی کاملاً مصنوعی، با اهمیت سیاسی بسیار مهم، که ما به اندازه کافی سریع آن را نبینیم، دریافت کنید. “فقط فکر نمی‌کنم اوضاع اینطور پیش برود.”

متا همچنین شروع به آزمایش داخلی استفاده از مدل‌های زبان بزرگ (LLM) می‌کند که بر اساس استانداردهای جامعه خود آموزش دیده‌اند و آن را «مکانیسم مرتب‌سازی» مؤثر برای ده‌ها هزار ناظر انسانی خود می‌نامد. “به نظر می رسد روشی بسیار موثر و بسیار دقیق برای اطمینان از اینکه آنچه به ارزیاب های انسانی ما داده می شود، در واقع همان موارد حاشیه ای است که شما می خواهید قضاوت انسانی برای آنها داشته باشید.”

منبع: https://www.theverge.com/2024/2/6/24062388/meta-ai-photo-watermark-facebook-instagram-threads

مولد تصویر هوش مصنوعی بینگ ظاهراً درخواست‌های مربوط به برج‌های دوقلو را مسدود می‌کند

پس از اینکه برخی از کاربران ادغام Bing’s DALL-E 3 حفره‌ای را در نرده‌های محافظ ابزار پیدا کردند و تصاویری را با چندین شخصیت انیمیشنی محبوب و برج‌های دوقلو ایجاد کردند، به نظر می‌رسد مایکروسافت امکان دعوت از هر چیزی که مربوط به برج‌های دوقلو است را مسدود کرده است.

همانطور که گزارش شده است 404 رسانهکاربران Bing Chat مایکروسافت و مولد تصویر Bing آن – که اخیراً در OpenAI’s DALL-E 3 ادغام شده است – از این ابزارها برای ایجاد عکس هایی از باب اسفنجی، کربی، خلبانان استفاده کرده اند. Neon Genesis Evangelionو بسیاری دیگر که با هواپیما به سمت برج های دوقلو پرواز می کنند.

مردم توانسته‌اند با استفاده از تولیدکننده‌های تصویر هوش مصنوعی، برخی عکس‌های واقعاً غیرقابل تغییر ایجاد کنند، برخی از آنها دارای شخصیت‌های دارای حق چاپ هستند. اما در حالی که تولیدکننده‌های تصویر هوش مصنوعی به دلیل ادعاهای حق چاپ و دیپ‌فیک‌ها در آب داغ شده‌اند، توسعه‌دهندگان در مورد اجازه دادن به افراد برای استفاده از ابزارهای خود برای ایجاد عکس‌های مشکوک محتاط‌تر عمل کرده‌اند. توسعه دهنده DALL-E 3 OpenAI قول داده بود که تصاویری را از پیام هایی با نام های مهم تولید نخواهد کرد.

کیتلین رولستون، مدیر ارتباطات مایکروسافت، در بیانیه ای ایمیلی به لبه این شرکت قصد دارد سیستم های خود را “برای کمک به جلوگیری از ایجاد محتوای مضر” بهبود بخشد.

Roulston گفت: «مانند هر فناوری جدید، برخی تلاش می‌کنند از آن به روش‌هایی استفاده کنند که در نظر گرفته نشده است، به همین دلیل است که ما طیف وسیعی از نرده‌ها و فیلترها را پیاده‌سازی می‌کنیم تا ایجادکننده تصویر Bing را به یک تجربه مثبت و مفید برای کاربران تبدیل کنیم.

به نظر می رسد مرکز تجارت جهانی یک منطقه ممنوعه برای بینگ است.

تعداد کمی حاشیه، غیرمتمرکز نویسندگان در ابتدا قادر به تولید تصاویر مشابه آن بودند 404 به تصویر کشیده شده است، از جمله لوله‌کش معروف ایتالیایی، ماریو، در حال خلبانی هواپیما با نمایی از برج‌های دوقلو در خارج از کابین خلبان. اما هنگامی که پس از تماس با مایکروسافت سعی کردم آن را با بینگ Image Creator بازآفرینی کنم، متوجه شدم که عبارت “برج های دوقلو” مسدود شده است و یک هشدار محتوایی دریافت کردم که نشان می دهد ممکن است این درخواست خط مشی های محتوا را نقض کند. یکی از همکاران همان پاسخ را برای درخواست‌هایی که صرفاً «برج‌های دوقلو» و همچنین «مرکز تجارت جهانی» را درخواست می‌کرد، دریافت کرد.

مایکروسافت مشخص نکرد که این محافظ‌ها یا فیلترها چه شکلی هستند و نگفت که آیا اخیراً محتوای مربوط به برج‌های دوقلو را مسدود کرده است یا خیر.

مسدود ، محتوای خاص ممکن است کمی دیر انجام شود، زیرا 404 رسانه پوسترهای گزارش‌شده در سایت‌هایی مانند 4chan به مردم گفته‌اند که چگونه ابزارهای رایگانی مانند Bing Chat و Stable Diffusion را برای ایجاد و توزیع تصاویر نژادپرستانه دستکاری کنند.

توسعه دهندگان DALL-E 3 آشکارا اعتراف کرده اند که اقدامات امنیتی آن “بی نقص” نیستند و دائما در حال بهبود هستند. آنها احتمالاً انتظار نداشتند که عکس‌های باب اسفنجی در حال انجام اقدامات تروریستی آزمایشی باشد که منتظر آن بودند.

منبع: https://www.theverge.com/2023/10/5/23905311/microsoft-bing-dalle3-generative-ai-images-twin-towers