آشنایی با هوش مصنوعی، تعریف و مفاهیم

همچنین زبان برنامه­نویسی مورد نظر باید به طور پیشرفته­­ای از علوم و مدل­های سایت vector-robot داده پشتیبانی کند. از آنجا که نقش دادهها بسیار مهمتر از هر زمان دیگری است، این داده­ها میتواند در رقابت صنعتی برتری ایجاد کند. این امر باعث می­شود سیستم خیلی زود به حدی برسد که دیگر خارج از کنترل و نگهداری باشد. داده ­­های نویزی و اخلال­گر (Data Noise) به داده­های گفته می­شود که هیچ ارتباطی با هدف الگوریتمِ یادگیری ماشین ندارند. در این بین مشتری­ها با تبلیغاتی که دوست دارند، مورد هدف قرار می­گیرند (بر اساس توصیه­های موتورهای جستجو و ترجیحات خود کاربر)، تبلیغ کننده هم چون تبلیغش به دست افراد مناسب رسیده است، راضی است و در این بین سیستمِ تبلیغ کننده هم پول خود را دریافت می­کند و به این ترتیب همه راضی هستند. در آموزش یادگیری ماشین (Machine Learning) بسیار مهم است که شما از موارد کاربرد هر الگوریتم در دنیای واقعی آگاه باشید. علاوه بر آشنایی با مهمترین الگوریتم­های هر کدام از انواعِ یادگیری­ها، زمینه­ی کاربردِ آن­ها را در دنیای واقعی متوجه شدیم. هوش مصنوعی از دادهها بیشترین استفاده را میکند. به این ترتیب می­توانید با ذهن بازتری یادگیری ماشین را آموخته و از آن استفاده کنید. دیتا ست یا مجموعه داده آموزشی را می­توانید از حساب گوگل آنالیتیکس شرکت جمع­آوری یا خریداری کنید؛ اما موضوع مهم همانطور که در بخش قبل هم گفتیم این است که حتما باید این اطلاعات قانونی، اعتبارسنجی شده و متناسب با هدف شما باشند.

پایتون ساختار و دستورات بسیار ساده­ای دارد که باعث شده­ است زبان برنامه­نویسی محبوب دانشجویان و برنامه­نویسان باشد. یکی از زمینه­های بسیار مهم در این مورد، کمک به کارایی انرژی است که منجر به حداقل رساندن هزینهها و بار مالی، می­شود. همچنین توجه داشته باشید که اهمیت تسلط شما بر هر کدام از موارد فوق، ارتباط مستقیمی با نوع فعالیتتان در حوزۀ یادگیری ماشین دارد. برای شروع یادگیری ماشین باید از پیش­نیازها و مفاهیم آن اطلاع داشته باشید و حتما به یک زبان برنامه­نویسی مناسب مسلط باشید. اما یک ماشین هم می­تواند آموزش ببیند که دقیقا همان قیمت را پیش­بینی کند ولی با دقتی بیشتر، در زمانی کمتر و با بهبودِ عملکرد دائمی و به این ترتیب انجام کارهایی که برای انسان طاقت­فرسا یا غیرممکن است، به راحتی ممکن می­شود. چون همانطور که ملاحظه کردید، تعداد زیادی الگوریتم یادگیری ماشین وجود دارد که هر کدام برای هدفی مشخصی ساخته شده­ است. به عنوان مثال تصاویر موز و سیب را به همراه دیتای اولیه و ویژگی­هایشان به ماشین می­دهیم درحالیکه برچسب­گذاری نشده­اند و ماشین هم تا به حال این تصاویر را ندیده است. به عنوان مثال شما تصاویرِ تعدادی موز و سیب را با برچسبِ موز و سیب به الگوریتم می­دهید و ماشین یاد می­گیرد که سیب و موز چه شکلی دارند.

هنگامی که شما الگوریتم یادگیری ماشینِ خود را آموزش می­دهید، به یک دیتاست (Data Set) یا مجموعه داده آموزشی Training Dataset خوب و بزرگ نیاز دارید، تا الگوریتم بتواند از روی آن، الگوها، اطلاعات و رفتار درست را شناسایی کند. ماشین­ هم به همین ترتیب آموزش می­بیند و رفتار می­کند. چون الگوریتم­ها در پاسخ به اطلاعات و تجربه­های جدید، هربار آپدیت و به روزرسانی می­شوند و به این ترتیب در طول زمان عملکردشان بهبود پیدا می­کند. بسیاری از محصولاتی که درحال استفاده از آنهاییم، با قابلیتهای هوش مصنوعی بهبود خواهند یافت؛ مثل سیری که به عنوان قابلیتی تازه به نسل جدید محصولات اپل اضافه شد. با اینکه شما می­توانید تقریباً از هر زبان برنامه نویسی برای نوشتن برنامه­های مبتنی بر یادگیری ماشین استفاده کنید، اما چون نوشتن هر الگوریتم از ابتدا، فرایند وقت گیری است؛ به همین دلیل بهتر است از یک زبان برنامه­نویسی­ که کتابخانه­های از پیش ساخته شده (Pre-built Libraries) و فریم­ورک­های (Framework) خوبی داشته باشد، استفاده کنید. هر بار هم که الگوریتم در استخراجِ نتایجِ درست، بهتر می­شود، از همان نتایج دوباره برای عملکرد بهترش در مورد داده­های جدید، استفاده می­کند. مثال یادگیری ماشین برای درک بهتر عملکرد آن چیست؟

دلیل نامگذاری این یادگیری ماشین به تقویت شده یا تقویتی این است که عملکرد الگوریتم همواره با مراحل فیدبک و بازخورد تقویت میشود. توصیه می­شود که حداقل ۲۰ مشاهده برای هر گروه داشته باشید تا به یادگیری ماشین کمک کند. در حوزه پزشکی از تکنیکهای هوش مصنوعی و یادگیری عمیق و همچنین تشخیص اشیاء برای تشخیص سرطان در تصاویر پزشکی استفاده می­شود. اگر شما بهترین داده را در یک صنعت رقابتی داشته باشید؛ حتی اگر همه رقبای شما تکنیکهای مشابهی را اعمال کنند، بهترین داده برنده خواهد شد. حتی مسئولیت ایجاد کتابخانه­هایی مثل Keras در پایتون، برای آموزش یادگیری ماشین، با گوگل بوده است. قدم بعدی در این حوزه تعامل زبان طبیعی است که قابلیت برقراری ارتباط با کامپیوتر را با استفاده از زبان عادی روزمره در اختیار ما قرار می­دهد. این رابطها میتوانند قابلیت تشخیص تصویر را به سیستمهای ایمنی منزل اضافه کرده یا ویژگی پرسش و پاسخ را به سیستمها اضافه کند که بتوانند داده­ها را توضیح دهند.

تا الگوها را بشناسد. به عنوان مثال، یک الگوریتمِ نظارت نشده، نمی­تواند داده­های شما را به درستی برچسبگذاری کند زیرا هدف اصلی آن جستجوی الگوها است. از دیتابیس خود جمع­آوری می­کنید تا الگوریتم الگوها را از دیتا تشخیص دهد و یک مدل بسازد. برای این کار، ابتدا اطلاعات مشتریان را مثل؛ قد، وزن، شغل، حقوق، سبد خریدشان و… البته ماشین باید در ابتدا برنامه­نویسی شود که چطور از دیتا یاد بگیرد. همچنین داده­هایی که تنوع ندارند، باعث می­شوند زمان زیادی طول بکشد تا ماشین یاد بگیرد. بنابراین هنگام جمع­آوری اطلاعات، باید مطمئن شوید که قانون را نقض نمی­کنید و همچنین باید اطمینان حاصل کنید که رضایت افراد برای جمع آوری داده­ها، گرفته شده است. در ادامۀ مقاله به معرفی ۷ حوزه­ای که پیشرفت خود را مدیون به کارگیری یادگیری ماشین هستند می­پردازیم تا شما هم با این آموزش یادگیری ماشین، در هر حوزه­ای که هستید با ایده­های بهتر، یک تحول اساسی خلق کنید. در این حالت ماشین بر اساس خصوصیات و شباهت­هایی که تصاویر با هم دارند، خودش سیب­ها و موزها را دسته بندی می­کند.

در مجموع، هدف هوش مصنوعی فراهم ایجاد نرمافزاری است که بتواند بر مبنای داده ورودی تجزیه و تحلیل و استدلال داشته باشد و داده خروجی را توضیح دهد. کاربرد یادگیری تقویتی­ بیشتر در حوزه بازی­های کامپیوتری (Video Games) و هوش مصنوعی است. مثلاً تعامل شما با الکسا و گوگل براساس یادگیری عمیق طراحی شده است و هرچه شما از این محصولات بیشتر استفاده کنید؛ دقت آنها افزایش مییابد. هوش مصنوعی ساختارها و قاعدهها را در دادهها تشخیص میدهد تا الگوریتمهایش بتوانند مهارت خود را افزایش دهند. چگونه ظرفیت رفت و آمد در خیابان­ها را افزایش دهیم؟ همچنین هوش مصنوعی می­تواند با در اختیار داشتن داده جدید، خودش را وفق دهند. همچنین دقیقا مثل انسان، اگر با چیزی مواجه شود که قبلا مشابه­ش را ندیده است، به سختی می­تواند جواب را پیش­بینی کرده و خروجی مناسبی به ما بدهد. یک مشاور املاک ماهر می­تواند قیمت هر خانه­ای را بر اساس تجربه و شناختی که از بازار دارد و با در نظر گرفتن تمامِ متغیرهای خانه، همسایه، اقتصاد، محیط و… شما زمانی ­می­توانید از الگوریتم­­های یادگیری نظارت شده استفاده کنید که نوع داده­های خروجی، شناخته شده هستند و الگوریتم می­تواند نتیجه دیتای جدید را پیش­بینی کند. واحدهای پردازش گرافیکی نقش کلیدی در هوش مصنوعی دارند، چرا که قدرت محاسباتی عظیمی که برای پردازشهای تکرارشونده مورد نیاز است، توسط این بخش فراهم میشود.

آموزش شبکههای عصبی نیازمند کلانداده و قدرت محاسباتی بالا است. زمانی ساخت یک سیستم تشخیص کلاهبرداری که 5 لایه مخفی داشته باشد، غیرممکن به نظر میرسید؛ اما با وجود قدرت فوقالعاده کامپیوتر و کلانداده شرایط تغییر کرده است. البته در نظر داشته باشید که شما می­توانید هر مرحله از این نقشه را مطابق با نیاز و موقعیت خودتان تغییر بدهید. مدلهایی که با کمک هوش مصنوعی و بطور خودکار عمل میکنند؛ بیشترین امکان استفاده از این دادهها را دارند. هوش مصنوعی با استفاده از شبکههای عصبی که لایههای مخفی متعددی دارند؛ دادهها را عمیقتر و بیشتر مورد تجزیه و تحلیل قرار میدهد. هوش مصنوعی با استفاده از شبکههای عصبی عمیق به دقت خارقالعادهای دست پیدا کرده است. امنیت سایبری یکی از موضوعات داغ این روزها است. در وهله اول، ماشین توسط کشفِ الگو از داده­ها (Data)، یاد می­گیرد. از یادگیری ماشین توسط مدل پیوستگی (Association)، زمانی استفاده می­شود که شما می­خواهید قوانینی که بخش عظیمی از دیتای شما را توصیف می­کنند، کشف کنید. اینترنت اشیاء میتواند حجم عظیمی از داده را از دستگاههای متصل فراهم آورد که بیشتر آنها آنالیز نشدهاند. کسب و کارهای ADTECH که کار اصلی آنها تبلیغات هوشمند است، به شدت روی الگوریتم­های یادگیری ماشین تکیه کرده­اند.

تمام پاسخها در دادهها وجود دارد و تنها لازم است هوش مصنوعی دست به کار شود تا آنها را بیابد. اگر مجموعه دادۀ آموزشی شما کوچک باشد، نتایج ممکن است درست نباشد. وقتی داده­های ورودی، از چندین منبع باشد، باید به صحت و اعتبار داده­های خود دقت کنید. در این مقاله از فرانش، نقشه راه آموزش یادگیری ماشین را آموختیم. چگونه سیستم نورپردازی شهر را بهینه کنیم؟ البته باید گفت هنوز وجود انسان برای راهاندازی سیستم هوش مصنوعی و پرسیدن سوالهای درست ضروری است.هوش مصنوعی به محصولات موجود، هوش اضافه میکند. رابط برنامه کاربردی بستههای قابل انتقال کدهایی هستند که قابلیت اضافه کردن عملکرد هوش مصنوعی را به محصولات و بستههای نرمافزار موجود امکانپذیر میکنند. سیستمی را در نظر بگیرید که بدون کدنویسی توسط برنامه­نویس، خودش از مثال­ها یاد می­گیرد و می­تواند به تنهایی از داده­ها، نتایجِ دقیق استخراج کند. دیتاست یا مجموعه داده آموزشی را برای الگوریتم چگونه جمع­ آوری کنیم؟ فلوچارت زیر نمونۀ ساده­ای از یک الگوریتم است. چالش اصلی در یادگیری ماشین، نبود دیتا یا نبود تنوع در مجموعه داده­ها است. اگر شما قصد شروع یادگیری برنامهنویسی را دارید، پیشنیاز آن بدون شک الگوریتم و فلوچارت خواهد بود.

یادگیری ماشین این مساله را با یادگیری خودکار کاملا حل کرده­ است. پایتون Python در حال حاضر محبوبترین زبان برای ML است. پایتون (Python) بهترین زبان برنامه ­نویسی برای یادگیری ماشین است. Matplotlib: مت پلات لیب هم یک کتابخانه قدرتمند برای بصری­سازی داده­ها به کمک انواع نمودارها است. بسیاری از فریم­ ورک­ها و کتابخانه ­های پایتون به طور کاملا ویژه­ای، برای هوش مصنوعی و یادگیری ماشین کاربرد دارند. در ضمن از الگوریتمهای یادگیری ماشین برای پردازش تصویر در شکل­گیری­ بافت­های غیر طبیعی اندام­های انسان استفاده می­شود، تا به تشخیص زودهنگام سرطان برسند. پردازش زبان طبیعی به توانایی کامپیوترها برای تجزیه و تحلیل، درک و تولید زبان بشری اطلاق میشود. و یک زبان برنامه­نویسی را آموزش دیده باشید، که در ادامۀ همین مطلب، بهترین زبان برنامه­نویسی برای یادگیری ماشین را به شما معرفی خواهیم کرد. یادگیری ماشین از دو بخش اصلی تشکیل می­شود: ۱- یادگیری (Learning) و ۲- استنتاج (Inference) که به ترتیب و البته در یک چرخه اتفاق می­افتد. ماشین از هر تصمیمی که می­گیرد، یک فیدبک یا بازخورد دریافت می­کند که آیا تصمیم درست بوده است یا غلط و به این ترتیب هر بار یاد می­گیرد که کدام تصمیم درست بود و در دفعات بعد در همان موقعیت، آن رفتار را تکرار می­کند.

آیا اطلاعاتی وجود دارد که بتواند به سیستم آسیب بزند؟ وقتی مدل ساخته شد، این امکان به وجود می­آید که با داده­های جدید تستش کنید تا بدانید چقدر قوی و قابل تکیه است. بینایی کامپیوتر، این سیستم با اتکا بر قابلیت تشخیص الگو و یادگیری عمیق برای تشخیص آنچه در تصویر یا ویدیو وجود دارد؛ به کار میرود. این پیش­بینی بر اساس اندازه، طول و عرضِ گلبرگ­ گل­ها است. یادگیری خودکار، مزیت اصلی ماشین لرنینگ در مقابل برنامه­نویسی سنتی است. در برنامه­نویسی سنتی، تمام قوانین (Rules) باید با مشورت یک متخصص در حوزه و صنعتِ مورد نظر، کدنویسی شود و هر قانون بر اساس یک فونداسیونِ منطقی، یک خروجی را تحویل می­دهد. هوش مصنوعی قابلیت تعامل مانند انسان را فراهم خواهد آورد و برای وظایف خاصی خواهد توانست در تصمیمگیری مشورت دهد؛ اما جایگزینی برای انسان نیست و به این زودیها نخواهد بود. بنابراین به عنوان مثال؛ اگر می­خواهید تصمیم بگیرید کدام رستوران را انتخاب کنید، نیازی به پیش بینی وضعیت هوا برای آن روز ندارید (مگر اینکه بخواهید روی تراس بنشینید!). آیا تابحال از اپلیکیشن بَلَد، نشان یا وِیز (Waze) استفاده کردهاید و از توانایی آن برای پیدا کردن بهترین مسیر لذت برده­اید؟ شما در آموزش یادگیری ماشین باید با انواع مدل­های آن یعنی، یادگیری با نظارت (Supervised ML)، یادگیری بی نظارت (Unsupervised ML) و یادگیری تقویتی (Reinforcement ML) آشنا شوید.

در واقع یادگیری ماشین، اطلاعات را با ابزار محاسباتی (Statistical Tools) ادغام می­کند تا یک خروجی و نتیجه را پیش­بینی کند. در مقایسه الگوریتم های یادگیری ماشین با هم و انتخاب مناسب­ترین الگوریتم باید حتما اهداف پروژه، نوع و حجم داده­های موجود و همچنین میزان زمانتان را مدنظر قرار دهید. همچنین کسب و کارها می­توانند با جمع­آوری و آنالیز دیتا، تجربه خرید هر فردی را شخصی­سازی کنند و همچنین از این داده­ها برای اجرای کمپین­های بازاریابی، بهینه­سازی قیمت­ها و آگاهی از نگرش مشتری استفاده کنند. وقتی ماشینها بتوانند تصاویر را پردازش، تجزیه و تحلیل و درک کنند؛ میتوانند بیوقفه ویدیوها و تصاویر را مورد بررسی قرار دهند و به تفسیر محیط پیرامون خود بپردازند. به عنوان مثال؛ ما دیتای اولیه از افراد شاغل، میزان حقوق آن­ها و تعداد دفعات رفتنشان به رستوران را تحت عنوان (Feature Vector) از دیتای آموزشی خود (Training Data) جدا کرده و به سیستم می­دهیم. تمرین باعث می­شود دانش نظری خود را در نمونه­ای عملی، به کار بگیرید و مهارت خود را در ML بیشتر کنید.

دقیقا مثل کاربرد یادگیری ماشین در تجارت الکترونیک برای شخصیسازیِ تجربه هر مشتری، تبلیغات نیز توسط این تکنولوژی شخصی­سازی می­شود و به این ترتیب بازاریابی هدفمندتر میشود. وگرنه این محدودیت منجربه ارزیابی و پیش­بینی ضعیف ماشین می­شود. داده­های جدید را در قالب یک بردار ویژگی (Feature Vector) و به عنوان ورودی، به مدل می­دهید تا به شما یک پیش­بینی بدهد. همانطور که الگوریتمی میتواند به خودش شطرنج بازی کردن را یاد دهد، میتواند به خودش آموزش دهد که مناسبترین محصول را در خرید آنلاین پیشنهاد دهد. به این دلیل که فناوری تبلیغاتی، یکی از مهمترین صنعت­های بیگ دیتا است. بهترین مسیر کدام است؟ تصویر اول از سمت چپ دیتای اولیه است و مابقی نتیجه الگوریتم­هاست. اتوماسیون، پلتفورمهای مکالمهای، باتها و ماشینهای هوشمند میتوانند با حجم زیادی از دادهها ترکیب شده تا تکنولوژیهای بسیاری را ارتقا دهند. نحوه عملکرد یادگیری ماشین را بیاموزید. چه زمانی از یادگیری نظارت نشده Unsupervised ML استفاده کنیم؟ خودکارسازی روند تکراری یادگیری و کشف از دادهها توسط هوش مصنوعی به جای خودکار کردنِ وظایفِ دستی، هوش مصنوعی وظایفِ کامپیوتری، تکرارشونده و با حجم بالا را بدون خستگی و قابل اطمینان انجام میدهد. هوش مصنوعی خودش را با استفاده از الگوریتمهای یادگیری مترقی تطبیق میدهد و به این شکل با کمک دادهها، برنامهنویسی را امکانپذیر میکند.

در این مرحله از آموزش یادگیری ماشین و الگوریتم­های آن، به آموزش یادگیری تقویتی Reinforcement ML میپردازیم. بله، این همان کارکردِ یادگیری ماشینی است. زمان با ارزش­ترین دارایی است و استفاده از یادگیری ماشین، زمانِ بیشتر و تجربه­ی لذت­بخش­تری برای همه فراهم می­کند. در دسته ­بندی یا Classification، دیتای ورودی براساس چند برچسب، از هم جدا شده و در دسته­های مجزا قرار می­گیرد. Seaborn: سیبورن برای انجام بصری­سازی در یادگیری ماشین مورد استفاده قرار می­گیرد. انسان در یادگیری از تجربه­هایش می­آموزد. اول سیستم باید با حجم زیادی از دیتا و اطلاعات مناسب تغذیه شود. یادگیری با نظارت Supervised ML چیست؟ یادگیری ماشین، علاوه بر محافظت از مشتری­های پر ریسک و جلوگیری از کلاهبرداری یا دستکاری، به شناسایی فرصت­های سرمایه گذاری و تجارت هم کمک می­کند. مشتریان شما فقط می­توانند زن یا مرد باشند، پس خروجی مشخص بوده و این الگوریتم از نوع یادگیری نظارت شده است. انتخاب الگوریتم درست یکی از چالش­های اساسی ML است. با استفاده از الگوریتم­های دسته بندی (classification) یادگیری ماشین و هوش مصنوعی، تجزیه و تحلیل مواد معدنی موجود در زمین، یافتن منابع انرژی جدید و …

الگوریتمهای پیشرفته به شیوههای جدید در حال توسعه و ترکیب شدن هستند تا دادههای بیشتری را با سرعت بالاتر و در لایههای بیشتری مورد تجزیه و تحلیل قرار بدهند. برنامه­نویسان دیگر نیاز نیست هر بار وقتی دیتای جدید دارند، قوانین جدید بنویسند. مانند بررسی دیتای دموگرافیکِ (جمعیت شناختی) مشتری­ها مثل سن، جنسیت و موقعیت مکانی و… از جمع­آوری و تحلیل داده­های مناسب گرفته تا پاک کردن دیتای نویز که شما در آموزش یادگیری ماشین باید اشراف کاملی به این موارد داشته باشید. مثلا افرادی که کالای x را می­خرند اغلب تمایل دارند کالای y را هم بخرند. هوش مصنوعی نیاز به حجم زیادی از دادهها دارد؛ چرا که مدلهای یادگیری عمیق مستقیماً از طریق این دادهها آموزش میبینند. به وسیلۀ دستگاه­ها و سنسورهای پوشیدنی، داده­های بیمار می­تواند در اختیار الگوریتم­های یادگیری ماشین و به طور لحظه­ به لحظه قرار بگیرد که به نجات جان آن­ها کمک زیادی می­کند. به همین دلیل دیتا نقش کلیدی در این روند ایفا می­کند. این فرآیند پردازش هوشمند در شناسایی و پیشبینی رویدادهای نادر، درک سیستمهای پیچیده و بهینهسازیِ سناریوهای منحصربهفرد نقش کلیدی دارد. داده­های نویزی می­توانند شامل اطلاعات ناقص، داده­های بی­اهمیت، بیت­های غیر عادی و اطلاعات غیر قابلِ شناسایی باشند.

در یادگیری نظارت نشده (Unsupervised ML)، الگوریتم بدون دادن یک خروجی واضح و روشن، تنها در داده­های ورودی، به دنبال الگوها، شباهت­ها و تفاوت­ها می­گردد. یک ماشین به ناهمگنی و تنوع نیاز دارد تا به یک بینش و درک در رفتار برسد. در واقع استفاده از الگوریتم­های یادگیری ماشین برای دیتاسِت­های کوچک، اکثرا مقرون به صرفه نیست، بنابراین از حجمِ اطلاعاتِ معتبر مطمئن شوید و بعد از یادگیری ماشین استفاده کنید. صنعت، کسب و کارها و تجارت­های الکترونیک، به کمک الگوریتم­های یادگیری ماشین و با استفاده از سیستم پیشنهاددهی (recommendation systems) می­توانند تجربه­ی لذتبخش­تری برای مشتری­ها ایجاد کنند. این سیستم می­تواند زیرنویس و عنوان ایجاد کند یا در هنگام یافتن الگوها، خبر دهد. هدف شرکت هم، تعیین کردن احتمالِ زن یا مرد بودن هر مشتری، بر اساس اطلاعات جمع­آوری شده و طبقه­بندی کردن مشتریان در دو گروه مجزای جنسیتی است. مقرون به صرفه­تر شده است. تمامی موارد ذکر شده به تفصیل در این مقاله به شما آموزش داده خواهد شد.