یادگیری ماشین چیست؟

افرادی که ممکن است بشناسید: یادگیری ماشین یا ماشین لرنینگ بر اساس یک مفهوم ساده کار میکند: درک با سایت vector-robot تجربیات. یک زبان برنامه نویسی شی گرا سطح بالا با زمان اجرا سریعتر در مقایسه با اکثر زبانهای برنامه نویسی است و این به این دلیل است که به زبان ماشین نزدیکتر است. در همین حال، چت بات ها با گذشت زمان پیشرفت میکنند. یادگیری ماشین مهم است زیرا به شرکت ها دیدی از روند رفتار مشتری و الگوهای عملیاتی تجاری میدهد و همچنین از توسعه محصولات جدید پشتیبانی میکند. هوش مصنوعی مفهومی بزرگتر برای ایجاد ماشینهای هوشمندی است که میتوانند توانایی تفکر و رفتار انسان را شبیهسازی کنند، درحالیکه در تعریف یادگیری ماشین آمده است که یک برنامه یا زیرمجموعهای از هوش مصنوعی است که به ماشینها اجازه میدهد از دادهها بدون برنامهریزی صریح یاد بگیرند. بنابراین، منطقی است که مجموعه دادههای خود را سنجیده و بازبینی کنید تا بتوان آنها را برای تولید نتایج بهتر و معنادار تنظیم کرد. بااینحال، اگر هنوز میخواهید آنها را یاد بگیرید، میتوانید کتاب مقدمهای بر یادگیری آماری را بررسی کنید. اگر به آمار علاقه دارید و میخواهید یادگیری ماشین را از منظر آمار یاد بگیرید، کتاب The Elements of Statistical Learning کتابی است که باید بخوانید.

مفاهیم توضیح داده شده در کتاب The Elements of Statistical Learning برای مبتدیان مناسب نیست. همان مفاهیم را توضیح میدهد اما به روشی مبتدی پسند. بااینحال، بهمنظور توضیح فرآیند به زبان ساده، یک مثال اساسی برای توضیح مفاهیم چگونگی یادگیری ماشین مربوطه آورده شده است. بهمنظور نشان دادن اهمیت و عملکرد هر مرحله، از مثال یک مدل ساده استفاده میکنیم. علاوه بر این، ساموئل از یک الگوریتم مینیمکس (که هنوز هم امروزه بهطور گسترده برای بازیها استفاده میشود) برای یافتن حرکت بهینه استفاده کرد، با این فرض که حریف نیز بهینه بازی میکند. آرتور ساموئل، پیشگام در یادگیری ماشین، برنامهای برای بازی چکرزهای کامپیوتری در سطح قهرمانی ایجاد کرد. گروهی از دانشمندان Face2Face را در کنفرانس بینایی کامپیوتری و تشخیص الگو ارائه میدهند. یادگیری ماشین شاخهای از هوش مصنوعی (AI) و علوم کامپیوتر است که بر استفاده از دادهها و الگوریتمها برای تقلید از روشی که انسانها یاد میگیرند تمرکز دارد و بهتدریج دقت آن را بهبود میبخشد. در سطح بالا، یادگیری ماشین یا ماشین لرنینگ صرفاً آموزش یک برنامه یا الگوریتم رایانه ای است که چگونه به تدریج بر روی یک وظیفه تعیین شده که داده می شود، بهبود یابد. نحوه آموزش یک مدل یادگیری ماشین را میتوان در سه بخش زیر مشاهده کرد.

بسیاری از شرکتهای پیشرو امروزی، مانند فیسبوک، گوگل و اوبر، یادگیری ماشین را به بخش مرکزی عملیات خود تبدیل میکنند. در ادامه نیز یوجین گوستمن اولین چت باتی که برخی آن را قبول شده در آزمون تورینگ میدانند توسعه داده شد. در ادامه برخی از کاربردهای یادگیری ماشین یا ماشین لرنینگ در پزشکی بیانشده است. این مرحلهای است که ما مدل را برای کاربردهای عملی آماده میدانیم. برنامه او یاد میگیرد که کلمات انگلیسی را به همان روشی که یک نوزاد تلفظ میکند تلفظ کند. امروزه، این الگوریتم برای مدلسازی موضوع (بهعنوانمثال، بر اساس محبوبترین کلمات در یک مقاله، موضوعات احتمالی آن را تعیین میکند) یا برای توصیههای مبتنی بر هوش مصنوعی (بر اساس خریدهای قبلی، احتمالاً در مرحله بعد چه چیزی را خریداری کنید) مورداستفاده قرار میگیرد. حتی میتوانید به دستیاران برای کارهای خاصی مانند «زنگ ساعت ۶ صبح روز بعد تنظیم کنید»، «به من یادآوری کنید که پس فردا به دفتر ویزا مراجعه کنم» دستور دهید. برای پاسخ دادن، دستیار شخصی شما به دنبال اطلاعات است، پرسشهای مرتبط شما را به خاطر میآورد، یا دستوری را برای جمعآوری اطلاعات به منابع دیگر (مانند برنامههای تلفن) ارسال میکند. اگر مدل خود را بهصورت ریاضی ببینیم، ورودیها یعنی ۲ ویژگی ما دارای ضرایب هستند.

دانشمند شناختی پل اسمولنسکی با یک ماشین محدود بولتزمن (RBM) میآید که میتواند مجموعهای از ورودیها را تجزیهوتحلیل کند و توزیع احتمال را از آنها بیاموزد. اشتباهاتی مانند انتخاب ویژگیهای نادرست یا تمرکز بر انواع محدود ورودیها برای مجموعه داده ممکن است مدل را کاملاً بی اثر کند. سیستمهای یادگیری ماشین را میتوان بهسرعت راهاندازی کرد، اما ممکن است ازنظر قدرت نتایج محدود شوند. این کتاب بهجای کاوش عمیقتر در نظریه ریاضی یادگیری ماشین، مثالهای زیادی از زندگی واقعی را توضیح میدهد تا یادگیری ماشین لرنینگ را آسانتر و سریعتر کند. مطمئناً، این تجربه خرید را بهبود میبخشد، اما آیا میدانستید که این یادگیری ماشین یا ماشین لرنینگ است که این جادو را برای شما انجام میدهد؟ هنگام تکیهبر چندین درخت تصمیمگیری مختلف، مدل بهطور قابلتوجهی در دقت و تصمیمگیری آن بهبود مییابد. با استفاده از این ویژگیها، امیدواریم که مدل ما بتواند بهطور دقیق بین این ۲ میوه تفاوت قائل شود. با توجه به مدل ما، یک مدل رگرسیون خطی ساده برای افتراق بین میوهها مناسب است. این مدل وظیفه تمایز بین سیب و پرتقال را بر عهده دارد.

به جای استفاده از یک مدل قوی، مدلهای ضعیف زیادی تولید میکند و با ترکیب پیشبینیهای آنها (معمولاً با استفاده از میانگین ها یا رای دادن) آنها را به مدلهای قوی تبدیل میکند. هر فصل شامل تمرینهایی برای گسترش الگوریتمهای بیانشده و بهبود بیشتر کارایی و اثربخشی آنها است. داده های خوب آمادهشده برای مدل شما میتواند کارایی آن را بهبود بخشد. آرتور ساموئل اولین کسی است که اصطلاح “یادگیری ماشین” را مطرح کرد و آن را رایج کرد. اگرچه این دو فناوری مرتبط هستند و گاهی اوقات افراد از آنها بهعنوان مترادف یکدیگر استفاده میکنند، اما همچنان هر دو در موارد مختلف دو اصطلاح متفاوت هستند. اولین اشاره اصطلاح “یادگیری عمیق” توسط یک محقق اوکراینی الاصل شبکه های عصبی، ایگور آیزنبرگ، در زمینه نورون های آستانه بولی انجام شد. زمانی که بیشتر رایانهها هنوز از کارتهای پانچ برای اجرا استفاده میکردند، ماروین مینسکی و دین ادموندز اولین شبکه عصبی مصنوعی را ساختند که از ۴۰ نورون به هم پیوسته با حافظه کوتاه و بلندمدت تشکیل شده بود. در این حالت، نوع میوه متغیر وابسته ما خواهد بود درحالیکه رنگ میوه و شکل میوه ۲ پیشبینی کننده یا متغیر مستقل خواهد بود. لی میخواست دادههای موجود برای الگوریتمهای آموزشی را گسترش دهد، زیرا معتقد بود که هوش مصنوعی و ماشین لرنینگ باید دادههای آموزشی خوبی داشته باشند که دنیای واقعی را منعکس کند تا واقعاً کاربردی و مفید باشند.

از طریق استفاده از روشهای آماری، الگوریتمها برای طبقهبندی یا پیشبینی آموزش داده میشوند و بینشهای کلیدی را در پروژههای داده کاوی آشکار میکنند. برای طبقهبندی میوه بهعنوان پرتقال یا سیب میتوان از پارامترهای مختلفی استفاده کرد. فرآیند تصمیمگیری: بهطورکلی، الگوریتمهای یادگیری ماشین برای پیشبینی یا طبقهبندی استفاده میشود. کتاب یادگیری ماشین مملو از مثالها و مطالعات موردی است تا تلاش خواننده را برای یادگیری و درک الگوریتمهای ماشین لرنینگ آسان کند. راهاندازی سیستمهای یادگیری عمیق زمان بیشتری را میطلبد، اما میتوانند فوراً نتایج را ایجاد کنند (اگرچه با در دسترس قرار گرفتن دادههای بیشتر، کیفیت آن احتمالاً در طول زمان بهبود مییابد). یادگیری ماشین یا همان Machine learning در کسب و کار کاربردهای بسیار زیادی دارد و میتوانند سبب بهبود فرآیند خریدوفروش و افزایش رضایت مشتریان شود. مرحله نهایی فرآیند یادگیری ماشین یا ماشین لرنینگ، پیشبینی است. دانشمند کامپیوتر ژاپنی کونیهیکو فوکوشیما کار خود را در neocognitron , یک شبکه چند لایه چند لایه که برای تشخیص الگوها استفاده میشود , منتشر میکند و الهامبخش شبکههای عصبی مصنوعی است که امروزه برای تحلیل تصاویر مورداستفاده قرار میگیرند. ماشین لرنینگ امکان تحلیل حجم انبوهی از دادهها را میسر میکند.

پس از تکمیل فرآیند آموزش، مدل بر اساس داده های آزمون (زیرمجموعهای از مجموعه آموزشی) آزمایش میشود و سپس خروجی را پیشبینی میکند. را بهعنوان زبان اول خود آموخته و یاد دارند، اما وقتی صحبت از چیزی مانند تجزیهوتحلیل داده ها و یادگیری ماشین میشود، پایتون به دلیل سادگی و تعداد زیادی کتابخانه از ماژول های از پیش نوشتهشده، زبان اصلی ما میشود. گروهی از دانشمندان برجسته (Goodfellow ،Pouget-Abadie ،Mirza ،Xu Warde-Farley ،Ozair ،Courville ،Bengio) چارچوبهای شبکههای متخاصم مولد (GAN) را توسعه میدهند که به هوش مصنوعی نحوه تولید دادههای جدید بر اساس مجموعه آموزشی را یاد میدهند. اگر به دنبال چیز اساسیتری هستید، گزینههای دیگر را نیز در نظر بگیرید. هوش مصنوعی مسئول پردازش هزاران نقطه داده مختلف، پیشبینی خطرات و نتایج با دقت و همچنین بسیاری از عملکردهای دیگر است. راه دیگر برای انجام آن، اصلاح مقادیر اولیه داده شده به مدل است. ترنس سجنوفسکی با ترکیب دانش خود در زیستشناسی و شبکه های عصبی، NETtalk را اختراع کرد، برنامهای باهدف شکستن و سادهسازی مدلهای وظایف شناختی انسان بهمنظور اینکه ماشین بهطور بالقوه نحوه انجام آنها را بیاموزد.

در ابتدا، مقادیر تصادفی را برای آنها انتخاب میکنیم و ورودی ارائه میکنیم. جستوجو بر اساس آزمونوخطا و پاداش تأخیری را میتوان بارزترین ویژگی یادگیری تقویتی دانست. به طور کلی یادگیری ماشین عمدتاً به سه دسته اصلی تقسیم میشوند که شامل یادگیری تحت نظارت، یادگیری بدون نظارت و یادگیری تقویتی است. برای اینکه بهترین اقدام تشخیص داده شود نیاز به یک پاداش ساده است که به آن سیگنال تقویتی میگویند. همچنین یک قطع ثابت یا y وجود دارد. خیلیها واقعاً تعجب خواهند کرد اگر بدانند که تاریخچه یادگیری ماشین در دهه ۴۰ با کتاب بسیار مهمی در مورد شناخت انسان آغازشده است، و اخیراً به دلیل توسعه الگوریتمها و روشهای جدید و همچنین به دلیل در دسترس بودن گسترده، سرعت گرفته است. همچنین در این سال کامپیوتر شطرنج آی بی ام، دیپ بلو، قهرمان جهان گری کاسپاروف را در شطرنج شکست داد. هدف اولیه از بهکارگیری ماشین لرنینگ این است که کامپیوترها توانایی یادگیری خودکار بدون دخالت یا کمک انسان را پیدا کنند و بر اساس آموختههای خود اقداماتی انجام دهند. این هوش مصنوعی قادر است چهره انسان را در تصاویر با همان دقتی که انسان انجام میدهد (تقریباً ۹۷.۳۵٪) تشخیص دهد. این مدل را در سناریویی قرار میدهد که در آن با موقعیتهایی روبرو میشود که بخشی از آموزش آن نبوده است.

الکسی (Oleksii) Ivakhnenko و Valentin Lapa، دانشمندان شوروی متولد اوکراین، نمایش سلسله مراتبی شبکه عصبی را توسعه دادهاند که از تابع فعالسازی چندجملهای استفاده میکند و با استفاده از روش گروهی مدیریت داده (GMDH) آموزشدیدهاند. این کتاب تئوری هایی در مورد چگونگی ارتباط رفتار با شبکه های عصبی و فعالیت مغز دارد و در شرف تبدیلشدن به یکی از ارکان تاریخی توسعه یادگیری ماشین است. تاریخچه یادگیری ماشین با اولین مدل ریاضی شبکه های عصبی ارائهشده در مقاله علمی “حساب منطقی ایدههای نهفته در فعالیت عصبی” توسط والتر پیتس و وارن مک کالوخ شروع میشود. تکرارها با استفاده از ورودیهای مختلف از مجموعه داده های آموزشی ما تکرار میشوند تا زمانی که مدل به سطح دقت مطلوب برسد. این کتاب برای برنامه نویسان باتجربهای است که علاقهمند به خرد کردن داده ها هستند. ازآنجاییکه بیشتر کتاب بر اساس تجزیهوتحلیل داده ها به زبان R است، این یک گزینه عالی برای کسانی است که دانش خوبی از زبان برنامه نویسی R دارند. این زبان برنامه نویسی در سیستمهای ترکیبی که در آن پردازش اعداد فشرده CPU انجام میشود، بسیار رایج است.

در واقع یادگیری ماشین به زبان ساده جزء مهم حوزه رو به رشد علم داده است. همانطور که کلان داده به گسترش و رشد ادامه میدهد، تقاضای بازار برای دانشمندان داده افزایش مییابد و از آنها میخواهد تا در شناسایی مرتبطترین سؤالات تجاری و متعاقباً دادههایی برای پاسخ به آنها کمک کنند. این بینشها متعاقباً تصمیمگیری را در برنامهها و کسبوکارها هدایت میکنند و بهطور ایده آل بر معیارهای رشد کلیدی تأثیر میگذارند. گوگل قبلاً الگوریتمی را راهاندازی کرده است که با موفقیت سرطان را در ماموگرافی شناسایی میکند، درحالیکه دانشمندان دانشگاه استنفورد میتوانند به لطف یادگیری عمیق سرطان پوست را نیز شناسایی کنند. تمرکز اصلی این مرحله شناسایی و به حداقل رساندن هرگونه سوگیری احتمالی در مجموعه داده های ما برای این دو ویژگی است. مکانیزمی برای جمع آوری داده ها برای ۲ ویژگی انتخابی ما موردنیاز است. دستیارهای مجازی با انواع پلتفرم ها ادغامشدهاند. یادگیری ماشین یا ماشین لرنینگ بخش مهمی از ایندستیاران مجازی است زیرا آنها اطلاعات را بر اساس مشارکت قبلی شما با آنها جمع آوری و اصلاح میکنند. بهعنوانمثال، برای جمعآوری دادهها در مورد رنگ، ممکن است از یک طیفسنج و برای دادههای شکل، از تصاویر میوهها استفاده کنیم تا بتوان آنها را بهعنوان شکلهای دوبعدی در نظر گرفت.