یادگیری ماشین (Machine Learning) چیست؟

یادگیری ماشین (ML) یکی از شاخههای پیشرو در حوزه هوش مصنوعی (AI) است که به سیستمهای کامپیوتری این توانایی را میدهد تا مانند انسانها یاد بگیرند، وظایف را به صورت خودکار انجام دهند و با تجربه و مواجهه با دادههای بیشتر، عملکرد و دقت خود را بهبود بخشند.
دانشگاه برکلی سیستم یادگیری یک الگوریتم یادگیری ماشین را به سه بخش اصلی تقسیم میکند:
- فرآیند تصمیمگیری: به طور کلی، الگوریتمهای یادگیری ماشین برای پیشبینی یا طبقهبندی استفاده میشوند. بر اساس برخی دادههای ورودی که میتوانند برچسبدار یا بدون برچسب باشند، الگوریتم شما یک تخمین درباره الگوی موجود در دادهها تولید میکند.
- تابع خطا: یک تابع خطا، پیشبینی مدل را ارزیابی میکند. اگر نمونههای شناختهشده وجود داشته باشند، تابع خطا میتواند مقایسهای انجام دهد تا دقت مدل را ارزیابی کند.
- فرآیند بهینهسازی مدل: اگر مدل بتواند بهتر با نقاط دادههای مجموعه آموزشی تطبیق یابد، وزنها تنظیم میشوند تا اختلاف بین نمونه شناختهشده و تخمین مدل کاهش یابد. الگوریتم این فرآیند تکراری "ارزیابی و بهینهسازی" را تکرار میکند و وزنها را به طور خودکار بهروزرسانی میکند تا زمانی که آستانه دقت مورد نظر برآورده شود.
تفاوت یادگیری ماشین، یادگیری عمیق و شبکههای عصبی
از آنجا که یادگیری عمیق و یادگیری ماشین معمولاً به جای یکدیگر استفاده میشوند، ذکر تفاوتهای ظریف بین این دو مفید است. یادگیری ماشین، یادگیری عمیق و شبکههای عصبی همگی زیرشاخههای هوش مصنوعی هستند. با این حال، شبکههای عصبی در واقع زیرشاخهای از یادگیری ماشین هستند و یادگیری عمیق نیز زیرشاخهای از شبکههای عصبی است.
تفاوت یادگیری عمیق و یادگیری ماشین در نحوه یادگیری هر الگوریتم است. یادگیری عمیق میتواند از مجموعه دادههای برچسبدار (که به عنوان یادگیری نظارتشده نیز شناخته میشود) برای آموزش الگوریتم خود استفاده کند، اما لزوماً به مجموعه دادههای برچسبدار نیاز ندارد. فرآیند یادگیری عمیق میتواند دادههای ساختارنیافته را به شکل خام (مانند متن یا تصاویر) پردازش کند و به طور خودکار مجموعه ویژگیهایی را که دستههای مختلف داده را از یکدیگر متمایز میکنند، تعیین کند. این امر نیاز به برخی مداخلات انسانی را کاهش میدهد و امکان استفاده از حجم زیادی از دادهها را فراهم میکند. میتوانید یادگیری عمیق را به عنوان "یادگیری ماشین مقیاسپذیر" در نظر بگیرید، همانطور که لکس فریدمن در این سخنرانی MIT اشاره میکند.
یادگیری ماشین کلاسیک یا "غیرعمیق" بیشتر به مداخله انسانی برای یادگیری وابسته است. متخصصان انسانی مجموعه ویژگیهایی را تعیین میکنند تا تفاوتهای بین دادههای ورودی را درک کنند و معمولاً به دادههای ساختاریافتهتری برای یادگیری نیاز دارند.
شبکههای عصبی یا شبکههای عصبی مصنوعی (ANNs) از لایههای گره تشکیل شدهاند که شامل یک لایه ورودی، یک یا چند لایه پنهان و یک لایه خروجی هستند. هر گره یا نورون مصنوعی به گره دیگری متصل است و دارای وزن و آستانه مرتبط است. اگر خروجی هر گره از مقدار آستانه مشخصشده بیشتر باشد، آن گره فعال میشود و دادهها را به لایه بعدی شبکه ارسال میکند. در غیر این صورت، هیچ دادهای توسط آن گره به لایه بعدی شبکه منتقل نمیشود. اصطلاح "عمیق" در یادگیری عمیق فقط به تعداد لایههای یک شبکه عصبی اشاره دارد. شبکهای که از بیش از سه لایه تشکیل شده باشد (شامل لایه ورودی و خروجی) میتواند به عنوان یک الگوریتم یادگیری عمیق یا یک شبکه عصبی عمیق در نظر گرفته شود. شبکهای که فقط سه لایه دارد، صرفاً یک شبکه عصبی پایه است.
یادگیری عمیق و شبکههای عصبی به دلیل تسریع پیشرفت در حوزههایی مانند بینایی کامپیوتر، پردازش زبان طبیعی و تشخیص گفتار مورد تحسین قرار گرفتهاند.
برای بررسی دقیقتر نحوه ارتباط مفاهیم مختلف، میتوانید پست وبلاگ "هوش مصنوعی در مقابل یادگیری ماشین در مقابل یادگیری عمیق در مقابل شبکههای عصبی: تفاوت چیست؟" را مطالعه کنید.
روشهای یادگیری ماشین
مدلهای یادگیری ماشین به سه دسته اصلی تقسیم میشوند:
- یادگیری ماشین نظارتشده: یادگیری نظارتشده که به عنوان یادگیری ماشین نظارتشده نیز شناخته میشود، با استفاده از مجموعه دادههای برچسبدار برای آموزش الگوریتمها به منظور طبقهبندی دادهها یا پیشبینی دقیق نتایج تعریف میشود. همانطور که دادههای ورودی به مدل تغذیه میشوند، مدل وزنهای خود را تنظیم میکند تا به درستی تطبیق یابد. این امر به عنوان بخشی از فرآیند اعتبارسنجی متقابل انجام میشود تا اطمینان حاصل شود که مدل از بیشبرازش یا کمبرازش اجتناب میکند. یادگیری نظارتشده به سازمانها کمک میکند تا انواع مشکلات دنیای واقعی را در مقیاس بزرگ حل کنند، مانند طبقهبندی اسپم در یک پوشه جداگانه از صندوق ورودی. برخی از روشهای مورد استفاده در یادگیری نظارتشده شامل شبکههای عصبی، بیز ساده، رگرسیون خطی، رگرسیون لجستیک، جنگل تصادفی و ماشین بردار پشتیبان (SVM) است.
- یادگیری ماشین بدون نظارت: یادگیری بدون نظارت که به عنوان یادگیری ماشین بدون نظارت نیز شناخته میشود، از الگوریتمهای یادگیری ماشین برای تحلیل و خوشهبندی مجموعه دادههای بدون برچسب (زیرمجموعههایی به نام خوشه) استفاده میکند. این الگوریتمها الگوهای پنهان یا گروهبندیهای داده را بدون نیاز به مداخله انسانی کشف میکنند. توانایی این روش در کشف شباهتها و تفاوتها در اطلاعات، آن را برای تحلیل اکتشافی دادهها، استراتژیهای فروش متقابل، تقسیمبندی مشتریان و تشخیص تصویر و الگو ایدهآل میکند. همچنین از این روش برای کاهش تعداد ویژگیها در یک مدل از طریق فرآیند کاهش ابعاد استفاده میشود. تحلیل مؤلفههای اصلی (PCA) و تجزیه مقدار منفرد (SVD) دو رویکرد رایج برای این کار هستند. سایر الگوریتمهای مورد استفاده در یادگیری بدون نظارت شامل شبکههای عصبی، خوشهبندی k-means و روشهای خوشهبندی احتمالی است.
- یادگیری نیمهنظارتشده: یادگیری نیمهنظارتشده یک راهحل میانه بین یادگیری نظارتشده و بدون نظارت ارائه میدهد. در طول آموزش، از یک مجموعه داده برچسبدار کوچکتر برای هدایت طبقهبندی و استخراج ویژگیها از یک مجموعه داده بزرگتر و بدون برچسب استفاده میکند. یادگیری نیمهنظارتشده میتواند مشکل کمبود دادههای برچسبدار برای یک الگوریتم یادگیری نظارتشده را حل کند. همچنین اگر برچسبزنی دادهها هزینهبر باشد، کمککننده است.
برای بررسی عمیقتر تفاوتهای بین این رویکردها، میتوانید مقاله "یادگیری نظارتشده در مقابل یادگیری بدون نظارت: تفاوت چیست؟" را مطالعه کنید.
- یادگیری تقویتی: یادگیری تقویتی یک مدل یادگیری ماشین است که شبیه به یادگیری نظارتشده است، اما الگوریتم با استفاده از دادههای نمونه آموزش نمیبیند. این مدل با استفاده از روش آزمون و خطا یاد میگیرد. یک دنباله از نتایج موفقیتآمیز تقویت میشود تا بهترین توصیه یا سیاست برای یک مشکل خاص توسعه یابد.
سیستم IBM Watson® که در سال 2011 برنده چالش Jeopardy! شد، نمونه خوبی است. این سیستم از یادگیری تقویتی برای یادگیری زمان پاسخدهی (یا سؤال پرسیدن)، انتخاب مربع روی صفحه و میزان شرطبندی—به ویژه در شرطهای روزانه—استفاده کرد.
الگوریتمهای رایج یادگیری ماشین
تعدادی از الگوریتمهای یادگیری ماشین به طور معمول استفاده میشوند. این موارد شامل:
- شبکههای عصبی: شبکههای عصبی نحوه کار مغز انسان را شبیهسازی میکنند و از تعداد زیادی گره پردازشی مرتبط تشکیل شدهاند. شبکههای عصبی در تشخیص الگوها خوب هستند و نقش مهمی در کاربردهایی مانند ترجمه زبان طبیعی، تشخیص تصویر، تشخیص گفتار و ایجاد تصویر ایفا میکنند.
- رگرسیون خطی: این الگوریتم برای پیشبینی مقادیر عددی بر اساس رابطه خطی بین مقادیر مختلف استفاده میشود. به عنوان مثال، این تکنیک میتواند برای پیشبینی قیمت خانهها بر اساس دادههای تاریخی منطقه استفاده شود.
- رگرسیون لجستیک: این الگوریتم یادگیری نظارتشده پیشبینیهایی برای متغیرهای پاسخ دستهای مانند پاسخهای "بله/خیر" به سؤالات انجام میدهد. میتواند برای کاربردهایی مانند طبقهبندی اسپم و کنترل کیفیت در خط تولید استفاده شود.
- خوشهبندی: با استفاده از یادگیری بدون نظارت، الگوریتمهای خوشهبندی میتوانند الگوهای موجود در دادهها را شناسایی کنند تا گروهبندی شوند. کامپیوترها میتوانند با شناسایی تفاوتهای بین موارد داده که انسانها از آن غافل شدهاند، به دانشمندان داده کمک کنند.
- درختهای تصمیم: درختهای تصمیم میتوانند هم برای پیشبینی مقادیر عددی (رگرسیون) و هم برای طبقهبندی دادهها به دستهها استفاده شوند. درختهای تصمیم از دنبالهای از تصمیمهای مرتبط استفاده میکنند که میتوانند با یک نمودار درختی نمایش داده شوند. یکی از مزایای درختهای تصمیم این است که اعتبارسنجی و حسابرسی آنها آسانتر از شبکههای عصبی است.
- جنگلهای تصادفی: در یک جنگل تصادفی، الگوریتم یادگیری ماشین یک مقدار یا دسته را با ترکیب نتایج حاصل از چندین درخت تصمیم پیشبینی میکند.
مزایا و معایب الگوریتمهای یادگیری ماشین
بسته به بودجه، نیاز به سرعت و دقت مورد نیاز، هر نوع الگوریتم—نظارتشده، بدون نظارت، نیمهنظارتشده یا تقویتی—مزایا و معایب خود را دارد. به عنوان مثال، الگوریتمهای درخت تصمیم هم برای پیشبینی مقادیر عددی (مشکلات رگرسیون) و هم برای طبقهبندی دادهها به دستهها استفاده میشوند. درختهای تصمیم از دنبالهای از تصمیمهای مرتبط استفاده میکنند که ممکن است با یک نمودار درختی نمایش داده شوند. یک مزیت اصلی درختهای تصمیم این است که اعتبارسنجی و حسابرسی آنها آسانتر از شبکههای عصبی است. خبر بد این است که آنها میتوانند ناپایدارتر از سایر پیشبینکنندههای تصمیم باشند.
به طور کلی، یادگیری ماشین مزایای زیادی دارد که کسبوکارها میتوانند برای دستیابی به کاراییهای جدید از آنها استفاده کنند. این مزایا شامل شناسایی الگوها و روندها در حجم عظیمی از دادهها است که انسانها ممکن است اصلاً متوجه آنها نشوند. و این تحلیل نیاز به مداخله انسانی کمی دارد: فقط مجموعه داده مورد نظر را وارد کنید و بگذارید سیستم یادگیری ماشین الگوریتمهای خود را جمعآوری و اصلاح کند—که با ورود دادههای بیشتر به مرور زمان بهبود مییابند. مشتریان و کاربران میتوانند از تجربه شخصیشدهتری لذت ببرند، زیرا مدل با هر تجربه با آن شخص بیشتر یاد میگیرد.
در طرف مقابل، یادگیری ماشین به مجموعه دادههای آموزشی بزرگی نیاز دارد که دقیق و بدون سوگیری باشند. GIGO عامل عملیاتی است: زباله وارد کنی، زباله تحویل بگیری. جمعآوری دادههای کافی و داشتن سیستمی که به اندازه کافی قوی باشد تا آنها را اجرا کند، ممکن است منابع را نیز تخلیه کند. یادگیری ماشین همچنین میتواند مستعد خطا باشد، بسته به ورودی. با نمونههای بسیار کوچک، سیستم میتواند یک الگوریتم کاملاً منطقی تولید کند که کاملاً اشتباه یا گمراهکننده است. برای جلوگیری از هدر رفتن بودجه یا نارضایتی مشتریان، سازمانها باید تنها زمانی که اطمینان بالایی به خروجی وجود دارد، بر اساس پاسخها عمل کنند.
موارد استفاده واقعی یادگیری ماشین
در اینجا فقط چند نمونه از یادگیری ماشین که ممکن است هر روز با آنها مواجه شوید آورده شده است:
- تشخیص گفتار: همچنین به عنوان تشخیص گفتار خودکار (ASR)، تشخیص گفتار کامپیوتری یا گفتار به متن شناخته میشود و قابلیتی است که از پردازش زبان طبیعی (NLP) برای ترجمه گفتار انسان به یک فرمت نوشتاری استفاده میکند. بسیاری از دستگاههای همراه تشخیص گفتار را در سیستمهای خود برای انجام جستجوی صوتی—مانند Siri—یا بهبود دسترسی برای ارسال پیامکوتاه ادغام کردهاند.
- خدمات مشتری: رباتهای چت آنلاین در حال جایگزینی عوامل انسانی در طول سفر مشتری هستند و نحوه تفکر ما درباره تعامل با مشتریان در وبسایتها و پلتفرمهای رسانههای اجتماعی را تغییر میدهند. رباتهای چت به سؤالات متداول (FAQ) در مورد موضوعاتی مانند حملونقل پاسخ میدهند یا توصیههای شخصیشده ارائه میدهند، محصولات را به صورت متقابل میفروشند یا اندازهها را به کاربران پیشنهاد میکنند. نمونهها شامل نمایندگان مجازی در سایتهای تجارت الکترونیک، رباتهای پیامرسان با استفاده از Slack و Facebook Messenger و وظایفی است که معمولاً توسط دستیاران مجازی و دستیاران صوتی انجام میشود.
- بینایی کامپیوتر: این فناوری هوش مصنوعی به کامپیوترها امکان میدهد تا اطلاعات معناداری از تصاویر دیجیتال، ویدیوها و سایر ورودیهای بصری استخراج کنند و سپس اقدام مناسب را انجام دهند. بینایی کامپیوتر که توسط شبکههای عصبی کانولوشنال قدرت میگیرد، کاربردهایی در برچسبگذاری عکسها در رسانههای اجتماعی، تصویربرداری رادیولوژی در مراقبتهای بهداشتی و خودروهای خودران در صنعت خودرو دارد.
- موتورهای پیشنهاد: با استفاده از دادههای رفتار مصرف گذشته، الگوریتمهای هوش مصنوعی میتوانند به کشف روندهای داده کمک کنند که میتوانند برای توسعه استراتژیهای فروش متقابل مؤثرتر استفاده شوند. موتورهای پیشنهاد توسط خردهفروشان آنلاین برای ارائه پیشنهادات محصول مرتبط به مشتریان در طول فرآیند پرداخت استفاده میشوند.
- اتوماسیون فرآیند رباتیک (RPA): همچنین به عنوان رباتیک نرمافزاری شناخته میشود، RPA از فناوریهای اتوماسیون هوشمند برای انجام وظایف دستی تکراری استفاده میکند.
- معاملهگری خودکار سهام: طراحی شده برای بهینهسازی پرتفوی سهام، پلتفرمهای معاملهگری با فرکانس بالا که توسط هوش مصنوعی هدایت میشوند، هزاران یا حتی میلیونها معامله در روز بدون مداخله انسانی انجام میدهند.
- تشخیص تقلب: بانکها و سایر مؤسسات مالی میتوانند از یادگیری ماشین برای شناسایی معاملات مشکوک استفاده کنند. یادگیری نظارتشده میتواند یک مدل را با استفاده از اطلاعات مربوط به معاملات تقلبی شناختهشده آموزش دهد. تشخیص ناهنجاری میتواند معاملاتی را که غیرمعمول به نظر میرسند و نیاز به بررسی بیشتر دارند، شناسایی کند.
چالشهای یادگیری ماشین
با توسعه فناوری یادگیری ماشین، زندگی ما قطعاً آسانتر شده است. با این حال، پیادهسازی یادگیری ماشین در کسبوکارها نیز نگرانیهای اخلاقی متعددی را در مورد فناوریهای هوش مصنوعی ایجاد کرده است. برخی از این موارد عبارتند از:
- تکینگی فناوری: در حالی که این موضوع توجه عمومی زیادی را به خود جلب میکند، بسیاری از محققان نگران این ایده نیستند که هوش مصنوعی در آینده نزدیک از هوش انسان پیشی بگیرد. تکینگی فناوری همچنین به عنوان هوش مصنوعی قوی یا ابرهوش شناخته میشود. فیلسوف نیک بوستروم ابرهوش را به عنوان "هر نوع هوشی که به طور قابل توجهی از بهترین مغزهای انسان در تقریباً هر زمینهای، از جمله خلاقیت علمی، خرد عمومی و مهارتهای اجتماعی، بهتر عمل کند" تعریف میکند. با وجود اینکه ابرهوش در جامعه قریبالوقوع نیست، ایده آن سؤالات جالبی را مطرح میکند که باید هنگام استفاده از سیستمهای خودکار، مانند خودروهای خودران، در نظر بگیریم. غیرواقعی است که فکر کنیم یک خودروی بدون راننده هرگز دچار تصادف نخواهد شد، اما در آن شرایط چه کسی مسئول و liable است؟ آیا باید همچنان خودروهای خودران را توسعه دهیم یا این فناوری را به خودروهای نیمهخودران محدود کنیم که به مردم کمک میکنند تا با ایمنی رانندگی کنند؟ هنوز در این مورد تصمیمی گرفته نشده است، اما اینها انواع بحثهای اخلاقی هستند که با توسعه فناوریهای نوآورانه هوش مصنوعی رخ میدهند.
- تأثیر هوش مصنوعی بر مشاغل: در حالی که بسیاری از ادراک عمومی از هوش مصنوعی حول محور از دست دادن شغل میچرخد، این نگرانی احتمالاً باید بازتعریف شود. با هر فناوری جدید مختلکننده، میبینیم که تقاضای بازار برای نقشهای شغلی خاص تغییر میکند. به عنوان مثال، وقتی به صنعت خودرو نگاه میکنیم، بسیاری از تولیدکنندگان، مانند جنرال موتورز، در حال تغییر تمرکز خود به تولید خودروهای الکتریکی برای همسویی با ابتکارات سبز هستند. صنعت انرژی از بین نمیرود، اما منبع انرژی از اقتصاد سوخت به اقتصاد الکتریکی تغییر میکند.
به همین ترتیب، هوش مصنوعی تقاضا برای مشاغل را به حوزههای دیگر منتقل میکند. افرادی نیاز خواهند بود تا به مدیریت سیستمهای هوش مصنوعی کمک کنند. هنوز افرادی نیاز خواهند بود تا مشکلات پیچیدهتر در صنایعی که بیشتر تحت تأثیر تغییرات تقاضای شغلی قرار میگیرند، مانند خدمات مشتری، را حل کنند. بزرگترین چالش با هوش مصنوعی و تأثیر آن بر بازار کار، کمک به افراد برای انتقال به نقشهای جدیدی است که تقاضا دارند.
- حریم خصوصی: حریم خصوصی معمولاً در چارچوب حریم خصوصی دادهها، حفاظت از دادهها و امنیت دادهها مورد بحث قرار میگیرد. این نگرانیها به سیاستگذاران اجازه داده است تا در سالهای اخیر پیشرفتهای بیشتری داشته باشند. به عنوان مثال، در سال 2016، قانون GDPR ایجاد شد تا از دادههای شخصی افراد در اتحادیه اروپا و منطقه اقتصادی اروپا محافظت کند و به افراد کنترل بیشتری بر دادههای خود بدهد. در ایالات متحده، ایالتهای فردی در حال توسعه سیاستهایی هستند، مانند قانون حریم خصوصی مصرفکننده کالیفرنیا (CCPA)، که در سال 2018 معرفی شد و از کسبوکارها میخواهد که مصرفکنندگان را از جمعآوری دادههایشان مطلع کنند. قوانینی مانند این، شرکتها را مجبور کرده است تا در مورد نحوه ذخیره و استفاده از اطلاعات شخصی قابل شناسایی (PII) تجدید نظر کنند. در نتیجه، سرمایهگذاری در امنیت به یک اولویت فزاینده برای کسبوکارها تبدیل شده است، زیرا آنها به دنبال از بین بردن هرگونه آسیبپذیری و فرصتهای نظارت، هک و حملات سایبری هستند.
- سوگیری و تبعیض: موارد سوگیری و تبعیض در تعدادی از سیستمهای یادگیری ماشین سؤالات اخلاقی زیادی را در مورد استفاده از هوش مصنوعی ایجاد کرده است. چگونه میتوانیم در برابر سوگیری و تبعیض محافظت کنیم، در حالی که دادههای آموزشی خود ممکن است توسط فرآیندهای انسانی سوگیرانه تولید شده باشند؟ در حالی که شرکتها معمولاً نیات خوبی برای تلاشهای اتوماسیون خود دارند، رویترز برخی از پیامدهای پیشبینی نشده ادغام هوش مصنوعی در شیوههای استخدام را برجسته کرده است. در تلاش برای اتوماسیون و سادهسازی یک فرآیند، آمازون به طور ناخواسته علیه داوطلبان شغلی بر اساس جنسیت برای نقشهای فنی تبعیض قائل شد و در نهایت مجبور به لغو پروژه شد. Harvard Business Review سؤالات دیگری را در مورد استفاده از هوش مصنوعی در شیوههای استخدام مطرح کرده است، مانند اینکه چه دادههایی باید هنگام ارزیابی یک داوطلب برای یک نقش استفاده کنید.
سوگیری و تبعیض محدود به عملکرد منابع انسانی نیست؛ آنها را میتوان در تعدادی از کاربردها، از نرمافزار تشخیص چهره تا الگوریتمهای رسانههای اجتماعی یافت.
با افزایش آگاهی کسبوکارها از خطرات هوش مصنوعی، آنها همچنین در این بحث درباره اخلاق و ارزشهای هوش مصنوعی فعالتر شدهاند. به عنوان مثال، IBM محصولات تشخیص و تحلیل چهره عمومی خود را متوقف کرده است. آرویند کریشنا، مدیرعامل IBM نوشت: "IBM به شدت مخالف است و استفاده از هر فناوری، از جمله فناوری تشخیص چهره ارائهشده توسط سایر فروشندگان، برای نظارت جمعی، پروفایلسازی نژادی، نقض حقوق و آزادیهای اساسی بشر یا هر هدفی که با ارزشها و اصول اعتماد و شفافیت ما سازگار نباشد، را تحمل نخواهد کرد."
- پاسخگویی: از آنجا که قانونگذاری قابل توجهی برای تنظیم شیوههای هوش مصنوعی وجود ندارد، هیچ مکانیسم اجرایی واقعی برای اطمینان از رعایت اخلاق در هوش مصنوعی وجود ندارد. انگیزههای فعلی شرکتها برای اخلاقی بودن، پیامدهای منفی یک سیستم هوش مصنوعی غیراخلاقی بر سودآوری است. برای پر کردن این شکاف، چارچوبهای اخلاقی به عنوان بخشی از همکاری بین اخلاقدانان و محققان برای حکمرانی ساخت و توزیع مدلهای هوش مصنوعی در جامعه ظهور کردهاند. با این حال، در حال حاضر، اینها فقط به عنوان راهنما عمل میکنند. برخی تحقیقات نشان میدهند که ترکیب مسئولیت توزیعشده و عدم پیشبینی پیامدهای بالقوه، به جلوگیری از آسیب به جامعه کمک نمیکند.
چگونه پلتفرم هوش مصنوعی مناسب برای یادگیری ماشین را انتخاب کنیم؟
انتخاب یک پلتفرم میتواند یک فرآیند چالشبرانگیز باشد، زیرا سیستم اشتباه میتواند هزینهها را افزایش دهد یا استفاده از سایر ابزارها یا فناوریهای ارزشمند را محدود کند. هنگام بررسی چندین فروشنده برای انتخاب یک پلتفرم هوش مصنوعی، اغلب تمایل به این فکر وجود دارد که ویژگیهای بیشتر = سیستم بهتر. شاید اینطور باشد، اما بررسیکنندگان باید ابتدا به این فکر کنند که پلتفرم هوش مصنوعی برای سازمانشان چه کاری انجام خواهد داد. چه قابلیتهای یادگیری ماشینی باید ارائه شود و چه ویژگیهایی برای دستیابی به آنها مهم هستند؟ یک ویژگی از دسترفته ممکن است مفید بودن کل سیستم را به خطر بیندازد. در اینجا برخی از ویژگیهایی که باید در نظر گرفته شوند آورده شده است:
- قابلیتهای MLOps: آیا سیستم دارای:
- یک رابط یکپارچه برای سهولت مدیریت است؟
- ابزارهای یادگیری ماشین خودکار برای ایجاد سریعتر مدلها با عملکرد کمکد و بدون کد است؟
- بهینهسازی تصمیم برای سادهسازی انتخاب و استقرار مدلهای بهینهسازی است؟
- مدلسازی بصری برای ترکیب علم داده بصری با کتابخانههای منبع باز و رابطهای مبتنی بر نوتبوک در یک استودیوی داده و هوش مصنوعی یکپارچه است؟
- توسعه خودکار برای مبتدیان برای شروع سریع و دانشمندان داده پیشرفتهتر برای آزمایش است؟
- تولیدکننده داده مصنوعی به عنوان جایگزین یا مکمل دادههای دنیای واقعی زمانی که دادههای دنیای واقعی به راحتی در دسترس نیستند است؟
- قابلیتهای هوش مصنوعی مولد: آیا سیستم دارای:
- یک تولیدکننده محتوا است که میتواند متن، تصاویر و سایر محتواها را بر اساس دادههایی که روی آن آموزش دیده است تولید کند؟
- طبقهبندی خودکار برای خواندن و طبقهبندی ورودیهای نوشتاری، مانند ارزیابی و مرتبسازی شکایات مشتریان یا بررسی احساسات بازخورد مشتریان است؟
- یک تولیدکننده خلاصه است که میتواند متن فشرده را به یک خلاصه با کیفیت بالا تبدیل کند، نکات کلیدی را از گزارشهای مالی استخراج کند و رونوشتهای جلسات را تولید کند؟
- قابلیت استخراج داده برای بررسی جزئیات پیچیده و استخراج سریع اطلاعات لازم از اسناد بزرگ است؟