یادگیری ماشین (Machine Learning) چیست؟

یادگیری ماشین (Machine Learning) چیست؟

یادگیری ماشین (ML) یکی از شاخه‌های پیشرو در حوزه هوش مصنوعی (AI) است که به سیستم‌های کامپیوتری این توانایی را می‌دهد تا مانند انسان‌ها یاد بگیرند، وظایف را به صورت خودکار انجام دهند و با تجربه و مواجهه با داده‌های بیشتر، عملکرد و دقت خود را بهبود بخشند.

دانشگاه برکلی سیستم یادگیری یک الگوریتم یادگیری ماشین را به سه بخش اصلی تقسیم می‌کند:

  1. فرآیند تصمیم‌گیری: به طور کلی، الگوریتم‌های یادگیری ماشین برای پیش‌بینی یا طبقه‌بندی استفاده می‌شوند. بر اساس برخی داده‌های ورودی که می‌توانند برچسب‌دار یا بدون برچسب باشند، الگوریتم شما یک تخمین درباره الگوی موجود در داده‌ها تولید می‌کند.
  2. تابع خطا: یک تابع خطا، پیش‌بینی مدل را ارزیابی می‌کند. اگر نمونه‌های شناخته‌شده وجود داشته باشند، تابع خطا می‌تواند مقایسه‌ای انجام دهد تا دقت مدل را ارزیابی کند.
  3. فرآیند بهینه‌سازی مدل: اگر مدل بتواند بهتر با نقاط داده‌های مجموعه آموزشی تطبیق یابد، وزن‌ها تنظیم می‌شوند تا اختلاف بین نمونه شناخته‌شده و تخمین مدل کاهش یابد. الگوریتم این فرآیند تکراری "ارزیابی و بهینه‌سازی" را تکرار می‌کند و وزن‌ها را به طور خودکار به‌روزرسانی می‌کند تا زمانی که آستانه دقت مورد نظر برآورده شود.

تفاوت یادگیری ماشین، یادگیری عمیق و شبکه‌های عصبی
از آنجا که یادگیری عمیق و یادگیری ماشین معمولاً به جای یکدیگر استفاده می‌شوند، ذکر تفاوت‌های ظریف بین این دو مفید است. یادگیری ماشین، یادگیری عمیق و شبکه‌های عصبی همگی زیرشاخه‌های هوش مصنوعی هستند. با این حال، شبکه‌های عصبی در واقع زیرشاخه‌ای از یادگیری ماشین هستند و یادگیری عمیق نیز زیرشاخه‌ای از شبکه‌های عصبی است.

تفاوت یادگیری عمیق و یادگیری ماشین در نحوه یادگیری هر الگوریتم است. یادگیری عمیق می‌تواند از مجموعه داده‌های برچسب‌دار (که به عنوان یادگیری نظارت‌شده نیز شناخته می‌شود) برای آموزش الگوریتم خود استفاده کند، اما لزوماً به مجموعه داده‌های برچسب‌دار نیاز ندارد. فرآیند یادگیری عمیق می‌تواند داده‌های ساختارنیافته را به شکل خام (مانند متن یا تصاویر) پردازش کند و به طور خودکار مجموعه ویژگی‌هایی را که دسته‌های مختلف داده را از یکدیگر متمایز می‌کنند، تعیین کند. این امر نیاز به برخی مداخلات انسانی را کاهش می‌دهد و امکان استفاده از حجم زیادی از داده‌ها را فراهم می‌کند. می‌توانید یادگیری عمیق را به عنوان "یادگیری ماشین مقیاس‌پذیر" در نظر بگیرید، همان‌طور که لکس فریدمن در این سخنرانی MIT اشاره می‌کند.

یادگیری ماشین کلاسیک یا "غیرعمیق" بیشتر به مداخله انسانی برای یادگیری وابسته است. متخصصان انسانی مجموعه ویژگی‌هایی را تعیین می‌کنند تا تفاوت‌های بین داده‌های ورودی را درک کنند و معمولاً به داده‌های ساختاریافته‌تری برای یادگیری نیاز دارند.

شبکه‌های عصبی یا شبکه‌های عصبی مصنوعی (ANNs) از لایه‌های گره تشکیل شده‌اند که شامل یک لایه ورودی، یک یا چند لایه پنهان و یک لایه خروجی هستند. هر گره یا نورون مصنوعی به گره دیگری متصل است و دارای وزن و آستانه مرتبط است. اگر خروجی هر گره از مقدار آستانه مشخص‌شده بیشتر باشد، آن گره فعال می‌شود و داده‌ها را به لایه بعدی شبکه ارسال می‌کند. در غیر این صورت، هیچ داده‌ای توسط آن گره به لایه بعدی شبکه منتقل نمی‌شود. اصطلاح "عمیق" در یادگیری عمیق فقط به تعداد لایه‌های یک شبکه عصبی اشاره دارد. شبکه‌ای که از بیش از سه لایه تشکیل شده باشد (شامل لایه ورودی و خروجی) می‌تواند به عنوان یک الگوریتم یادگیری عمیق یا یک شبکه عصبی عمیق در نظر گرفته شود. شبکه‌ای که فقط سه لایه دارد، صرفاً یک شبکه عصبی پایه است.

یادگیری عمیق و شبکه‌های عصبی به دلیل تسریع پیشرفت در حوزه‌هایی مانند بینایی کامپیوتر، پردازش زبان طبیعی و تشخیص گفتار مورد تحسین قرار گرفته‌اند.

برای بررسی دقیق‌تر نحوه ارتباط مفاهیم مختلف، می‌توانید پست وبلاگ "هوش مصنوعی در مقابل یادگیری ماشین در مقابل یادگیری عمیق در مقابل شبکه‌های عصبی: تفاوت چیست؟" را مطالعه کنید.

روش‌های یادگیری ماشین
مدل‌های یادگیری ماشین به سه دسته اصلی تقسیم می‌شوند:

  1. یادگیری ماشین نظارت‌شده: یادگیری نظارت‌شده که به عنوان یادگیری ماشین نظارت‌شده نیز شناخته می‌شود، با استفاده از مجموعه داده‌های برچسب‌دار برای آموزش الگوریتم‌ها به منظور طبقه‌بندی داده‌ها یا پیش‌بینی دقیق نتایج تعریف می‌شود. همان‌طور که داده‌های ورودی به مدل تغذیه می‌شوند، مدل وزن‌های خود را تنظیم می‌کند تا به درستی تطبیق یابد. این امر به عنوان بخشی از فرآیند اعتبارسنجی متقابل انجام می‌شود تا اطمینان حاصل شود که مدل از بیش‌برازش یا کم‌برازش اجتناب می‌کند. یادگیری نظارت‌شده به سازمان‌ها کمک می‌کند تا انواع مشکلات دنیای واقعی را در مقیاس بزرگ حل کنند، مانند طبقه‌بندی اسپم در یک پوشه جداگانه از صندوق ورودی. برخی از روش‌های مورد استفاده در یادگیری نظارت‌شده شامل شبکه‌های عصبی، بیز ساده، رگرسیون خطی، رگرسیون لجستیک، جنگل تصادفی و ماشین بردار پشتیبان (SVM) است.
  2. یادگیری ماشین بدون نظارت: یادگیری بدون نظارت که به عنوان یادگیری ماشین بدون نظارت نیز شناخته می‌شود، از الگوریتم‌های یادگیری ماشین برای تحلیل و خوشه‌بندی مجموعه داده‌های بدون برچسب (زیرمجموعه‌هایی به نام خوشه) استفاده می‌کند. این الگوریتم‌ها الگوهای پنهان یا گروه‌بندی‌های داده را بدون نیاز به مداخله انسانی کشف می‌کنند. توانایی این روش در کشف شباهت‌ها و تفاوت‌ها در اطلاعات، آن را برای تحلیل اکتشافی داده‌ها، استراتژی‌های فروش متقابل، تقسیم‌بندی مشتریان و تشخیص تصویر و الگو ایده‌آل می‌کند. همچنین از این روش برای کاهش تعداد ویژگی‌ها در یک مدل از طریق فرآیند کاهش ابعاد استفاده می‌شود. تحلیل مؤلفه‌های اصلی (PCA) و تجزیه مقدار منفرد (SVD) دو رویکرد رایج برای این کار هستند. سایر الگوریتم‌های مورد استفاده در یادگیری بدون نظارت شامل شبکه‌های عصبی، خوشه‌بندی k-means و روش‌های خوشه‌بندی احتمالی است.
  3. یادگیری نیمه‌نظارت‌شده: یادگیری نیمه‌نظارت‌شده یک راه‌حل میانه بین یادگیری نظارت‌شده و بدون نظارت ارائه می‌دهد. در طول آموزش، از یک مجموعه داده برچسب‌دار کوچکتر برای هدایت طبقه‌بندی و استخراج ویژگی‌ها از یک مجموعه داده بزرگتر و بدون برچسب استفاده می‌کند. یادگیری نیمه‌نظارت‌شده می‌تواند مشکل کمبود داده‌های برچسب‌دار برای یک الگوریتم یادگیری نظارت‌شده را حل کند. همچنین اگر برچسب‌زنی داده‌ها هزینه‌بر باشد، کمک‌کننده است.

برای بررسی عمیق‌تر تفاوت‌های بین این رویکردها، می‌توانید مقاله "یادگیری نظارت‌شده در مقابل یادگیری بدون نظارت: تفاوت چیست؟" را مطالعه کنید.

  1. یادگیری تقویتی: یادگیری تقویتی یک مدل یادگیری ماشین است که شبیه به یادگیری نظارت‌شده است، اما الگوریتم با استفاده از داده‌های نمونه آموزش نمی‌بیند. این مدل با استفاده از روش آزمون و خطا یاد می‌گیرد. یک دنباله از نتایج موفقیت‌آمیز تقویت می‌شود تا بهترین توصیه یا سیاست برای یک مشکل خاص توسعه یابد.

سیستم IBM Watson® که در سال 2011 برنده چالش Jeopardy! شد، نمونه خوبی است. این سیستم از یادگیری تقویتی برای یادگیری زمان پاسخ‌دهی (یا سؤال پرسیدن)، انتخاب مربع روی صفحه و میزان شرط‌بندی—به ویژه در شرط‌های روزانه—استفاده کرد.

الگوریتم‌های رایج یادگیری ماشین
تعدادی از الگوریتم‌های یادگیری ماشین به طور معمول استفاده می‌شوند. این موارد شامل:

  • شبکه‌های عصبی: شبکه‌های عصبی نحوه کار مغز انسان را شبیه‌سازی می‌کنند و از تعداد زیادی گره پردازشی مرتبط تشکیل شده‌اند. شبکه‌های عصبی در تشخیص الگوها خوب هستند و نقش مهمی در کاربردهایی مانند ترجمه زبان طبیعی، تشخیص تصویر، تشخیص گفتار و ایجاد تصویر ایفا می‌کنند.
  • رگرسیون خطی: این الگوریتم برای پیش‌بینی مقادیر عددی بر اساس رابطه خطی بین مقادیر مختلف استفاده می‌شود. به عنوان مثال، این تکنیک می‌تواند برای پیش‌بینی قیمت خانه‌ها بر اساس داده‌های تاریخی منطقه استفاده شود.
  • رگرسیون لجستیک: این الگوریتم یادگیری نظارت‌شده پیش‌بینی‌هایی برای متغیرهای پاسخ دسته‌ای مانند پاسخ‌های "بله/خیر" به سؤالات انجام می‌دهد. می‌تواند برای کاربردهایی مانند طبقه‌بندی اسپم و کنترل کیفیت در خط تولید استفاده شود.
  • خوشه‌بندی: با استفاده از یادگیری بدون نظارت، الگوریتم‌های خوشه‌بندی می‌توانند الگوهای موجود در داده‌ها را شناسایی کنند تا گروه‌بندی شوند. کامپیوترها می‌توانند با شناسایی تفاوت‌های بین موارد داده که انسان‌ها از آن غافل شده‌اند، به دانشمندان داده کمک کنند.
  • درخت‌های تصمیم: درخت‌های تصمیم می‌توانند هم برای پیش‌بینی مقادیر عددی (رگرسیون) و هم برای طبقه‌بندی داده‌ها به دسته‌ها استفاده شوند. درخت‌های تصمیم از دنباله‌ای از تصمیم‌های مرتبط استفاده می‌کنند که می‌توانند با یک نمودار درختی نمایش داده شوند. یکی از مزایای درخت‌های تصمیم این است که اعتبارسنجی و حسابرسی آن‌ها آسان‌تر از شبکه‌های عصبی است.
  • جنگل‌های تصادفی: در یک جنگل تصادفی، الگوریتم یادگیری ماشین یک مقدار یا دسته را با ترکیب نتایج حاصل از چندین درخت تصمیم پیش‌بینی می‌کند.

مزایا و معایب الگوریتم‌های یادگیری ماشین
بسته به بودجه، نیاز به سرعت و دقت مورد نیاز، هر نوع الگوریتم—نظارت‌شده، بدون نظارت، نیمه‌نظارت‌شده یا تقویتی—مزایا و معایب خود را دارد. به عنوان مثال، الگوریتم‌های درخت تصمیم هم برای پیش‌بینی مقادیر عددی (مشکلات رگرسیون) و هم برای طبقه‌بندی داده‌ها به دسته‌ها استفاده می‌شوند. درخت‌های تصمیم از دنباله‌ای از تصمیم‌های مرتبط استفاده می‌کنند که ممکن است با یک نمودار درختی نمایش داده شوند. یک مزیت اصلی درخت‌های تصمیم این است که اعتبارسنجی و حسابرسی آن‌ها آسان‌تر از شبکه‌های عصبی است. خبر بد این است که آن‌ها می‌توانند ناپایدارتر از سایر پیش‌بین‌کننده‌های تصمیم باشند.

به طور کلی، یادگیری ماشین مزایای زیادی دارد که کسب‌وکارها می‌توانند برای دستیابی به کارایی‌های جدید از آن‌ها استفاده کنند. این مزایا شامل شناسایی الگوها و روندها در حجم عظیمی از داده‌ها است که انسان‌ها ممکن است اصلاً متوجه آن‌ها نشوند. و این تحلیل نیاز به مداخله انسانی کمی دارد: فقط مجموعه داده مورد نظر را وارد کنید و بگذارید سیستم یادگیری ماشین الگوریتم‌های خود را جمع‌آوری و اصلاح کند—که با ورود داده‌های بیشتر به مرور زمان بهبود می‌یابند. مشتریان و کاربران می‌توانند از تجربه شخصی‌شده‌تری لذت ببرند، زیرا مدل با هر تجربه با آن شخص بیشتر یاد می‌گیرد.

در طرف مقابل، یادگیری ماشین به مجموعه داده‌های آموزشی بزرگی نیاز دارد که دقیق و بدون سوگیری باشند. GIGO عامل عملیاتی است: زباله وارد کنی، زباله تحویل بگیری. جمع‌آوری داده‌های کافی و داشتن سیستمی که به اندازه کافی قوی باشد تا آن‌ها را اجرا کند، ممکن است منابع را نیز تخلیه کند. یادگیری ماشین همچنین می‌تواند مستعد خطا باشد، بسته به ورودی. با نمونه‌های بسیار کوچک، سیستم می‌تواند یک الگوریتم کاملاً منطقی تولید کند که کاملاً اشتباه یا گمراه‌کننده است. برای جلوگیری از هدر رفتن بودجه یا نارضایتی مشتریان، سازمان‌ها باید تنها زمانی که اطمینان بالایی به خروجی وجود دارد، بر اساس پاسخ‌ها عمل کنند.

موارد استفاده واقعی یادگیری ماشین
در اینجا فقط چند نمونه از یادگیری ماشین که ممکن است هر روز با آن‌ها مواجه شوید آورده شده است:

  • تشخیص گفتار: همچنین به عنوان تشخیص گفتار خودکار (ASR)، تشخیص گفتار کامپیوتری یا گفتار به متن شناخته می‌شود و قابلیتی است که از پردازش زبان طبیعی (NLP) برای ترجمه گفتار انسان به یک فرمت نوشتاری استفاده می‌کند. بسیاری از دستگاه‌های همراه تشخیص گفتار را در سیستم‌های خود برای انجام جستجوی صوتی—مانند Siri—یا بهبود دسترسی برای ارسال پیام‌کوتاه ادغام کرده‌اند.
  • خدمات مشتری: ربات‌های چت آنلاین در حال جایگزینی عوامل انسانی در طول سفر مشتری هستند و نحوه تفکر ما درباره تعامل با مشتریان در وب‌سایت‌ها و پلتفرم‌های رسانه‌های اجتماعی را تغییر می‌دهند. ربات‌های چت به سؤالات متداول (FAQ) در مورد موضوعاتی مانند حمل‌ونقل پاسخ می‌دهند یا توصیه‌های شخصی‌شده ارائه می‌دهند، محصولات را به صورت متقابل می‌فروشند یا اندازه‌ها را به کاربران پیشنهاد می‌کنند. نمونه‌ها شامل نمایندگان مجازی در سایت‌های تجارت الکترونیک، ربات‌های پیام‌رسان با استفاده از Slack و Facebook Messenger و وظایفی است که معمولاً توسط دستیاران مجازی و دستیاران صوتی انجام می‌شود.
  • بینایی کامپیوتر: این فناوری هوش مصنوعی به کامپیوترها امکان می‌دهد تا اطلاعات معناداری از تصاویر دیجیتال، ویدیوها و سایر ورودی‌های بصری استخراج کنند و سپس اقدام مناسب را انجام دهند. بینایی کامپیوتر که توسط شبکه‌های عصبی کانولوشنال قدرت می‌گیرد، کاربردهایی در برچسب‌گذاری عکس‌ها در رسانه‌های اجتماعی، تصویربرداری رادیولوژی در مراقبت‌های بهداشتی و خودروهای خودران در صنعت خودرو دارد.
  • موتورهای پیشنهاد: با استفاده از داده‌های رفتار مصرف گذشته، الگوریتم‌های هوش مصنوعی می‌توانند به کشف روندهای داده کمک کنند که می‌توانند برای توسعه استراتژی‌های فروش متقابل مؤثرتر استفاده شوند. موتورهای پیشنهاد توسط خرده‌فروشان آنلاین برای ارائه پیشنهادات محصول مرتبط به مشتریان در طول فرآیند پرداخت استفاده می‌شوند.
  • اتوماسیون فرآیند رباتیک (RPA): همچنین به عنوان رباتیک نرم‌افزاری شناخته می‌شود، RPA از فناوری‌های اتوماسیون هوشمند برای انجام وظایف دستی تکراری استفاده می‌کند.
  • معامله‌گری خودکار سهام: طراحی شده برای بهینه‌سازی پرتفوی سهام، پلتفرم‌های معامله‌گری با فرکانس بالا که توسط هوش مصنوعی هدایت می‌شوند، هزاران یا حتی میلیون‌ها معامله در روز بدون مداخله انسانی انجام می‌دهند.
  • تشخیص تقلب: بانک‌ها و سایر مؤسسات مالی می‌توانند از یادگیری ماشین برای شناسایی معاملات مشکوک استفاده کنند. یادگیری نظارت‌شده می‌تواند یک مدل را با استفاده از اطلاعات مربوط به معاملات تقلبی شناخته‌شده آموزش دهد. تشخیص ناهنجاری می‌تواند معاملاتی را که غیرمعمول به نظر می‌رسند و نیاز به بررسی بیشتر دارند، شناسایی کند.

چالش‌های یادگیری ماشین
با توسعه فناوری یادگیری ماشین، زندگی ما قطعاً آسان‌تر شده است. با این حال، پیاده‌سازی یادگیری ماشین در کسب‌وکارها نیز نگرانی‌های اخلاقی متعددی را در مورد فناوری‌های هوش مصنوعی ایجاد کرده است. برخی از این موارد عبارتند از:

  1. تکینگی فناوری: در حالی که این موضوع توجه عمومی زیادی را به خود جلب می‌کند، بسیاری از محققان نگران این ایده نیستند که هوش مصنوعی در آینده نزدیک از هوش انسان پیشی بگیرد. تکینگی فناوری همچنین به عنوان هوش مصنوعی قوی یا ابرهوش شناخته می‌شود. فیلسوف نیک بوستروم ابرهوش را به عنوان "هر نوع هوشی که به طور قابل توجهی از بهترین مغزهای انسان در تقریباً هر زمینه‌ای، از جمله خلاقیت علمی، خرد عمومی و مهارت‌های اجتماعی، بهتر عمل کند" تعریف می‌کند. با وجود اینکه ابرهوش در جامعه قریب‌الوقوع نیست، ایده آن سؤالات جالبی را مطرح می‌کند که باید هنگام استفاده از سیستم‌های خودکار، مانند خودروهای خودران، در نظر بگیریم. غیرواقعی است که فکر کنیم یک خودروی بدون راننده هرگز دچار تصادف نخواهد شد، اما در آن شرایط چه کسی مسئول و liable است؟ آیا باید همچنان خودروهای خودران را توسعه دهیم یا این فناوری را به خودروهای نیمه‌خودران محدود کنیم که به مردم کمک می‌کنند تا با ایمنی رانندگی کنند؟ هنوز در این مورد تصمیمی گرفته نشده است، اما این‌ها انواع بحث‌های اخلاقی هستند که با توسعه فناوری‌های نوآورانه هوش مصنوعی رخ می‌دهند.
  2. تأثیر هوش مصنوعی بر مشاغل: در حالی که بسیاری از ادراک عمومی از هوش مصنوعی حول محور از دست دادن شغل می‌چرخد، این نگرانی احتمالاً باید بازتعریف شود. با هر فناوری جدید مختل‌کننده، می‌بینیم که تقاضای بازار برای نقش‌های شغلی خاص تغییر می‌کند. به عنوان مثال، وقتی به صنعت خودرو نگاه می‌کنیم، بسیاری از تولیدکنندگان، مانند جنرال موتورز، در حال تغییر تمرکز خود به تولید خودروهای الکتریکی برای همسویی با ابتکارات سبز هستند. صنعت انرژی از بین نمی‌رود، اما منبع انرژی از اقتصاد سوخت به اقتصاد الکتریکی تغییر می‌کند.

به همین ترتیب، هوش مصنوعی تقاضا برای مشاغل را به حوزه‌های دیگر منتقل می‌کند. افرادی نیاز خواهند بود تا به مدیریت سیستم‌های هوش مصنوعی کمک کنند. هنوز افرادی نیاز خواهند بود تا مشکلات پیچیده‌تر در صنایعی که بیشتر تحت تأثیر تغییرات تقاضای شغلی قرار می‌گیرند، مانند خدمات مشتری، را حل کنند. بزرگترین چالش با هوش مصنوعی و تأثیر آن بر بازار کار، کمک به افراد برای انتقال به نقش‌های جدیدی است که تقاضا دارند.

  1. حریم خصوصی: حریم خصوصی معمولاً در چارچوب حریم خصوصی داده‌ها، حفاظت از داده‌ها و امنیت داده‌ها مورد بحث قرار می‌گیرد. این نگرانی‌ها به سیاست‌گذاران اجازه داده است تا در سال‌های اخیر پیشرفت‌های بیشتری داشته باشند. به عنوان مثال، در سال 2016، قانون GDPR ایجاد شد تا از داده‌های شخصی افراد در اتحادیه اروپا و منطقه اقتصادی اروپا محافظت کند و به افراد کنترل بیشتری بر داده‌های خود بدهد. در ایالات متحده، ایالت‌های فردی در حال توسعه سیاست‌هایی هستند، مانند قانون حریم خصوصی مصرف‌کننده کالیفرنیا (CCPA)، که در سال 2018 معرفی شد و از کسب‌وکارها می‌خواهد که مصرف‌کنندگان را از جمع‌آوری داده‌هایشان مطلع کنند. قوانینی مانند این، شرکت‌ها را مجبور کرده است تا در مورد نحوه ذخیره و استفاده از اطلاعات شخصی قابل شناسایی (PII) تجدید نظر کنند. در نتیجه، سرمایه‌گذاری در امنیت به یک اولویت فزاینده برای کسب‌وکارها تبدیل شده است، زیرا آن‌ها به دنبال از بین بردن هرگونه آسیب‌پذیری و فرصت‌های نظارت، هک و حملات سایبری هستند.
  2. سوگیری و تبعیض: موارد سوگیری و تبعیض در تعدادی از سیستم‌های یادگیری ماشین سؤالات اخلاقی زیادی را در مورد استفاده از هوش مصنوعی ایجاد کرده است. چگونه می‌توانیم در برابر سوگیری و تبعیض محافظت کنیم، در حالی که داده‌های آموزشی خود ممکن است توسط فرآیندهای انسانی سوگیرانه تولید شده باشند؟ در حالی که شرکت‌ها معمولاً نیات خوبی برای تلاش‌های اتوماسیون خود دارند، رویترز برخی از پیامدهای پیش‌بینی نشده ادغام هوش مصنوعی در شیوه‌های استخدام را برجسته کرده است. در تلاش برای اتوماسیون و ساده‌سازی یک فرآیند، آمازون به طور ناخواسته علیه داوطلبان شغلی بر اساس جنسیت برای نقش‌های فنی تبعیض قائل شد و در نهایت مجبور به لغو پروژه شد. Harvard Business Review سؤالات دیگری را در مورد استفاده از هوش مصنوعی در شیوه‌های استخدام مطرح کرده است، مانند اینکه چه داده‌هایی باید هنگام ارزیابی یک داوطلب برای یک نقش استفاده کنید.

سوگیری و تبعیض محدود به عملکرد منابع انسانی نیست؛ آن‌ها را می‌توان در تعدادی از کاربردها، از نرم‌افزار تشخیص چهره تا الگوریتم‌های رسانه‌های اجتماعی یافت.

با افزایش آگاهی کسب‌وکارها از خطرات هوش مصنوعی، آن‌ها همچنین در این بحث درباره اخلاق و ارزش‌های هوش مصنوعی فعال‌تر شده‌اند. به عنوان مثال، IBM محصولات تشخیص و تحلیل چهره عمومی خود را متوقف کرده است. آرویند کریشنا، مدیرعامل IBM نوشت: "IBM به شدت مخالف است و استفاده از هر فناوری، از جمله فناوری تشخیص چهره ارائه‌شده توسط سایر فروشندگان، برای نظارت جمعی، پروفایل‌سازی نژادی، نقض حقوق و آزادی‌های اساسی بشر یا هر هدفی که با ارزش‌ها و اصول اعتماد و شفافیت ما سازگار نباشد، را تحمل نخواهد کرد."

  1. پاسخگویی: از آنجا که قانون‌گذاری قابل توجهی برای تنظیم شیوه‌های هوش مصنوعی وجود ندارد، هیچ مکانیسم اجرایی واقعی برای اطمینان از رعایت اخلاق در هوش مصنوعی وجود ندارد. انگیزه‌های فعلی شرکت‌ها برای اخلاقی بودن، پیامدهای منفی یک سیستم هوش مصنوعی غیراخلاقی بر سودآوری است. برای پر کردن این شکاف، چارچوب‌های اخلاقی به عنوان بخشی از همکاری بین اخلاق‌دانان و محققان برای حکمرانی ساخت و توزیع مدل‌های هوش مصنوعی در جامعه ظهور کرده‌اند. با این حال، در حال حاضر، این‌ها فقط به عنوان راهنما عمل می‌کنند. برخی تحقیقات نشان می‌دهند که ترکیب مسئولیت توزیع‌شده و عدم پیش‌بینی پیامدهای بالقوه، به جلوگیری از آسیب به جامعه کمک نمی‌کند.

چگونه پلتفرم هوش مصنوعی مناسب برای یادگیری ماشین را انتخاب کنیم؟
انتخاب یک پلتفرم می‌تواند یک فرآیند چالش‌برانگیز باشد، زیرا سیستم اشتباه می‌تواند هزینه‌ها را افزایش دهد یا استفاده از سایر ابزارها یا فناوری‌های ارزشمند را محدود کند. هنگام بررسی چندین فروشنده برای انتخاب یک پلتفرم هوش مصنوعی، اغلب تمایل به این فکر وجود دارد که ویژگی‌های بیشتر = سیستم بهتر. شاید اینطور باشد، اما بررسی‌کنندگان باید ابتدا به این فکر کنند که پلتفرم هوش مصنوعی برای سازمان‌شان چه کاری انجام خواهد داد. چه قابلیت‌های یادگیری ماشینی باید ارائه شود و چه ویژگی‌هایی برای دستیابی به آن‌ها مهم هستند؟ یک ویژگی از دست‌رفته ممکن است مفید بودن کل سیستم را به خطر بیندازد. در اینجا برخی از ویژگی‌هایی که باید در نظر گرفته شوند آورده شده است:

  • قابلیت‌های MLOps: آیا سیستم دارای:
    • یک رابط یکپارچه برای سهولت مدیریت است؟
    • ابزارهای یادگیری ماشین خودکار برای ایجاد سریع‌تر مدل‌ها با عملکرد کم‌کد و بدون کد است؟
    • بهینه‌سازی تصمیم برای ساده‌سازی انتخاب و استقرار مدل‌های بهینه‌سازی است؟
    • مدل‌سازی بصری برای ترکیب علم داده بصری با کتابخانه‌های منبع باز و رابط‌های مبتنی بر نوت‌بوک در یک استودیوی داده و هوش مصنوعی یکپارچه است؟
    • توسعه خودکار برای مبتدیان برای شروع سریع و دانشمندان داده پیشرفته‌تر برای آزمایش است؟
    • تولیدکننده داده مصنوعی به عنوان جایگزین یا مکمل داده‌های دنیای واقعی زمانی که داده‌های دنیای واقعی به راحتی در دسترس نیستند است؟
  • قابلیت‌های هوش مصنوعی مولد: آیا سیستم دارای:
    • یک تولیدکننده محتوا است که می‌تواند متن، تصاویر و سایر محتواها را بر اساس داده‌هایی که روی آن آموزش دیده است تولید کند؟
    • طبقه‌بندی خودکار برای خواندن و طبقه‌بندی ورودی‌های نوشتاری، مانند ارزیابی و مرتب‌سازی شکایات مشتریان یا بررسی احساسات بازخورد مشتریان است؟
    • یک تولیدکننده خلاصه است که می‌تواند متن فشرده را به یک خلاصه با کیفیت بالا تبدیل کند، نکات کلیدی را از گزارش‌های مالی استخراج کند و رونوشت‌های جلسات را تولید کند؟
    • قابلیت استخراج داده برای بررسی جزئیات پیچیده و استخراج سریع اطلاعات لازم از اسناد بزرگ است؟