- By - سید محمدرضا دادخواهی
- هوش مصنوعی
- نوامبر 5, 2019
فرض کنید روز شلوغی در سال 2039 است و شما در حال تماشا کردن فیلم در حین سفر با یکی از خودروهای خودکاری هستید که در جادههای جهان پرسه می زنند. این خودرو خودش در زمان لازم ترمز کرده و گاز می دهد، به اشیا (ماشین های دیگر، دوچرخه سواران، گربه های ولگرد و…) برخورد نمی کند، از تمام علائم راهنمایی و رانندگی پیروی می کند و همیشه بین خطوط می راند.تا همین چند وقت پیش این یک سناریو مضحک بود. اما حالا جای پایش را در قلمروی امکان محکم کرده است. درواقع، شاید یک روز خوردوهای خودکار آنقدر از پیرامونشان آگاه باشند که اصلاً تصادفی پیش نیاید. بااینوجود، برای رسیدن به این نقطه باید با استفاده از فرآیندهای پیچیده گوناگون ازجمله یادگیری عمیق ، بر بسیاری از موانع فائق آمد. اما سوال اصلی اینجاست که فناوری تا کجا میتواند ما را با خود ببرد؟
یادگیری عمیق چیست؟
یادگیری عمیق ، شکل تازه احیاشدهای است از یادگیری ماشینی که خودش زیرمجموعهای از هوش مصنوعی به حساب میآید. یادگیری عمیق بهمنظور شناسایی اشیا و ترجمه گفتار در زمان واقعی، با تقلید از لایههای نورونی در مغز انسان، از رایانههای قوی، مجموعه دادههای انبوه، شبکههای عصبیِ تحت نظارت و آموزشدیده و الگوریتم موسوم به پسانتشار یا بهاصطلاح backprop استفاده میکند.
یادگیری عمیق از دهه 1950 مطرح بوده، اما ظهور آن به عنوان یک ستاره در حوزه هوش مصنوعی، نسبتاً چیز جدیدی است. در سال 1986، جفری هینتون، پژوهشگر فعلی گوگل و کسی که مدتهاست پدرخوانده یادگیری عمیق شناخته میشود، در میان پژوهشگرانی بود که به ارائه تصویری از شبکههای عصبی کمک کردند و به زبان علمی نشان دادند که میتوان تعداد زیادی از رایانهها را با استفاده از الگوریتم پسانتشار، برای شناسایی بهتر شکل و پیشبینی کلمه آموزش داد. تا سال 2012 از یادگیری عمیق در همهچیز استفاده میشد؛ از برنامههای مصرفکننده مثل Siri اپل گرفته تا تحقیقات داروشناختی.
هینتون در گفتگو با نیویورکتایمز اظهار داشت: «نکته این رویکرد رشد زیبای آن است. اساساً فقط باید آن را بزرگتر و سریعتر کنید، تا بهتر شود. حالا دیگر نباید به پشت سر نگاه کرد.»
یادگیری عمیق چطور کار میکند؟
ساخت اتومبیل خودران نسل بعد
شرکت HERE، نقشههای باکیفیتی میسازد که قابلیتهای پردازنده خودرو را بسیار بالا میبرند، بهعلاوه برای سواریهای آینده، سیستم ناوبری طراحی میکند. یادگیری عمیق برای این فرآیند بسیار اهمیت دارد.
مدیرعامل این شرکت پس از برگزاری غرورآمیز یک تور برای بازدید از فضای دفتر کارش به بازدیدکنندگان، اینطور میگوید: «بعضی از مردم میگویند که ما می توانیم بدون نقشههای HD هم زندگی کنیم، میتوانیم فقط یک دوربین روی خودرو بگذاریم. اما دوربین شما هرچهقدر هم که خوب باشد، همیشه با مشکلی مواجه خواهد شد. پس اگر حسگرهای شما خراب شوند، نقشه آخرین راه فرارتان است.»
او و تیمش، با تعریف الگوریتمهای خودکار و خط لوله دادههای مقیاسپذیر (سیستمی که میتواند حجم فزایندهای از دادههای ورودی را مدیریت نماید)، نقشههای باکیفیتی میسازند که از منایع مختلف، دادههایی را به خدمت میگیرند. این دادهها از طریق سنسورهای روی خودروهای مالکان اصلی HERE، یعنی BMW، مرسدس و آئودی گردآوری میشوند.
او توضیح میدهد که چون شروع کردن با دادههای آموزشی دقیق اهمیت دارد، نامگذاری یا اصطلاحا برچسبزنی انسانی، اولین گام مهم در این فرآیند است. تصاویر نمای خیابانها از طریق نقشه گوگل و Lidar (یک سیستم شناسایی شبهرادار که از نور لیزر برای جمعآوری اطلاعات مربوط به اشکال سهبعدی دقیق در جهان استفاده میکند) در کنار اطلاعات نشانگذاری کوچهها که در ابتدا بهصورت دستی کدگذاری شدهاند، به یک موتور یادگیری عمیق، داده میشوند؛ این موتور مکرراً بهبود یافته و بازیافت میشود. سپس مدل یادگیری عمیق در خط لوله تولید، گسترش مییابد و به کار گرفته میشود تا نشانگذاری کوچهها و راههای باریک را با دقت سانتیمتر بهصورت خودکار شناسایی کند. در اینجا باز هم انسان وارد معادله میشود تا صحت تمام این اندازهها را بازبینی و تأیید کند.
او میگوید که در حالت آرمانی، کارخانههای خودروسازی بسیار بیشتری با به اشتراکگذاری دادههای حسگر خود موافقت خواهند کرد؛ البته نه اطلاعات شخصی قابلتشخیص که نگرانی از نقض حریم خصوصی را مطرح میسازند. ازاینرو خودروهای خودکار میتوانند از یکدیگر یاد گرفته و از بهروزرسانیهای تازه بهرهمند شوند. بهعنوان مثال، فرض کنید یک تصادف زنجیرهای ششماشینه، پنج مایل جلوتر از موقعیت فعلی شما رخ داده است. اولین خودرویی که این تصادف را کشف کرده، اطلاعات را به یک منبع مرکزی مثل HERE مخابره میکند، که آن هم به نوبه خود آن اطلاعات را به هر خودرویی که به محل حادثه نزدیک میشود مخابره مینماید. این پروژه هنوز در دست ساخت است، اما مدیران شرکت از کارآمدی آن اطمینان دارند.
دامنه و تأثیر یادگیری عمیق
ابزاری تحولآفرین یا صرفاً مفید؟
گری مارکوس استاد دانشگاه نیویورک و پژوهشگر یادگیری ماشین، در مقاله خود، نسبت به استقبال از یادگیری عمیق بهعنوان نوعی انقلاب در هوش مصنوعی، ابراز بیعلاقگی نمود.
مارکوس اظهار داشت: «درواقع یادگیری عمیق فقط بخشی از چالش بزرگتر ساخت ماشینهای هوشمند است. چنین روشهایی فاقد راههای بازنمایی روابط علّی هستند (مثلاً بین بیماریها و علائم آنها) و احتمال دارد که در دریافت ایدههای انتزاعی با چالشهایی مواجه شوند. آنها شیوه واضحی برای اجرای استنتاجهای منطقی نداشته و از یکپارچهسازی دانش انتزاعی هم فاصله دارند؛ مثلاً اطلاعاتی درمورد چیستی اشیا، کاربرد آنها و نحوه استفاده از آنها.»
اکنون، به لطف افزایش قدرت رایانهای بهخصوص در پردازش گرافیکی و پیشرفتهای الگوریتمی (به ویژه در حوزه شبکههای عصبی) یادگیری عمیق تا حد زیادی، پیشرفتهتر شده و کاربرد گستردهتری یافته است؛ مثلاً در تشخیص پزشکی، جستجوی صدا، تولید خودکار متن و حتی پیشبینی وضعیت آب و هوا.
گرت اسمیت مؤسس Guild AI و مدیر سازمان یادگیری ماشینی Chicago ML میگوید: «قدرت واقعی یادگیری عمیق، زمانی معلوم شد که مردم فهمیدند میتوان از آن برای حل بسیاری از مسائل استفاده کرد. در برخی موارد، بعضی از کاربردها میتوانند یک سر و گردن بالاتر بوده و به توانایی فوق بشری پهلو بزنند.»
DeepMind شرکت نهسالهای است که از سال 2014 به تملک گوگل درآمده است. مطالعات این شرکت انگلیسی در باب یادگیری تقویتی عمیق، ترکیبی از یادگیری عمیق بر اساس شبکه عصبی و یادگیری تقویتی بر اساس آزمون و خطا، به تولید نرمافزاری بهنام AlphaGo و همتای پیشرفتهترش AlphaGo Zero انجامید که هر دوی آنها در سال 2016 بهشکلی استادانه، قهرمانان بازی Go را له کردند.
ریسی کوندور، استاد علوم رایانهای دانشگاه شیکاگو میگوید: «حالا ارتباط یکپارچهتری میان یادگیری ماشینی و علم برقرار است. یادگیری ماشینی صرفاً کار آزاردهندهای نیست که مجبور باشید در کنار کارهای دیگر انجامش دهید. چون حجم زیادی از داده روی هارد درایوتان دارید و در حال تبدیل شدن به جزء جدانشدنی فرآیند کشف علمی است.»
مثلاً دینامیک مولکولی، شبیهسازی رایانهای خط سیر اتمها و مولکولهاست تا بفهمیم که یک سیستم جاندار یا بیجان، تحت فشار چه رفتاری دارد یا اینکه مولکولهای دارو چطور به گیرندههای خود میچسبند. در گذشتههای دور، کارشناسان پیشبینی میکردند که طراحی مولکولی کاملاً خودکار شده و تولید دارو را سرعت خواهد بخشید.
وعده شبکههای عصبی
بزرگترین تغییر جهت فعلی در یادگیری عمیق، عمق شبکههای عصبی است که از چند لایه به صدها لایه افزایش یافته است. عمق بیشتر به معنای ظرفیت بیشتر تشخیص الگوهاست که قدرت تشخیص اشیا و پردازش زبان طبیعی را تقویت میکند به طوری که مورد اولی از دومی انشعابات گستردهتری دارد.
اسمیت میگوید: «فرآیند ترجمه کار سختی است و برنامههای فوقالعادهای برای این کار وجود دارد. امروزه شما از لحاظ وجود شبکههایی که قادر به پیشبینیکردن زبانهایی باشند که هرگز پیش از این ندیدهاند، از انعطافپذیری بیشتری برخوردارید. اما قابلیت اجرای عمومی ترجمه با محدودیت مواجه است. ما مدتی این کار را انجام میدادیم و تأثیر چندانی در تغییر این بازی نداشت. داشتن بینش قوی، همان چیزی است که نوآوری عظیمی را به دنبال دارد. بهعنوان مثال گذاشتن ردیاب روی یک ماشین تا بتواند محیطش را بهدرستی تشخیص دهد میتواند همهچیز را تغییر دهد.»
چالشهای یادگیری عمیق
مشکل داده را چطور حل کنیم؟
اسمیت میگوید وقتی پای یادگیری عمیق در میان است، «فیل درخشان در اتاق» را میتوان معادل دادهها دانست. کیفیت آنها به اندازه کمیتشان اهمیت ندارد، چراکه مدلهای یادگیری ماشینی و عمیق، بهشدت در برابر دادههای اشتباه مقاوم هستند.
وی میگوید که شما اساساً در حال ارائه دانش هستید و برای انجام پردازشهای پیچیده به نورونهای بیشتر و ظرفیت بیشتری نیاز دارید؛ به دادههایی نیاز دارید که در دسترس عموم قرار ندارند.
این یعنی مدلهای از پیشآموخته که توسط شخص دیگری ساخته شده و بهصورت آنلاین دردسترس قرار گرفتهاند، مجموعهدادههای عمومی آن را کاهش نخواهد داد. در اینجاست که هیولاهای چندبیلیون دلاری یادگیری ماشینی مزیت منحصربهفردی دارند.
آینده یادگیری عمیق
در عینحال که کوندور، اسمیت و دیگران پیشرفت یادگیری عمیق را تحسین میکنند اما نسبت به محدودیتهای آن هم واقعبین هستند.
کوندور میگوید: «کارهایی که یادگیری عمیق در آنها واقعاً قوی ظاهر شده، دقیقاً از نوعی هستند که دانشمندان علوم رایانه مدتهاست بر رویش کار کردهاند؛ چون به خوبی تعریف شدهاند و منافع تجاری زیادی پشتشان است. پس این درست است که تشخیص اشیا، کاملاً با آنچه 12 سال قبل بود فرق میکند، اما مسئله همان تشخیص شیء است و از کارهای شناختی عمیق سطح بالا محسوب نمیشود.»
در یکی از مقالات وبسایت مدیوم که اخیرا با عنوان «عمیقترین مسئله یادگیری عمیق» منتشر شد، گری مارکوس، به مصاحبهای با استاد علوم رایانهای دانشگاه مونترال، یوشوا بِنجیو اشاره کرد؛ کسی که توصیه کرده «چالشهای دشوار هوش مصنوعی را در نظر گرفته و به پیشرفتهای کوتاهمدت تدریجی رضایت ندهید. نمیگویم که میخواهم یادگیری عمیق را فراموش کنم. برعکس، میخواهم آن را اساس قرار دهم. اما باید بتوانیم آن را برای انجام کارهایی مثل استدلال، یادگیری علیت و بررسی جهان برای فراگیری و کسب اطلاعات، توسعه دهیم.»
شاید یادگیری عمیق، همانطور که یان لوکان، مدیر تحقیقات هوش مصنوعی فیسبوک به مسئولین وبسایت VentureBeat میگوید، میبایست به نفع زبانی سادهتر و انعطافپذیرتر، از خیر زبان کدگذاری محبوب اما گاهاً مشکلساز پایتون بگذرد. لوکان اضافه کرد که شاید سختافزار جدیدی لازم شود. در هر صورت، یک چیز روشن است، یادگیری عمیق یا باید تکامل پیدا کند یا محکوم به فناست. هرچند به گفته مخاطبان این حوزه، دستیابی به اولی، از وقوع دومی جلوگیری نمیکند.
اسمیت میگوید که در این مقطع، حتی دختر سه سالهاش هم از پس یادگیری عمیق بر میآید. بهعنوان مثال:
«اگر به او عکسی از یک فیل نشان دهم و بعداً تصویر متفاوتی از فیل را ببیند، فوراً میتواند تشخیص دهد که این یک فیل است چون از قبل شکلش را میداند و میتواند آن را در ذهنش مجسم کند. اما یادگیری عمیق نمیتواند این مسئله را حل کند، چون فاقد قابلیت یادگیری از روی چند نمونه اندک است و ما هنوز به حجم انبوهی از دادههای آموزشی وابستهایم.»
او میگوید که از حالا به بعد، یادگیری عمیق صرفاً روشی مفید است که میتوان آن را برای حل مسائل مختلف به کار برد. بدین ترتیب، از این نظر، انقراض آن قریبالوقوع نیست، اما امکان دارد.
منبع: زومیت