فرض کنید روز شلوغی در سال 2039 است و شما در حال تماشا کردن فیلم در حین سفر با یکی از خودروهای خودکاری هستید که در جاده‌های جهان پرسه می زنند. این خودرو خودش در زمان‌ لازم ترمز کرده و گاز می دهد، به اشیا (ماشین های دیگر، دوچرخه سواران، گربه های ولگرد و…) برخورد نمی کند، از تمام علائم راهنمایی و رانندگی پیروی می کند و همیشه بین خطوط می راند.تا همین چند وقت پیش این یک سناریو مضحک بود. اما حالا جای پایش را در قلمروی امکان محکم کرده است. درواقع، شاید یک روز خوردوهای خودکار آن‌قدر از پیرامونشان آگاه باشند که اصلاً تصادفی پیش نیاید. بااین‌وجود، برای رسیدن به این نقطه باید با استفاده از فرآیندهای پیچیده‌ گوناگون ازجمله یادگیری عمیق ، بر بسیاری از موانع فائق آمد. اما سوال اصلی اینجاست که فناوری تا کجا می‌تواند ما را با خود ببرد؟

یادگیری عمیق چیست؟

یادگیری عمیق ، شکل تازه احیاشده‌ای است از یادگیری ماشینی که خودش زیرمجموعه‌ای از هوش مصنوعی به حساب می‌آید. یادگیری عمیق به‌منظور شناسایی اشیا و ترجمه‌‌ گفتار در زمان واقعی، با تقلید از لایه‌های نورونی در مغز انسان، از رایانه‌های قوی، مجموعه داده‌های انبوه، شبکه‌های عصبیِ تحت نظارت و آموزش‌دیده و الگوریتم موسوم به پس‌انتشار یا به‌‌اصطلاح backprop استفاده می‌کند.

یادگیری عمیق از دهه‌ 1950 مطرح بوده، اما ظهور آن به عنوان یک ستاره در حوزه‌‌ هوش مصنوعی، نسبتاً چیز جدیدی است. در سال 1986، جفری هینتون، پژوهشگر فعلی گوگل و کسی که مدت‌هاست پدرخوانده‌‌ یادگیری عمیق شناخته می‌شود، در میان پژوهشگرانی بود که به ارائه‌‌ تصویری از شبکه‌های عصبی کمک کردند و به زبان علمی نشان دادند که می‌توان تعداد زیادی از رایانه‌ها را با استفاده از الگوریتم پس‌انتشار، برای شناسایی بهتر شکل و پیش‌‌بینی کلمه آموزش داد. تا سال 2012 از یادگیری عمیق در همه‌چیز استفاده می‌شد؛ از برنامه‌های مصرف‌کننده مثل Siri اپل گرفته تا تحقیقات داروشناختی.

هینتون در گفتگو با نیویورک‌تایمز اظهار داشت: «نکته‌‌ این رویکرد رشد زیبای آن است. اساساً فقط باید آن را بزرگتر و سریع‌تر کنید، تا بهتر شود. حالا دیگر نباید به پشت سر نگاه کرد.»

یادگیری عمیق چطور کار می‌کند؟

ساخت اتومبیل خودران نسل بعد

شرکت HERE، نقشه‌های باکیفیتی می‌سازد که قابلیت‌های پردازنده‌ خودرو را بسیار بالا می‌برند، به‌علاوه برای سواری‌های آینده، سیستم ناوبری طراحی می‌کند. یادگیری عمیق برای این فرآیند بسیار اهمیت دارد.

مدیرعامل این شرکت پس از برگزاری غرورآمیز یک تور برای بازدید از فضای دفتر کارش به بازدیدکنندگان، این‌طور می‌گوید: «بعضی از مردم می‌گویند که ما می توانیم بدون نقشه‌های HD هم زندگی کنیم، می‌توانیم فقط یک دوربین روی خودرو بگذاریم. اما دوربین شما هرچه‌قدر هم که خوب باشد، همیشه با مشکلی مواجه خواهد شد. پس اگر حسگرهای شما خراب شوند، نقشه آخرین راه فرارتان است.»

او و تیمش، با تعریف الگوریتم‌های خودکار و خط لوله‌ داده‌های مقیاس‌پذیر (سیستمی که می‌تواند حجم فزاینده‌ای از داده‌های ورودی را مدیریت نماید)، نقشه‌های باکیفیتی می‌سازند که از منایع مختلف، داده‌هایی را به خدمت می‌گیرند. این داده‌‌ها از طریق سنسورهای روی خودروهای مالکان اصلی HERE، یعنی BMW، مرسدس و آئودی گردآوری می‌‌شوند.

او توضیح می‌دهد که چون شروع کردن با داده‌های آموزشی دقیق اهمیت دارد، نام‌گذاری یا اصطلاحا برچسب‌زنی انسانی، اولین گام مهم در این فرآیند است. تصاویر نمای خیابان‌‌ها از طریق نقشه‌ گوگل و Lidar (یک سیستم شناسایی شبه‌‌رادار که از نور لیزر برای جمع‌آوری اطلاعات مربوط به اشکال سه‌بعدی دقیق در جهان استفاده می‌کند) در کنار اطلاعات نشان‌گذاری کوچه‌ها که در ابتدا به‌صورت دستی کدگذاری شده‌اند، به یک موتور یادگیری عمیق، داده می‌شوند؛ این موتور مکرراً بهبود یافته و بازیافت می‌شود. سپس مدل یادگیری عمیق در خط لوله‌ تولید، گسترش می‌یابد و به کار گرفته می‌‌شود تا نشان‌گذاری کوچه‌ها و راه‌های باریک را با دقت سانتی‌متر به‌صورت خودکار شناسایی کند. در اینجا باز هم انسان وارد معادله می‌شود تا صحت تمام این اندازه‌‌ها را بازبینی و تأیید کند.

او می‌گوید که در حالت آرمانی، کارخانه‌های خودروسازی بسیار بیشتری با به‌ اشتراک‌گذاری داده‌های حسگر خود موافقت خواهند کرد؛ البته نه اطلاعات شخصی قابل‌تشخیص که نگرانی از نقض حریم خصوصی را مطرح می‌سازند. ازاین‌رو خودروهای خودکار می‌توانند از یکدیگر یاد گرفته و از به‌روزرسانی‌های تازه بهره‌مند شوند. به‌عنوان مثال، فرض کنید یک تصادف زنجیره‌ای شش‌‌ماشینه، پنج مایل جلوتر از موقعیت فعلی شما رخ داده است. اولین خودرویی که این تصادف را کشف کرده، اطلاعات را به یک منبع مرکزی مثل HERE مخابره می‌کند، که آن هم به نوبه‌ خود آن‌‌ اطلاعات را به هر خودرویی که به محل حادثه نزدیک می‌شود مخابره می‌نماید. این پروژه هنوز در دست ساخت است، اما مدیران شرکت از کارآمدی آن اطمینان دارند.

دامنه و تأثیر یادگیری عمیق

ابزاری تحول‌آفرین یا صرفاً مفید؟

گری مارکوس استاد دانشگاه نیویورک و پژوهشگر یادگیری ماشین، در مقاله‌ خود، نسبت به استقبال از یادگیری عمیق به‌عنوان نوعی انقلاب در هوش مصنوعی، ابراز بی‌علاقگی نمود.

مارکوس اظهار داشت: «درواقع یادگیری عمیق فقط بخشی از چالش بزرگتر ساخت ماشین‌های هوشمند است. چنین روش‌هایی فاقد راه‌های بازنمایی روابط علّی هستند (مثلاً بین بیماری‌ها و علائم آن‌‌ها) و احتمال دارد که در دریافت ایده‌های انتزاعی با چالش‌هایی مواجه شوند. آن‌‌ها شیوه‌ واضحی برای اجرای استنتاج‌های منطقی نداشته و از یکپارچه‌سازی دانش انتزاعی هم فاصله دارند؛ مثلاً اطلاعاتی درمورد چیستی اشیا، کاربرد آن‌‌ها و نحوه‌ استفاده از آن‌‌ها.»

اکنون، به لطف افزایش قدرت رایانه‌‌ای به‌خصوص در پردازش گرافیکی و پیشرفت‌های الگوریتمی (به ویژه در حوزه‌ شبکه‌های عصبی) یادگیری عمیق تا حد زیادی، پیشرفته‌تر شده و کاربرد گسترده‌تری یافته است؛ مثلاً در تشخیص پزشکی، جستجوی صدا، تولید خودکار متن و حتی پیش‌بینی وضعیت آب و هوا.

گرت اسمیت مؤسس Guild AI و مدیر سازمان یادگیری ماشینی Chicago ML می‌گوید: «قدرت واقعی یادگیری عمیق، زمانی معلوم شد که مردم فهمیدند می‌توان از آن برای حل بسیاری از مسائل استفاده کرد. در برخی موارد، بعضی از کاربردها می‌توانند یک سر و گردن بالاتر بوده و به توانایی فوق‌ بشری پهلو بزنند.»

DeepMind شرکت نه‌ساله‌ای است که از سال 2014 به تملک گوگل درآمده است. مطالعات این شرکت انگلیسی در باب یادگیری تقویتی عمیق، ترکیبی از یادگیری عمیق بر اساس شبکه‌ عصبی و یادگیری تقویتی بر اساس آزمون و خطا، به تولید نرم‌افزاری به‌نام AlphaGo و همتای پیشرفته‌ترش AlphaGo Zero انجامید که هر دوی آن‌‌ها در سال 2016 به‌شکلی استادانه، قهرمانان بازی Go را له کردند.

ریسی کوندور، استاد علوم رایانه‌ای دانشگاه شیکاگو می‌گوید: «حالا ارتباط یکپارچه‌تری میان یادگیری ماشینی و علم برقرار است. یادگیری ماشینی صرفاً کار آزاردهنده‌ای نیست که مجبور باشید در کنار کارهای دیگر انجامش دهید. چون حجم زیادی از داده‌ روی هارد درایوتان دارید و در حال تبدیل شدن به جزء جدانشدنی فرآیند کشف علمی است.»

مثلاً دینامیک مولکولی، شبیه‌سازی رایانه‌ای خط سیر اتم‌ها و مولکول‌هاست تا بفهمیم که یک سیستم جاندار یا بی‌جان، تحت فشار چه رفتاری دارد یا اینکه مولکول‌های دارو چطور به گیرنده‌های خود می‌چسبند. در گذشته‌های دور، کارشناسان پیش‌بینی می‌کردند که طراحی مولکولی کاملاً خودکار شده و تولید دارو را سرعت خواهد بخشید.

وعده‌ شبکه‌های عصبی

بزرگترین تغییر جهت فعلی در یادگیری عمیق، عمق شبکه‌های عصبی است که از چند لایه به صدها لایه افزایش یافته است. عمق بیشتر به معنای ظرفیت بیشتر تشخیص الگوهاست که قدرت تشخیص اشیا و پردازش زبان طبیعی را تقویت می‌کند به طوری که مورد اولی از دومی انشعابات گسترده‌تری دارد.

اسمیت می‌گوید: «فرآیند ترجمه‌ کار سختی است و برنامه‌های فوق‌العاده‌ای برای این کار وجود دارد. امروزه شما از لحاظ وجود شبکه‌هایی که قادر به پیش‌بینی‌کردن زبان‌هایی باشند که هرگز پیش از این ندیده‌اند، از انعطاف‌پذیری بیشتری برخوردارید. اما قابلیت اجرای عمومی ترجمه با محدودیت مواجه است. ما مدتی این کار را انجام می‌دادیم و تأثیر چندانی در تغییر این بازی نداشت. داشتن بینش قوی، همان چیزی است که نوآوری عظیمی را به دنبال دارد. به‌عنوان مثال گذاشتن ردیاب روی یک ماشین تا بتواند محیطش را به‌درستی تشخیص دهد می‌تواند همه‌چیز را تغییر ‌دهد.»

چالش‌های یادگیری عمیق

مشکل‌‌ داده را چطور حل ‌‌کنیم؟

اسمیت می‌گوید وقتی پای یادگیری عمیق در میان است، «فیل درخشان در اتاق» را می‌توان معادل داده‌ها دانست. کیفیت آن‌ها به اندازه‌‌ کمیتشان اهمیت ندارد، چراکه مدل‌های یادگیری ماشینی و عمیق، به‌‌شدت در برابر داده‌های اشتباه مقاوم هستند.

وی می‌گوید که شما اساساً در حال ارائه‌‌ دانش هستید و برای انجام پردازش‌های پیچیده به نورون‌های بیشتر و ظرفیت بیشتری نیاز دارید؛ به داده‌هایی نیاز دارید که در دسترس عموم قرار ندارند.

این یعنی مدل‌های از پیش‌آموخته که توسط شخص دیگری ساخته شده و به‌‌صورت آنلاین دردسترس قرار گرفته‌اند، مجموعه‌داده‌های عمومی آن را کاهش نخواهد داد. در اینجاست که هیولاهای چندبیلیون دلاری یادگیری ماشینی مزیت منحصربه‌فردی دارند.

آینده‌‌ یادگیری عمیق

در عین‌‌حال که کوندور، اسمیت و دیگران پیشرفت یادگیری عمیق را تحسین می‌‌کنند اما نسبت به محدودیت‌‌های آن هم واقع‌‌بین هستند.

کوندور می‌‌گوید: «کارهایی که یادگیری عمیق در آن‌‌ها واقعاً قوی ظاهر شده، دقیقاً از نوعی هستند که دانشمندان علوم رایانه مدت‌‌هاست بر رویش کار کرده‌‌اند؛ چون به خوبی تعریف شده‌‌اند و منافع تجاری زیادی پشتشان است. پس این درست است که تشخیص اشیا، کاملاً با آنچه 12 سال قبل بود فرق می‌‌کند، اما مسئله همان تشخیص شیء است و از کارهای شناختی عمیق سطح بالا محسوب نمی‌‌شود.»

در یکی از مقالات وبسایت مدیوم که اخیرا با عنوان «عمیق‌‌ترین مسئله‌‌ یادگیری عمیق» منتشر شد، گری مارکوس، به مصاحبه‌‌ای با استاد علوم رایانه‌‌ای دانشگاه مونترال، یوشوا بِنجیو اشاره کرد؛ کسی که توصیه کرده «چالش‌‌های دشوار هوش مصنوعی را در نظر گرفته و به پیشرفت‌‌های کوتاه‌‌مدت تدریجی رضایت ندهید. نمی‌‌گویم که می‌خواهم یادگیری عمیق را فراموش کنم. برعکس، می‌‌خواهم آن را اساس قرار دهم. اما باید بتوانیم آن را برای انجام کارهایی مثل استدلال، یادگیری علیت و بررسی جهان برای فراگیری و کسب اطلاعات، توسعه دهیم.»

شاید یادگیری عمیق، همان‌‌طور که یان لوکان، مدیر تحقیقات هوش مصنوعی فیس‌‌بوک به مسئولین وبسایت VentureBeat می‌‌گوید، می‌‌بایست به نفع زبانی ساده‌‌تر و انعطاف‌‌پذیرتر، از خیر زبان کدگذاری محبوب اما گاهاً مشکل‌‌ساز پایتون بگذرد. لوکان اضافه کرد که شاید سخت‌‌افزار جدیدی لازم شود. در هر صورت، یک چیز روشن است، یادگیری عمیق یا باید تکامل پیدا کند یا محکوم به فناست. هرچند به گفته‌‌ مخاطبان این حوزه، دستیابی به اولی، از وقوع دومی جلوگیری نمی‌‌کند.

اسمیت می‌‌گوید که در این مقطع، حتی دختر سه ساله‌‌اش هم از پس یادگیری عمیق بر می‌‌آید. به‌‌عنوان مثال:

«اگر به او عکسی از یک فیل نشان دهم و بعداً تصویر متفاوتی از فیل را ببیند، فوراً می‌‌تواند تشخیص دهد که این یک فیل است چون از قبل شکلش را می‌‌داند و می‌‌تواند آن را در ذهنش مجسم کند. اما یادگیری عمیق نمی‌‌تواند این مسئله را حل کند، چون فاقد قابلیت یادگیری از روی چند نمونه‌‌ اندک است و ما هنوز به حجم انبوهی از داده‌های آموزشی وابسته‌‌ایم.»

او می‌‌گوید که از حالا به بعد، یادگیری عمیق صرفاً روشی مفید است که می‌‌توان آن را برای حل مسائل مختلف به کار برد. بدین ترتیب، از این نظر، انقراض آن قریب‌‌الوقوع نیست، اما امکان دارد.

منبع: زومیت

استارتاپس لند