هوش مصنوعی در حال دگرگون کردن ماهیت حوزه نرمافزار است
کریستوفر ری میگوید شیوهی برخی محققانِ حوزهی هوش مصنوعی، به اندازهی فیلمهای مایکل بِی بیرمق است. براساس گزارش ZDNet، ری که دانشیار علوم کامپیوتر در دانشگاه استنفورد است، هنگام سخنرانی در مؤسسهی هوش مصنوعیِ انسانمحورِ دانشگاه، این اظهارات را بیان داشت. موضوع سخنرانی ری این بود: اتفاقهای عجیب جدیدی در [حوزهی] نرمافزار درحال رخ دادن است.
از نظر ری، اتفاق عجیب جدید این است که موارد مهم در چندین سال گذشته، اکنون با پیدایش چالشهای جدید نسبتا بیاهمیت شدهاند. او میگوید وسواس روی مدلها، یعنی معماریهای خاص شبکههای عصبی که برنامهی یادگیری ماشینی را شکل میدهند، روند طبیعی خود را طی کرده است. ری با مثال برجستهی مدل یادگیری عمیق ترنسفرمر گوگل، حکمرانی مدلها در جهان در سال ۲۰۱۷ را یادآوری کرد. او با طعنه گفت:
ترنسفرمری بسیار مهمتر از فیلم سال گذشتهی مایکل بِی [Transformers: The Last Knight].
ری اظهار کرد که بااینحال، پس از سالها کار روی ترنسفرمر و ساخت الگوریتمهایی چون BERT گوگل و GPT آزمایشگاه تحقیقاتی OpenAI، مدلها تبدیل به کالا شدهاند و بهراحتی میتوان همه مدلها را نصب کرد. کافی است یکی از آنها را انتخاب کنید.
آنچه ری «مدل جدید itis» مینامد، یعنی وسواس محققان برای دستکاری تمامی ریزهکاری معماریها، تنها یکی از کارهای بیفایدهی مهندسان است که ری آن را اتلاف وقت میداند. او میگوید دستکاری ابرپارامترهای مدلها، اتلاف دیگری در وقت است. ابرپارامترها، پارامترهایی هستند که مقادیر آنها برای کنترل روند یادگیری استفاده میشود. ری به حضار گفت:
برای بیشتر افرادی که در [حوزهی] یادگیری ماشین کار میکنند، حتی در شرکتهای بزرگ جایی وجود ندارد که برای نوآوری در مدلها، وقتشان را آنجا سپری کنند. آنها وقتشان را جایی صرف میکنند که برایشان مهم است؛ البته من تصور میکنم روی موارد دیگری نیز کار میکنند که برای هوش مصنوعی و جنبههای استدلال هوش مصنوعی واقعا جذاب است.
ری معتقد است آنجایی که مردم وقتشان را با روشی ارزشمند سپری میکنند، روی بهاصطلاح «دُمِ درازتوزیع» است؛ جزئیاتی بینقص که حتی مدلهای بزرگ و قدرتمند را گیج میکند. در بحث آمار، دم دراز توزیع، بخشی از توزیع است که بیشتر رخدادها دور از قسمت سر یا بخش مرکزی آن قرار دارند. او دربارهی مدل ترنسفورمر گفت:
شما این ابرمدلها را دیدهاید که بسیار خارقالعاده و قادر به انجام طیف وسیعی از وظایف تأثیرگذار هستند. اگر وب را بههم بریزید و موضوعی را صد بار مشاهده کنید، باید قادر باشید چیزی تشخیص بدهید. بااینحال، بخشی که این مدلها هنوز در آن ناموفق هستند و همچنین به نظر من جالبترین کارها در آنجا جریان دارد، بخشی است که من به آن دم [توزیع] میگویم؛ ریزهکاریها.
میدان نبرد همانگونه که ری اشاره میکند، تعاملات ظریف و ابهامزداییهای دقیق از اصطلاحات است که به پیشنهاد ری، میتوان آن را جنبه و استدلال ریزهکاری نامید. ری گفت این تغییر در اهمیت، در یک بیان کلی تغییری در نرمافزار است. او به آندره کارپاتی، دانشمند هوش مصنوعیِ تسلا اشاره کرد که گفته بود هوش مصنوعی نسخهی دوم نرمافزار (Software 2.0) است. در حقیقت عنوان سخنرانی ری این بود: «یادگیری ماشین در حال تغییر نرمافزار است.»
ری با مقامات دنیای واقعی از میراث علمی خود سخن گفت. او چهار استارتاپ تأسیس کرده و دو شرکت از آنها با نامهای Lattice و Inductiv را به اپل فروخته است. همچنین او همبنیانگذار یکی از شرکتهای کامپیوتری شگفتانگیز در زمینهی هوش مصنوعی،یعنی SambaNova Systems و یکی از دریافتکنندگان بورسیهی نهاد مکآرتور است. به گفتهی ری، Software 2.0 برای کنترل ظرافتهایی که او بیان کرد، در حال استقرار مسیری جهت تبدیل هوش مصنوعی به یک رشتهی مهندسی است. از نظر این پروفسور، رشتهی مذکور جایی برای رویکرد سیستمی جدید و متفاوت از سیستمهای نرمافزاری است که پیشتر ایجاد شده بود. همچنین در آن به حالتهای شکست هوش مصنوعی، بهگونهای متفاوت از چگونگی شکست نرمافزار بهصورت سنتی توجه میشود.
ری گفت این رشته، جایی است که در آن، در نهایت مهندسان به جای دستکاری ابرپارامترها، روی موارد باارزشتری کار میکنند. مثال عملی ری، سیستمی با نام اُورتون (Overton) بود که آن را هنگام حضور در اپل ساخت. اورتون به کاربر اجازه میدهد تا اشکالی از سوابق داده و وظایفی همچون جستوجو که روی آنها اعمال میشوند، در سطحی بالا و بهصورت قابل بیان تعیین کند.
اورتون آنگونه که ری شرح میدهد، نوعی روند کار نقطهبهنقطه برای یادگیری عمیق است. این سیستم دادهها را از قبل آماده، مدلی برای شبکهی عصبی انتخاب، پارامترهای خودش را اصلاح و برنامه را پیاده میکند. ری گفت که مهندسان در سیستم مذکور، وقتشان را صرف نظارت بر کیفیت و بهبود برنگری میکنند. در اورتون به جای ساختارهای داده، تأکید روی درک انسانی است. اورتون و سیستم دیگری با نام Ludwig که پیِرو مالینو، دانشمند اوبر در حوزهی یادگیری ماشین آن را توسعه داده است، نمونهای از سیستمهایی هستند که یادگیری عمیق «کد صفر» نامیده میشوند. ری گفت:
در اینجا [سیستم اورتون]، به نکتهی کلیدی نیازی نیست. [در این سیستم] هیچ اشارهای به مدلها، پارامترها و کدهای سنتی وجود ندارد.
سیستم نرمافزاری کریستوفر ری در اپل که به کاربر اجازه میدهد تا اشکالی از سوابق داده و وظایفی همچون جستوجو که روی آنها اعمال میشوند را در سطحی بالا و بهصورت قابل بیان تعیین کند.
ری خاطرنشان میکند که در رویکرد Software 2.0، هوش مصنوعی در محیطهای واقعی استفاده شده است. اورتون در ساخت دستیار سیری اپل و نرمافزار ساختِ ری و همکارش، استفان باخ، با نام Snorkel DryBell در فناوری تبلیغات گوگل نقش داشته است. درحقیقت بستر اسنورکل (Snorkel) به استارتاپی موفق تبدیل شده است که الکساندر راتنر، توسعهدهندهی ارشد اسنورکل آن را اداره میکند. راتنر تحت نظر ری، دانشجوی تحصیلات تکمیلی دانشگاه استنفورد بود. ری دربارهی اسنورکل گفت بسیاری از شرکتها از آن استفاده میکنند. آنها با چراغ خاموش در حال پیشرفت هستند. به گفتهی ری، در نتیجهی گسترش Software 2.0، برخی تیمها در حوزهی یادگیری ماشین در واقع هیچ مهندسی ندارند که در بسترهای پایینردهای همچون TensorFlow و Pytorch کار کند. او ادامه داد:
[سرعت] تبدیل ایدههای عجیب و آزمایشگاهی تنها در سه یا چهار سال گذشته به مواردی که میتوان واقعا از آنها استفاده کرد، برای من حیرتآور بوده است.
ری در این کنفرانس به پروژههای تحقیقاتی دیگر در خط مقدم ادراک مسئلهی دم توزیع اشاره کرد. یکی از آنها Bootleg است که ری و سیمران آرورا و سایر محققان دانشگاه استفورد آن را توسعه دادهاند. این سیستم باعث پیشرفت چیزی میشود که «ابهامزدایی موجودیت» نام دارد. برای پرسشهایی همچون «قد لینکلن چقدر است؟»، دانستن اینکه لینکلن، شانزدهمین رئیسجمهور ایالات متحده است نه برند اتومبیل، یکی از مسائل دم دراز توزیع است.
مقالههای مرتبط:
نمونهی تحقیقاتی دیگر با ادراک قدرتمند، سیستمی با نام جورج (George) بود که ری با محققان استفورد از جمله نمیت سوهونی و سایر همکارانش در سال ۲۰۱۷ معرفی کرد. سیستمهای طبقهبندیکنندهی مبتنی بر هوش مصنوعی معمولا مواردی را از دست میدهند که ردیزه نام دارند. ردیزهها آثاری مهم برای ردهبندی هستند؛ اما در دادههای آموزشی برچسبگذاری نشدهاند. سیستم جورج برای استخراج ردیزهها از تکنیکی با نام کاهش بُعد استفاده میکند و سپس با اطلاعات ردیزهها، شبکهی عصبی جدید را آموزش میدهد. ری گفت چنین عملکردی، در کاربریهای عملی همچون تشخیص پزشکی که ممکن است با از دست رفتن ردیزهها، طبقهبندی بیماری متشبه شود، کاربردهای وسیعی دارد.
پروفسور ری خاطرنشان کرد که سیستمی همچون جورج، تنها نمونهای اولیه از پروژهای است که امکان ساخت آن وجود دارد. او گفت کارهای بسیار بیشتری میتوان انجام داد. رویهی Software 2، سبب افزایش مشارکت فعالانهی افراد در حوزهی هوش مصنوعی میشود. ری ادامه داد:
این رویه، متمرکز روی انسانها و دربارهی موانع غیر ضروری است؛ یعنی جاهایی که مردم در حوزهی ویژهای تخصص دارند ولی جهت آموزش دستگاه در این حوزه با مانع روبهبهرو هستند. ما میخواهیم تمامی این موانع را بهگونهای برطرف کنیم که افراد تا حد امکان، روی خلاقیت خودشان متمرکز شوند و همهی مواردی که میتوانند خودکار شوند، خودکار کنیم.