ساخت رباتی که هات‌داگ می‌پزد و سرو می‌کند

آماده‌کردن هات‌داگ را درنظر بگیرید. درحالی‌که ممکن است برای انسان‌ها بسیار ساده به‌نظر برسد، آموزش ربات برای آماده‌ و سِروکردن هات‌داگ کار ساده‌ای نیست. این ربات باید بتواند هات‌داگ را بگیرد و آن را روی دستگاه کباب‌کن قرار دهد و به آن اجازه دهد مدت زمان مناسبی بپزد. سپس هات‌داگ را در نان بگذارد و چاشنی به آن اضافه کند و به‌آرامی تحویل دهد.

پژوهشگران دانشگاه بوستون اخیرا موفق شده‌اند رباتی را آموزش دهند تا این کار را انجام دهد. این پژوهشگران با استفاده از سیستم آزمایش و خطایی که «یادگیری تقویتی» نامیده می‌شود، توانستند نوعی هوش مصنوعی توسعه دهند که بتواند یاد بگیرد و از دانش پیشین برای انجام بهتر وظیفه‌ی خود استفاده کند. این سیستم هوش مصنوعی برای به کار واداشتن دو بازوی رباتیک استفاده شد. قبل از اینکه سیستم مذکور روی بازوها به‌کار برده شود، در شبیه‌سازی‌های کامپیوتری آزموده شد.

اگر ربات نان همبرگر را بیش‌از‌حد فشار دهد و لِه کند، از اشتباه خود درس می‌گیرد و از آن به‌بعد، دیگر آن اشتباه را تکرار نمی‌کند. این تقریبا همان چیزی است که ما در زندگی هنگام تجربه‌ی موضوعات جدید یاد می‌گیریم. به این شیوه ربات خودآگاه شد. او باید یاد می‌گرفت چه کاری باید انجام شود و چگونه می‌توان آن کار را انجام داد و از انجام اشتباهات تکراری حین انجام وظایف خودداری کرد.

ربات

پژوهشگران زبان ساده‌ای را توسعه دادند که به آن‌ها کمک می‌کرد هر بخش از وظیفه را به وظایف کوچک‌تری تجزیه کند. آن‌ها می‌توانند جملاتی مانند «کباب‌پز را روشن کن» و «سوسیس را بردار» و «آن را روی کباب‌پز بگذار» را برای آغاز وظیفه تعریف کنند. زکری سرلین، یکی از پژوهشگران این پروژه، می‌گوید تا وقتی از اطلاعات از پیش تعریف‌شده استفاده کنید، الگوریتم می‌فهمد چه کاری انجام دهد. سرلین می‌گوید:

باید از قبل چیزهایی را تعریف کنید. تا موقعی که بدانم وقتی می‌گویید «کباب‌پز» منظور شما چیست، می‌توانم یاد بگیرم هر کاری را انجام دهم که در آن از این کلمه استفاده شده است.

گنجاندن دانش پیشین در الگوریتم موجب می‌شود تلاش هوش مصنوعی برای رسیدن به اهدافش محدود شود. به‌جای اینکه اجازه دهید او ضمن تلاش برای انجام وظیفه هر کاری می‌خواهد انجام دهد، محدودیت‌هایی درزمینه‌ی کارهایی تعیین کنید که او حین تلاش برای پختن انجام می‌دهد. سرلین می‌گوید پژوهشگران دیگری که پیش از این برای توسعه‌ی هوش مصنوعی از یادگیری تقویتی استفاده کرده‌اند، همیشه چنین کاری انجام نداده‌اند. او توضیح می‌دهد:

در سیستم ما، ساختاری متشکل از جملات وجود دارد که می‌توانید در آن‌ها کلمات دیگری قرار دهید؛ مانند «نمی‌توانید دو چیز را باهم بلند کنید». این همان دانش پیشینی است که شما دارید.

ربات جدید نه‌تنها یاد می‌گیرد چگونه هات‌داگ را آماده و سرو کند؛ بلکه مطمئن می‌شود دچار اشتباهات خطرناک نشده است. این میزان امنیت که در سیستم گنجانده شده است، توابع مانع کنترل (Control Barrier Functions) نامیده می‌شود.

سرلین می‌گوید اجازه می‌دهید الگوریتم با دانش قبلی و جملاتی اجرا شود که به آن داده‌اید. لایه‌ای نیز وجود دارد که به آن اجازه نمی‌دهد کارهای خطرناک انجام دهد. این امر موجب می‌شود حتی بدون تلاش، چنین سطحی از امنیت وجود داشته باشد. به‌جای اینکه بازوی رباتیک تلاش کند هات‌داگ را از روی کباب‌پز دارد و حین این کار به‌طور تصادفی چنگک‌هایش در کباب‌پز گیر کند، این لایه‌ی ایمنی تضمین می‌کند ربات بداند تنها زمانی‌که می‌خواهد این بخش از وظیفه‌ی خود را کامل کند، می‌تواند به کباپ‌پز خیلی نزدیک شود. سرلین می‌گوید گروه او می‌کوشند بیشتر روی این فناوری کار کنند و ببینند چگونه می‌توان در آینده ربات را آموزش داد تا وظایف پیچیده‌تری انجام دهد.

فیسبوک توییتر گوگل + لینکداین تلگرام واتس اپ کلوب

دیدگاهتان را بنویسید