فناوری جدید گوگل؛ تشخیص زبان بدن افراد بدون نیاز به دوربین
تیم تحقیقاتی شرکت گوگل در حال کار روی فناوریای است که به کامپیوترها اجازه میدهد تا با کمک رادار به اطراف و حرکات اشخاص پاسخ دهند. تصور کنید کامپیوتر شما تصمیم بگیرد دریافت یک پیام را با صدا اعلام نکند؛ چون میداند که در آن لحظه پشت میزتان ننشستهاید یا فرض کنید وقتی برای جوابدادن به صدای در از جای خود بلند شدید و در همین حین تلویزیونتان بهطور خودکار نمایش فیلم از نتفلیکس یا شبکهای دیگر را متوقف کند و وقتی به کاناپهی خود برگشتید، فیلم دوباره شروع به پخش شود. آیندهای را تصور کنید که در آن کامپیوترها رفتارهای اجتماعی انسان را درک میکنند و به همراهان باملاحظهتری برای ما تبدیل میشوند.
تصور کامپیوتری که تکتک حرکات فرد را زیرنظر دارد، شاید کمی ناخوشایند و شبیه سناریو فیلمهای علمیتخیلی بهنظر برسد؛ اما وقتی بدانید که کامپیوترها برای تشخیص مکان و حرکتهای افراد از هیچ دوربینی استفاده نمیکنند، شاید کمی از نگرانیهایتان کاسته شود و این حس ناخوشایند یا گارد اولیه اندکی تعدیل شود.
درواقع، گوگل تصمیم دارد بهجای دوربین از رادار برای دنبالکردن حرکت کاربران استفاده کند. بخش محصولات و فناوریهای پیشرفتهی گوگل که بهاختصار ایتپ (ATAP) هم نامیده میشود و پیشازاین روی پروژههای عجیبوغریبی مانند کت جین حساس به لمس کار کرده است، در چند سال گذشته توجه خود را به موضوع دیگری معطوف کرده است.
مهندسان ایتپ امیدوارند با استفاده از رادارها سیستمی را توسعه دهند که در آن کامپیوترها با تشخیص رفتارها و گمانهزنی دربارهی نیازهای کاربران، بهدرستی به آنها واکنش نشان دهند. البته این اولینبار نیست که گوگل به استفاده از رادار برای آگاهیبخشی به محصولات خود روی آورده است. در سال ۲۰۱۵، گوگل سولی را رونمایی کرد. سولی سنسوری است که از امواج الکترومغناطیس راداری برای تشخیص دقیق حالات و حرکات بدن انسان استفاده میکند. از این سیستم اولینبار در گوشی پیکسل ۴ گوگل برای تشخیص حرکات ساده دست استفاده شد.
کاربران پیکسل ۴ با حرکات دست خود و بدون لمس فیزیکی گوشی میتوانستند از دستورها سادهای مانند توقف پخش موسیقی یا بهتعویقانداختن آلارم استفاده کنند. اخیراً نیز گوگل از حسگرهای راداری در نسل دوم نمایشگر هوشمند خود به نام نستهاب برای تشخیص حرکات و ریتم تنفس افراد خوابیده درکنار نمایشگر استفاده کرده است. این وسیله برعکس گجتهایی مانند ساعتهای هوشمند بدون نیاز به تماس فیزیکی میتواند حرکات افراد در خواب را زیرنظر بگیرد.
این گیف نمایی از نزدیکشدن انسان به فضای پیرامون کامپیوتر و عملکرد رادار را نشان میدهد. با نزدیکشدن فرد به کامپیوتر، دادههای مربوط به مسافت و سایر متغیرها روی نمایشگر دستخوش تغییر میشوند.
تیم ایتپ در پروژهی جدید خود نیز از حسگرهای سولی بهره گرفته است؛ اما بهجای استفاده از ورودیهای سنسور برای کنترل مستقیم کامپیوتر، مهندسان ایتپ قصد دارند از دادههای بهدستآمده از سنسورها برای تشخیص حرکات روزمرهی افراد و در جهت کمک به تصمیمگیری کامپیوترها استفاده کنند.
لئوناردو جیوستی، مسئول ارشد بخش طراحی ایتپ میگوید:
معتقدیم همزمان با حضور گستردهتر تکنولوژی در زندگی روزمرهی انسانها، منصفانه است از خودِ تکنولوژی بخواهیم از برخی از حرکات ما به سرنخهایی دست پیدا کند.
فرض کنید قصد دارید خانه را ترک کنید و مادرتان به شما یادآوری کند که با خود چتر بردارید؛ چون باتوجهبه وضعیت هوا، ممکن است باران ببارد. بهکمک این فناوری ممکن است ترموستات منزلتان هنگامی که از جلو آن رد میشوید، همین پیام را بهنمایش بگذارد یا بهعنوان مثالی دیگر، وقتی تلویزیون متوجه شود که روی کاناپه بهخواب رفتهاید، بلندی صدا را بهطور خودکار کم کند.
تحقیقات راداری
بهگفتهی جیوستی، قسمت اعظم تحقیقات آنها بر حیطهشناسی استوار شده است. حیطهشناسی علمی است که نحوهی استفادهی انسانها از فضای اطراف آنها را بهعنوان بستری برای تعاملات اجتماعی بررسی میکند. وقتی به شخص دیگری نزدیک میشوید، انتظار دارید صمیمت و تعامل شما با آن شخص بیشتر شود. تیم تحقیقاتی ایتپ از این رفتار و دیگر اشارهها و انتظارات اجتماعی برای پایهگذاری نحوهی تعامل انسان با دستگاهها و تعریف فضای خصوصی بین آنها استفاده کردهاند.
رادارها میتوانند تشخیص دهند که یک شخص چه زمانی به آنها نزدیک و وارد فضای خصوصیشان میشوند. داشتن قابلیتی اینچنینی بدینمعنا است که کامپیوتر در موقعیتهای مناسب میتواند کارهای مشخصی را انجام دهد. برای نمونه، هنگام نزدیکشدن کاربر نمایشگر را از حالت خواب بیدار کند، بدون اینکه نیاز باشد کاربرد دکمهای فیزیکی را فشار دهد.
درحالحاضر، گوگل از این فناوری تعاملی در نمایشگرهای هوشمند خود بهره میبرد؛ اما گوگلنست برای تعامل با کاربران بهجای رادار از امواج فراصوت یا اولتراسونیک برای محاسبهی فاصلهی شخص از نمایشگر استفاده میکند. وقتی نستهاب متوجه نزدیکشدن کاربر میشود، روی نمایشگر خود اعلانهای مهم مانند رویدادهای تقویم و یادآوریها و دیگر نوتیفیکیشنها را بهنمایش درمیآورد.
بااینهمه، تشخیص فاصله از دستگاه بهتنهایی کافی نیست؛ زیرا ممکن است شخص در آن لحظه فقط در حال عبور از کنار دستگاه بوده باشد یا شاید او در حال نگاهکردن بهسمت دیگری باشد و اصلاً در آن هنگام قصد نداشته باشد با کامپیوترش تعامل کند. برای حل این مسئله، سنسور سولی میتواند برخی ظرافتهای پیچیده در حرکات و ژستها مانند جهتگیری بدن و مسیر حرکت احتمالی افراد و جهت چهرهی شخص را ارزیابی کند.
همچنین، سنسور سولی بهمنظور ارزیابی و تشخیص این ظرافتها میتواند از الگوریتمهای یادگیری ماشین برای پالایش و غربالگری دادهها استفاده کند. اطلاعات باارزش بهدستآمده از رادارها به سنسور سولی کمک میکند تا با دقت بیشتری منظور کاربران را پیشبینی کند: اینکه آیا واقعا کاربر قصد دارد تعامل با کامپیوتر را شروع کند یا نه و اگر جواب مثبت باشد، بهترین نحوهی تعامل با آن احتمالاً چگونه خواهد بود.
اعضای تیم ایتپ برای بهبود عملکرد سنسورها شماری از حرکات و ژستها و ضبط این حرکات را با دوربین در اتاق نشیمن منزل خود انجام دادند (در طول دوران همهگیری همهی آنها مجبور بودند در منزل بمانند). این در حالی بود که حسگرهای راداری همزمان به تحلیل حرکت آنها مشغول بودند. لورن بدال، طراح ارشد بخش تعاملی ایتپ، دراینباره توضیح میدهد:
ما در جهتهای مختلف حرکت میکردیم و مجموعهای از حرکات را انجام می دادیم و باتوجهبه اینکه سیستمها بهطور لحظهای حرکتها را ثبت و ارزیابی میکردند، میتوانستیم دادههای بهدستآمده از دوربین و سنسورها را باهم مقایسه و قدمهای بعدی برای افزایش دقت حسگرهای راداری را طراحی کنیم.
لورن بدال سابقهی فعالیت در عرصهی حرکات رقص حرفهای را هم دارد. وی میگوید این فرایند بسیار شبیه به کار طراحان رقص در توسعهی ایدهی یک حرکت ساده و تبدیل آن به مجموعهای از حرکات مختلف ازطریق تغییر وضعیت و جهتگیری بدن است. برپایهی این مطالعات، تیم تحقیقاتی ایتپ شماری از حرکات مشخص را تعریف کردند؛ حرکاتی که از تعاملات غیرکلامی انسانها با تجهیزات فیزیکی الهام گرفتهاند؛ مانند نزدیکشدن به یک وسیله یا دورشدن از آن، گذشتن از کنار آن، چرخاندن سر بهسمت وسیله یا بهسمت دیگر و نگاهانداختن به آن وسیله.
بدال برخی از نمونههای تعامل کامپیوتر با انسان ازطریق تشخیص حرکات را توضیح میدهد. اگر یک دستگاه احساس کند که کاربر در حال نزدیکشدن به آن است، میتواند ابزار کنترل لمسی را فعال کند یا اگر شخص بهسمت وسیله حرکت کند، نمایشگر آن روشن میشود و اعلانهای مهم را بهنمایش میگذارد یا درصورتیکه کاربر اتاق را ترک کند، تلویزیون میتواند برنامه را در همان لحظه متوقف کند و بعد از برگشتن شخص به اتاق، برنامه را از همان لحظهی توقف شروع به پخش کند.
اگر وسیلهای تشخیص دهد که شخص در حال عبور از کنار آن است، با نمایش نوتیفیکیشنهای غیرمهم مزاحمتی برای او ایجاد نخواهد کرد. اگر کاربر در آشپزخانه مشغول تماشای ویدئو دستورپخت غذا است و وقتی بهسراغ کابینت میرود تا ادویه بردارد، پخش ویدئو بهصورت خودکار قطع میشود تا وقتی که او به مکان خود برگردد و قصد خود برای ادامهی تماشای ویدئو را نشان دهد.
زمانی که کاربر مشغول مکالمه با تلفنهمراه خود است و یک لحظه به نمایشگر هوشمند نگاه میاندازد، نمایشگر میتواند گزینهی انتقال تماس تصویری را نمایش دهد تا کاربر بتواند مکالمه را بهصورت تصویری با نمایشگر ادامه دهد. بدال دراینباره توضیح میدهد:
تمام این حرکات انگشتها را بهسمت آیندهای نشان گرفتهاند که در آن کامپیوترها بهطرز نامرئی حرکتهای طبیعی ما را ارزیابی میکند. ایدهی اصلی ما این است که کامپیوترها بهنوعی فقط در پسزمینه کار کنند و فقط در موقعیتهای مناسب به کمک ما بیایند. ما در حال جابهجایی مرزها و کشف تمام روشهای ممکن برای تعامل انسان با کامپیوتر هستیم.
نزدیکی بیشتر کامپیوتر به انسان
استفاده از رادار برای تأثیرگذاری بر نحوهی عکسالعمل کامپیوترها به حرکات انسانی مشکلات خاص خود را بههمراه دارد. برای مثال، رادارها میتوانند اشخاص متعددی را در یک محیط تشخیص دهند. اگر این افراد خیلی به یکدیگر نزدیک باشند، رادار آنها را بهشکل تودهای بیشکل میبیند؛ مشکلی که میتواند در توانایی تصمیمگیری دستگاهها اختلال ایجاد کند.
باتوجهبه مشکلات فراروی نسل جدید حسگرهای راداری، بدال چندین مرتبه به این موضوع تأکید میکند که فناوری اخیر هنوز در فاز مطالعاتی قرار دارد و قرار نیست در نسل بعدی نمایشگرهای هوشمند گوگل از این فناوری استفاده شود.
یکی از مزایای استفاده از حسگرهای راداری این است که دستگاههای مجهز به رادار در طول زمان میتوانند الگوی حرکتی رفتار افراد را یاد بگیرند. طبق گفتهی لئوناردو جیوستی، این توانایی یکی از اهداف مهم نقشهی راه ایتپ است که میتواند به درپیشگرفتن عادتهای رفتاری جدید و سالم کاربران کمک کند. فرض کنید که در نیمهی شب بهسراغ کابینت میانوعدههای آشپزخانه خانهتان بروید؛ اما بهیکباره نمایشگر هوشمند شما در آشپزخانه روشن شود و علامت بزرگ توقف را نشان دهد.
وقتی از پیشبینی رفتار کاربران و انجام عملیاتهای پیشدستانه صحبت میشود، وسیلههای هوشمند و کامپیوترها باید حد تعادل نسبی را رعایت کنند. برای مثال، شاید شخصی دوست داشته باشد هنگام آشپزی تلویزیون را روشن کند، بدون اینکه قصد تماشای آن را داشته باشد. این مثال احتمالاً برای بیشتر ما پیش آمده است. در این وضعیت و مثالهای مشابه دیگر، رادارها نمیتوانند حضور شخص را در اتاق نشیمن تشخیص دهند و تلویزیون بهجای ادامهی پخش برنامه، آن را متوقف خواهد کرد.
بدال دربارهی چنین وضعیتهایی اینگونه توضیح میدهد:
وقتی دربارهی الگوهای رفتاری مطالعه میکنیم، رفتارهایی که بسیار نامرئی و تفکیکنشدنی و سیال هستند، باید تعادل مناسبی را بین اتوماسیون و دخالت کاربر در کنترل دستگاه ایجاد کنیم. وقتی از تعامل انسان با دستگاه در چنین وضعیتهایی سخن بهمیان میآید، این تعامل باید بدوندردسر و به همان روانی و سیالی الگوهای رفتاری باشد تا کاربر از دخالت بیجای دستگاه احساس رنجش و خستگی نکند. بنابراین، برای مواقعی که کاربر انتظار دارد اختیار بیشتری در کنترل دستگاه داشته باشد، باید از دسترسی او به تعدادی از سطوح کنترلی و تنظیمات دستی مطمئن شویم.
یکی از دلایل تیم ایتپ برای انتخاب فناوری رادار به ماهیت آن در حمایت از حفظ حریمخصوصی برمیگردد. رادارها با اینکه دادههای باارزشی از موقعیت و حرکات افراد را جمعآوری میکنند، در بحث حریم خصوصی یکی از فناوریهای مطمئن هستند. همچنین، رادارها دورهی تأخیر کمی دارند و در تاریکی کار میکنند و عوامل خارجی مانند صدا و دما روی عملکرد آنها تأثیر نمیگذارد.
برخلاف دوربین، رادارها نمیتوانند تصاویر واضحی از بدن و صورت و هرچیز شناساییشدنی دیگری را جمعآوری یا ذخیره کنند. جیوستی دراینباره توضیح میدهد: «رادار بیشتر شبیه به سنسور حرکتی پیشرفته است.»
محدودهی شناسایی سنسور سولی در حدود ۳ متر است؛ بنابراین، درمقایسهبا اکثر دوربینها محدودهی فعالیت کمی دارد. بااینحال، استفاده از چندین وسیلهی مجهز به سنسور سولی میتواند مانند یک شبکهی هماهنگ و مؤثر تمام فضای خانهی را بهمنظور شناسایی حرکات و موقعیت افراد پوشش دهد.
اشاره به این نکته نیز ضروری بهنظر میرسد که سنسور سولی که از آن در نمایشگر هوشمند نستهاب گوگل استفاده شده است، از قابلیت پردازش محلی بهره میبرد و دادههای خام هیچگاه به فضای ابری فرستاده نمیشوند.
کریس هریسون، محقق حوزهی تعامل انسان با کامپیوتر در دانشگاه کارنگی ملون در ایالت پیتسبورگ و مدیر گروه تحقیقاتی فیوچر اینترفیس، معتقد است کاربران دیر یا زود باید انتخاب کنند که آیا خرید محصولات گوگل به ریسک افشای اطلاعات خصوصی آنها میارزد یا نه؛ چون هرچه باشد، طبق گفتهی هریسون، هیچکس در جهان درزمینهی کسب درآمد از راه اطلاعات مشتریانش به پای شرکت گوگل نمیرسد.
بااینحال هریسون معتقد است استفادهنکردن از دوربین در محصولات گوگل نشانگر رویکرد حمایت از حریم خصوصی و اولویتدهی به ارزشهای کاربران است. او اضافه میکند:
چیزی بهعنوان ناقض حریم خصوصی یا مدافع حریم خصوصی وجود ندارد. همهچیز را باید بهصورت یک طیف در نظر گرفت که نقض یا حمایت از حریم خصوصی دو در سر آن قرار گرفتهاند و هر محصول دیجیتالی در جایی بین این دو قرار میگیرد.
همچنان که وسایل زندگی روزمره بهشکل اجتنابناپذیری به حسگرهای بیشتری مجهز میشوند، توانایی این تجهیزات در درک رفتار انسانها بیشتر میشود. هریسون معتقد است در آینده تعامل انسان با کامپیوترها در تمام جنبههای تکنولوژی بههمان شکلی خواهد بود که محققان تیم ایتپ بهدنبال آن هستند. هریسون میافزاید:
اساساً انسانها برای درک رفتارهای انسانی برنامهریزی شدهاند و اگر زمانی کامپیوترها موفق شوند این تعامل غیرکلامی را بهطور کامل رمزگشایی کنند، موقعیتهای کاملاً آزاردهندهای برای انسانها پیش آید. دخالتدادن دانشمندان علوم اجتماعی و رفتاری در تحقیقات کامپیوتری میتواند چنین تجربیاتی را خوشایندتر کند و وجهه انسانی به آنها ببخشد.