چشم انداز آمازون برای الکسا نه تنها مفید بودن، بلکه بهبود چشمگیر زندگی میلیون ها نفر در سراسر جهان است. تیم الکسا تراست و الکسا هوش مصنوعی هر روز برای تحقق بخشیدن به این چشم انداز کار می کنند. برای کمک به گرامیداشت روز حفظ حریم خصوصی داده ها در ۲۸ ژانویه، با آن توث، مانوج سیندوانی و پرم ناتاراجان به گفتگو نشستیم تا در مورد نحوه محافظت آمازون از حریم خصوصی مشتری در حین استفاده مسئولانه از داده ها برای بهبود تجربه الکسا بحث کنیم.
توث: اول از همه، الکسا نمیتواند بدون جمعآوری و پردازش آن تعامل صوتی که واضح به نظر میرسد، به سؤالی پاسخ دهد، درست است؟ اما چیزی که درک و پاسخ دقیق را برای الکسا ممکن میسازد، یادگیری پیچیده و اصلاح مداوم است که باعث میشود الکسا در هر تعامل برای همه مشتریان ما بهتر و هوشمندتر شود. برای انجام این کار به داده نیاز است.
یک مثال خاص درک گفتار انسان است. گفتار پیچیده است و اساساً بر اساس منطقه، گویش، زمینه، محیط و فرد گوینده متفاوت است. این شامل عواملی مانند این است که آیا آنها یک زبان مادری هستند یا غیربومی و اینکه آیا آنها دارای اختلال گفتاری هستند.
آموزش الکسا با دادههای مشتری بسیار مهم است. زیرا برای اینکه الکسا خوب کار کند، مدلهای یادگیری ماشینی که الکسا را تقویت میکنند، باید با استفاده از طیف متنوع و گستردهای از دادههای مشتری در دنیای واقعی آموزش داده شوند. به این ترتیب میتوانیم اطمینان حاصل کنیم که خدمات برای همه و تحت هر نوع شرایط صوتی، در خانه یا در حال حرکت، به خوبی انجام میشود.
حالت چند زبانه مثال خوبی است از اینکه چگونه داده ها این امکان را برای الکسا فراهم می کند که برای خانواده های مختلف هم جامع و هم دقیق باشد. صدها هزار مشتری در سراسر ایالات متحده از حالت چند زبانه در دستگاه های الکسا خود استفاده می کنند تا به طور یکپارچه بین انگلیسی و زبان دیگری مانند اسپانیایی جابجا شوند.
سندوانی: داده ها چیزی است که الکسا را هوشمند می کند. آموزش مدلهای تشخیص گفتار با جدیدترین الگوهای داده به تیمهای ما امکان میدهد تجربه مفید، دقیق و حتی سرگرمکننده را ارائه دهند. آموزش با ضبط صدا به این دلیل است که الکسا می تواند تشخیص دهد که مشتری در مورد آب و هوا در “Austin” در مقابل “Boston” یا تفاوت بین “U2” و “YouTube” را می خواهد.
الکسا توانست تا به سرعت تمام روشهای متنوعی را که مشتریان نام او را تلفظ میکنند و درخواست پخش موسیقی را بیاموزد. آموزش الکسا با داده ها در طول زمان ، به آن کمک می کند تا به سؤالات مربوط به رویدادهایی که هر چند سال یک بار مانند بازی های المپیک یا جام جهانی رخ می دهند، پاسخ دقیق دهد.
قابل درک است که مشتریان تمایل دارند در طول بازیهای المپیک زمستانی بیشتر از الکسا درباره آن بپرسند و اگر الکسا بر اساس دادههای تاریخی آموزش دیده باشد، درک این سؤالات آسانتر است. به طور مشابه، آموزش سریع الکسا با ضبط صدا ، دقت در موضوعات پرطرفدار را که دانش تاریخی کمتری وجود دارد. مانند COVID-19 را تضمین میکند.
آموزش مداوم مدلهای یادگیری ماشین ما با دادههای مشتری دلیلی است که درک الکسا از درخواستهای مشتری به طور متوسط ۳۷ درصد در طول سه سال گذشته در همه زبانها بهبود یافته است.
توث: ما در مورد چگونگی حریم خصوصی در DNA الکسا صحبت می کنیم. دکمه «خاموش میکروفون»، شاتر دوربین فیزیکی و نشانگرهای نور و صوتی که مشتریان را هنگام پردازش درخواستی توسط الکسا مطلع میکنند، همگی کنترلهایی هستند که مشتریان میتوانند ببینند، بشنوند و لمس کنند. در حالی که این کنترل ها مهم هستند، ما معتقدیم که مشتریان باید بدون نیاز به برداشتن یک قدم اضافی، حریم خصوصی داشته باشند.
من در بیشتر دوران حرفه ای خود روی حریم خصوصی کار کرده ام. حریم خصوصی اغلب به عنوان یک محدودیت ارائه می شود و به نوعی اینطور است. داشتن محدودیت ها، قطعا خلاقیت را تحریک می کند، اما حریم خصوصی نیز به فرصتی برای خود اختراع تبدیل شده است. تیمهای علمی و گفتاری ما روی برنامههایی برای محافظت از حریم خصوصی و استفاده مسئولانه از دادهها سرمایهگذاری کردهاند که نیازی به اقدامی از سوی مشتری ندارد.
ناتاراجان: دستیارهای صوتی چالش های منحصر به فردی را برای حفظ حریم خصوصی ارائه می دهند. زیرا بخش هایی از تجربه وجود دارد که مشتریان نمی توانند ببینند یا بشنوند. وقتی دادههای مشتری را جمعآوری و استفاده میکنیم، آن را ایمن نگه میداریم و مسئولانه از آن استفاده میکنیم.
برای مثال، ما از روشهای حفظ حریم خصوصی برای محدود کردن مقدار و نوع دادههایی که در محیط مدلسازی درک زبان طبیعی خود استفاده میکنیم، هنگام آموزش مدلهای یادگیری ماشین خود استفاده میکنیم. پیشرفتهایی مانند هوش مصنوعی قابل آموزش و خودآموزی در حین پرواز، کاربران را قادر میسازد تا تجربیات خود را سفارشی کنند و بهبود عملکرد مداوم را ارائه دهند که نیازی به آموزش مجدد مدلها ندارد. آمازون همچنین به سرمایه گذاری در تکنیک های ناشناس سازی و تولید داده های مصنوعی برای محافظت بیشتر از حریم خصوصی مشتری ادامه می دهیم.
پیشنهاد مطالعه :Amazon Sidewalk Bridge Pro اتصال حرفه ای را ارائه می دهد.
سندوانی: دانشمندان و مهندسان ما روی تحقیق و تکنیکهای افزایش حریم خصوصی سرمایهگذاری میکنند تا تشخیص گفتار الکسا را بیشتر بهبود بخشند. مشابه کاری که پرم توضیح داد، ما همچنین در حال توسعه تکنیکهای جدیدی برای استفاده از دادههای مصنوعی هستیم.
دادههای آموزشی تولید شده توسط الگوریتمهایی که دنیای واقعی را تقلید میکنند، برای بهبود مدلهای تشخیص خودکار گفتار خود است و از طریق بهبود تکنیکهای حفظ حریم خصوصی، مانند یادگیری انتقالی، یادگیری فعال و بدون نظارت یا خودآموز، اقداماتی را انجام دادهایم تا حتی کمتر به تکنیکهای یادگیری نظارتشده تکیه کنیم. فناوری های خودآموز به طور کامل از تعاملات مشتری از طریق بازخورد ضمنی و صریح بدون نیاز به برچسب گذاری دستی یاد می گیرند.
شما حریم خصوصی را به عنوان فرصتی برای اختراع توصیف می کنید، آیا می توانید در مورد اینکه چگونه آن برای مشتریان جان می گیرد بیشتر به ما بگویید؟
توث: نوآوری های زیادی در مورد حریم خصوصی به خصوص در سازمان الکسا رخ می دهد. یکی از اصول اصلی حفظ حریم خصوصی این است که همیشه سعی کنیم به مشتریان ارزش بیشتری بدهیم در حالی که از داده های کمتری استفاده می کنند که به نظر من تفاوتی با روشی که علم به ما قدرت پردازش محاسباتی بیشتری با هزینه کمتر داده است، ندارد.
در دنیای حریم خصوصی، ما به این می گوییم حداقل سازی داده ها. برخی از نمونههای آن انتقال پردازش دادههای بیشتر مستقیماً به دستگاههای ما، جستجوی راههایی برای شناسایی زودتر دادهها، و ساخت و اصلاح مدلهای یادگیری ماشینی با حفظ حریم خصوصی است. این تیم در پشت صحنه کار می کند تا با سرمایه گذاری در تکنیک های کمینه سازی داده ها، مانند کاهش اتکا به یادگیری تحت نظارت، کارهای بیشتری را با کمترین داده ها انجام دهد.
پیشنهادهایی برای شما
دسته بندی مورد نظر را انتخاب کنید
دیدگاهتان را بنویسید