در حال حاضر از فناوری شبیه سازی صدا با هوش مصنوعی در پادکست ها و بازی های ویدیویی استفاده می شود. این فناوری جذاب احتمالا خیلی زودتر از آنچه فکر می کنید در دسترس عموم قرار خواهد گرفت. سامسونگ امروز قابلیت جدیدی را به دستیار صوتی بیکسبی خود اضافه کرد که به کاربران امکان می دهد برای پاسخ به تماس های تلفنی صدای خود را تقلید کنند. ایده این است که اگر کسی با شما تماس می گیرد و شما نمی توانید با صدای بلند پاسخ دهید، با تایپ متن مورد نظر و صدای شبیه سازی شده خود با طرف مقابل صحبت کنید.
بر اساس گزارش The Verge، ویژگی جدید شبیهسازی صدای دستیار دیجیتال سامسونگ Bixby در حال حاضر تنها به زبان کرهای و برای تعداد محدودی از کاربران گلکسی S23، Galaxy S23 Plus و Galaxy S23 Ultra در دسترس است. استفاده از یک سیستم شبیه سازی صوتی مبتنی بر هوش مصنوعی برای پاسخگویی به تماس های صوتی ایده جذابی به نظر می رسد. چرا که تکنولوژی امروز به حدی پیشرفت کرده است که می توان صدای هر شخصی را تنها در چند دقیقه با کیفیتی عالی شبیه سازی کرد، درست مانند برخی فیلم های اکشن.
پاسخگویی به تماسهای صوتی از طریق رابط کاربری مبتنی بر متن یک ویژگی کاملاً جدید نیست. زیرا این ویژگی در One UI 5 به نام Bixby Text Call در اختیار دارندگان دستگاه های سامسونگ قرار گرفت. این ویژگی قبلا فقط به زبان کره ای در دسترس بود. اما اکنون به زبان انگلیسی نیز موجود است. گوگل سرویس مشابهی به نام Call Screen ارائه می دهد که می توان از آن برای پاسخگویی به تماس های تلفنی با صدای خودکار استفاده کرد. البته برخلاف Bixby Text Call، سرویس گوگل تنها امکان انتخاب چند متن از پیش آماده شده را ارائه می دهد.
تصور این که در آینده ای نزدیک توانایی پاسخگویی به تماس ها با صدای شبیه سازی شده پیشرفته تر خواهد شد، چندان سخت نیست. پس از همه، شما می توانید شبیه ساز صوتی متن به گفتار را به چت ربات هایی مانند ChatGPT یا Bing جدید متصل کنید. سامسونگ قول داده است که در آینده صدای شبیه سازی شده کاربران با سایر اپلیکیشن های این شرکت سازگار باشد. اما ما هنوز نمی دانیم غول فناوری کره ای از این وعده چه معنایی دارد.
می توانید از چت ربات های هوش مصنوعی بخواهید که محتویات تماس ها را خلاصه کنند. شرکت های فناوری مدت ها قول داده اند که دستیاران هوشمند آنها می توانند چنین قابلیتی را ارائه دهند و ارائه یک شبیه ساز صوتی با صدای کاربر می تواند این وعده را به واقعیت تبدیل کند.
ناگفته نماند که قابلیت شبیه سازی صدا در کنار مزایایی که دارد می تواند مشکلاتی را نیز ایجاد کند. با تماس های صوتی Duplex AI، گوگل به کاربران خود قول عملکردی شبیه به قابلیت Bixby Text Call را داده است. این فناوری در سال 2018 به عنوان راه حلی برای رزرو خودکار میز در رستوران ها معرفی شد. اما با بازخوردهای متفاوتی مواجه شد. برخی آن را غیراخلاقی توصیف کردند و برخی دیگر گفتند که این ویژگی باعث می شود فرد تماس گیرنده به کارهای بیشتری نیاز داشته باشد و استفاده از آن کمی دردسرساز است.
با این حال، انتظار داریم در طول زمان شاهد پیشرفت هایی در فناوری شبیه سازی صوتی مبتنی بر هوش مصنوعی باشیم. تصور کنید در آینده نزدیک وقتی با کسی تماس می گیرید، نمی توانید تشخیص دهید که با یک شخص واقعی صحبت می کنید یا صدای شبیه سازی شده.