ابزارهای مبتنی بر هوش مصنوعی در ماه های اخیر بسیار محبوب و خبرساز شده اند. برخی از این ابزارها مانند یک انسان با شما صحبت می کنند و برخی دیگر قابلیت مبارزه دارند و برخی از سرویس ها نیز از روی متن عکس می سازند.
New Scientist می نویسد که دانشمندان توانسته اند سیگنال های مغز را مستقیماً از طریق ابزار تبدیل متن به تصویر به عکس تبدیل کنند. این سیستم به تجهیزات بزرگ و گران قیمت نیاز دارد و ما با دورانی که بتوانید هر روز ذهن بخوانید فاصله داریم.
چندین گروه تحقیقاتی با استفاده از مدل های هوش مصنوعی توانسته اند سیگنال های مغز را به تصویر تبدیل کنند. البته این مدل ها به انرژی زیادی نیاز دارند و برای کار با آن ها باید میلیون ها تا میلیاردها پارامتر به طور دقیق تنظیم شوند.
شینجی نیشیموتو و یو تاکاگیاعضای دانشگاه اوزاکا، ژاپن، راه حل بسیار ساده تری را از طریق ابزار Stable Diffusion ایجاد کرده اند. سال گذشته، شرکت Stability AI این ابزار را منتشر کرد. ابزاری که می تواند از متن عکس بسازد و راه حل جدید دانشمندان ژاپنی به جای میلیون ها پارامتر به چندین هزار پارامتر نیاز دارد.
Stable Diffusion معمولاً پس از دریافت متن شروع به تولید نویز بصری می کند. سپس Stable Diffusion اصلاحاتی را روی آن اعمال میکند و تصاویری مشابه تصاویر موجود در مجموعه داده با حاشیهنویسی مشابه ایجاد میکند. ابزارهای هوش مصنوعی بر روی حجم عظیمی از داده ها به نام مجموعه داده آموزش می بینند.
نیشیموتو و تاکاگی دو مدل جدید هوش مصنوعی را به Stable Diffusion اضافه کردند تا این سرویس را با سیگنال های مغزی تطبیق دهند. این دو دانشمند از داده های چهار نفری که در مطالعه دیگری شرکت کرده بودند استفاده کردند. در آن مطالعه، یک سیستم fMRI برای اسکن مغز شرکت کنندگان استفاده شد. در حالی که آنها در حال تماشای 10000 عکس مختلف از مناظر، اشیا و افراد بودند.
نیشیموتو و تاکاگی با استفاده از تقریباً 90 درصد دادههای تصویربرداری مغز، مدل هوش مصنوعی جدیدی را آموزش دادند که میتواند بین دادههای fMRI از بخشی از مغز به نام قشر بینایی اولیه و تصاویری که شرکتکنندگان مشاهده میکردند، ارتباط برقرار کند. قشر بینایی اولیه ناحیه ای در مغز انسان است که سیگنال های بینایی را پردازش می کند.
دانشمندان ژاپنی از همین مجموعه داده برای آموزش مدل دیگری استفاده کردند. این مدل هوش مصنوعی توضیحات متنی تصاویر و داده های fMRI را از بخشی از مغز به نام قشر بینایی ثانویه به هم متصل می کند. این ناحیه از مغز توانایی پردازش معنای تصاویر را دارد.