با کمک هوش مصنوعی، ممکن است به زودی با حیوانات صحبت کنیم


تصور کنید بتوانید آنچه را که پرندگان به یکدیگر می گویند را رمزگشایی کنید یا بفهمید که فیل های آفریقایی با استفاده از گوشی هوشمند چه می گویند. خبر خوب این است که به نظر می رسد زمان زیادی تا رسیدن فناوری تشخیص گفتار حیوانات وجود ندارد و در واقع، این بخشی از آینده فناوری پروژه گونه های زمین (ESP) است.

ESP یک سازمان غیرانتفاعی است که آزا راسکینبنیانگذار آزمایشگاه موزیلا و بریت سلویل این توسط اعضای تیم موسس توییتر تاسیس شد. هدف این سازمان رمزگشایی ارتباطات غیرانسانی با استفاده است هوش مصنوعی است.

درک افکار درونی حیوانات خانگی می تواند جذاب باشد. البته، مزایای درک ارتباط حیوانات بسیار فراتر از گوش دادن به مکالمات بین سگ های خانگی و سگ های همسایه است. در واقع، توانایی رمزگشایی ارتباطات حیوانات پیامدهای مستقیمی برای حفاظت از محیط زیست و سیاره ما دارد.

رمزگشایی ارتباطات حیوانات می تواند به توسعه ابزارهایی منجر شود که می توانند به تحقیقات حفاظتی کمک کنند. با دانستن ویژگی‌های کشف‌نشده حیوانات، دانشمندان می‌توانند نحوه ارتباط گونه‌های خاص، نحوه شکار، غذا خوردن، ارتباط با حیوانات دیگر و نحوه پردازش اطلاعات دریافتی از محیط اطراف خود را کشف کنند.

آیا گربه وحشی طبیعت انسان را می شناسد؟ آیا حافظه یک فیل می تواند به انتقال داستان زندگی آنها از نسلی به نسل دیگر کمک کند؟

ما از طریق تکنیک ها می توانیم یادگیری ماشینی، رمزگشایی داده های بیوآکوستیک و سپس ترجمه این اطلاعات به زبان طبیعی انسان، می توانیم اطلاعات زیادی را از ارتباطات حیوانات به دست آوریم. این داده ها می تواند به تلاش های انسان برای حفاظت از محیط زیست و همچنین تحقیقات علمی قابل اعتماد در مورد گونه های مختلف جانوری و ارزیابی جمعیت حیات وحش کمک کند. البته هر چقدر هم که جذاب و نوآورانه به نظر برسد، دستیابی به این هدف واقعاً دشوار است.

بسیاری از تحقیقات مربوط به رمزگشایی ارتباطات حیوانات مبتنی بر مدل‌های زبان بزرگ است که دقیقاً به همان روشی عمل می‌کنند که برای بهبود عملکرد Google Bard یا Google Bard استفاده می‌شود. ChatGPT استفاده می شود. ابزارهای مولد هوش مصنوعی در درک زبان بسیار خوب هستند. زیرا یادگیری ماشینی می تواند زبان ها، سبک ها و زمینه های مختلف را به خوبی درک کند و پاسخ های مناسبی را ارائه دهد.

ZDNet می‌نویسد که مدل‌های زبانی بزرگ در طول بسیاری از مراحل آموزش، حجم عظیمی از داده‌ها را تغذیه می‌کنند. این مدل ها ورودی های مختلفی را برای درک ارتباط بین کلمات و معانی آنها یاد می گیرند. اساساً حجم زیادی از داده های متنی از منابع مختلف مانند وب سایت ها، کتاب ها، تحقیقات و … برای این مدل ها در دسترس است.

در مرحله بعد، مدل های زبان بزرگ تحت نظارت مربیان انسانی قرار می گیرند و با آنها گفتگو می کنند تا مفاهیم مختلف را بهتر یاد بگیرند و زمینه های مکالمه را بهتر درک کنند. این مرحله همچنین باعث می‌شود مدل‌های بزرگ زبان از احساسات انسانی آگاه شوند و دقیقاً نحوه عملکرد زبان را بیاموزند.

اگرچه زبان مردم در نقاط مختلف جهان با یکدیگر متفاوت است، اما همه آنها ارتباط بین مردم را ممکن می کنند. از آنجایی که هوش مصنوعی بر اساس هوش انسانی توسعه یافته است، ساخت مدل هایی برای پردازش زبان طبیعی انسان بسیار آسان تر از ساخت مدل هایی است که ارتباط بین حیوانات را درک می کند.

بزرگترین چالشی که ESP در رمزگشایی ارتباطات حیوانات با آن مواجه شده است، فقدان داده های اولیه است. هیچ زبان نوشتاری حیوانی برای آموزش این مدل ها وجود ندارد و فرمت های ارتباطی مختلف بین گونه ها چالش دیگری را ایجاد می کند.

ESP در حال جمع آوری داده ها از حیوانات وحشی در سراسر جهان است. محققان همچنین در حال ضبط ویدئو و صداهای حیوانات هستند. این داده ها اولین گام برای ساخت مدل های اساسی است که توانایی رمزگشایی گفتار طیف گسترده ای از گونه های جانوری را فراهم می کند.

اینترنت اشیا (IoT) همچنین به افزایش میزان داده های سبک های مختلف ارتباطی در بین حیوانات کمک می کند. طیف گسترده ای از دوربین های ارزان قیمت، ضبط صوت و غیره به این معنی است که دانشمندان می توانند داده ها را از سراسر جهان جمع آوری کرده و برای تجزیه و تحلیل آماده کنند.

راسکین یکی از بنیان‌گذاران ESP می‌گوید که احتمالاً در 12 تا 36 ماه آینده فناوری مورد نیاز برای ایجاد صداهای جدید و سازنده را خواهیم داشت و در آن زمان می‌توان از این فناوری برای رمزگشایی ارتباطات حیوانات استفاده کرد.