هوش مصنوعی جدید گوگل، همه را شگفتزده کرد!
گوگل از هوش مصنوعی جدید خود که حاصل بهرهگیری از فناوری صوتی palm-2 و audioLM بوده و برای حاضرین در محل شگفتآور بوده، با قابلیت شنیدن، ترجمه کردن و حرف زدن رونمایی کرد.
به گفته محققان گوگل، مدل AudioLM در حفظ اطلاعات زبانآوایی مانند هویت و لحن گوینده عملکرد خوبی دارد. ضمن اینکه با ترکیب AudioLM با PaLM-2، مدل AudioPaLM قادر خواهد بود از تخصص زبانی PaLM-2 و حفظ اطلاعات زبان آوایی AudioLM استفاده کند تا به درک کاملتری از متن و گفتار دست یابد و بهتر بتواند آنها را خلق کند.
مدل AudioPalm با استفاده از کلمات مشترکی که گفتار و متن را با تعداد محدودی از توکنهای نشان میدهد در تشخیص گفتار، تبدیل متن به گفتار و ترجمه گفتار به گفتار در یک معماری و فرایند آموزش یکپارچه و واحد کاربرد خواهد داشت.
مدل جدید گوگل با ترکیب دو مدل زبانی، قادر است متن و گفتار را پردازش کند و افزایش کاربردها میتوان در کارهایی از قبیل تشخیص صدا یا تبدیل صدا به متن از آن بهره برد.
مدل AudioPaLM در زمینه ترجمه گفتار نمونهای موفق نسبت به سایر سیستمها بوده و توانسته گفتار را به متن ترجمه کند و چنین کاری را برای ترکیبهای زبانی جدید هم انجام دهد.
این فناوری جدید صداها را براساس اعلانهای گفتاری کوتاه، بین زبانهای مختلف جابهجا میکند و قادر است صداهای متفاوت را ضبط و آنها را در زبانهای مختلف بازتولید کند.