Meta a lansat un model AI capabil să traducă şi să transcrie vorbirea în zeci de limbi

Meta Platforms, compania-mamă a Facebook, a lansat marţi un model AI capabil să traducă şi să transcrie vorbirea în zeci de limbi, un potenţial element de bază pentru instrumente care permit comunicarea în timp real între limbi, transmite Reuters.

Compania a declarat într-o postare pe blog că modelul său SeamlessM4T ar putea suporta traduceri între text şi vorbire în aproape 100 de limbi, precum şi traducere completă din vorbire în vorbire pentru 35 de limbi, combinând tehnologia care era disponibilă anterior doar în modele separate.

CEO-ul Mark Zuckerberg a spus că are în vedere astfel de instrumente care să faciliteze interacţiunile între utilizatorii de pe tot globul în metaverse, setul de lumi virtuale interconectate pe care pariază viitorul companiei.

Meta pune modelul la dispoziţia publicului pentru uz necomercial, se arată în postarea de pe blog.

Cea mai mare companie de socializare din lume a lansat în acest an o serie de modele AI, în cea mai mare parte gratuite, inclusiv un model de limbaj larg numit Llama, care reprezintă o provocare serioasă pentru modelele proprietare vândute de OpenAI, susţinut de Microsoft, şi Google, parte a grupului Alphabet.

Zuckerberg spune că un ecosistem AI deschis funcţionează în avantajul Meta, deoarece compania are mai mult de câştigat prin aprovizionarea efectivă a creării de instrumente destinate consumatorilor pentru platformele sale sociale, decât prin taxarea pentru accesul la modele.

Citește și Meta va cere consimţământul utilizatorilor din UE pentru reclamele direcţionate în funcţie de interesele acestora

Cu toate acestea, Meta se confruntă cu întrebări legale similare cu restul industriei în jurul datelor de formare ingerate pentru a-şi crea modelele.

În iulie, comedianta Sarah Silverman şi alţi doi autori au intentat procese pentru încălcarea drepturilor de autor, atât împotriva Meta, cât şi împotriva OpenAI, acuzând companiile că le folosesc cărţile ca date de antrenament fără permisiune.

Pentru modelul SeamlessM4T, cercetătorii Meta au spus într-o lucrare de cercetare că au adunat date de antrenament audio din 4 milioane de ore de ”audio brut provenit dintr-un depozit disponibil public de date web accesate cu crawlere”, fără a specifica care depozit.

Un purtător de cuvânt al Meta nu a răspuns la întrebările privind provenienţa datelor audio.

Datele text provin din seturi de date create anul trecut, care au extras conţinut de pe Wikipedia şi site-uri web asociate, se arată în lucrarea de cercetare.