Näin Siri oppii uusia kieliä

Siri on henkilökohtainen avustaja, jonka Apple-yhtiö on integroinut iOS-käyttöjärjestelmään iPhonelle, iPadille ja iPod Touchille, ja se on johtava puhekomentojen tunnistamisessa eri kielillä. Applella on useita tiimejä, jotka työskentelevät Sirin parantamiseksi ja avustajan tunnistamien kielten määrän laajentamiseksi, ja tänään opimme joitakin yksityiskohtia koko prosessista.

Uuden kielen käyttöönotto Sirissä alkaa ihmisten palkkaamisesta, jotka osaavat puhua uusia kieliä, mukaan lukien heidän eri murteet ja aksentit. Nämä ihmiset lukevat toisen työntekijäryhmän kirjoittamia kappaleita, he yrittävät arvata usein kysyttyjä kysymyksiä, mutta myös vastauksia niihin.

Äänitallenteet litteroidaan sitten, mukaan lukien tapa, jolla sanat lausutaan, ja nämä tiedot syötetään sitten erityisesti Sirille luotuun algoritmiin. Algoritmit yrittävät yhdistää nämä sanat ja ennustaa lauseita, jotka Sirin pitäisi sanoa. Kaikki parantuvat ajan myötä, kun käyttäjät puhuvat enemmän Sirin kanssa.

Näin Siri oppii uusia kieliä

Kun uusi kieli on tarpeeksi valmis testattavaksi, Apple ottaa sen käyttöön iOS:n ja macOS:n sanelujärjestelmään, josta otetaan lisää dataa. Kun ihmiset sanelevat erilaisia ​​sanoja ja lauseita iDevice/Macille kirjoittamista varten, tiedot kerätään ja niitä käytetään integroimaan kyseinen kieli suoraan Siriin.

Hyvä puoli tässä menettelyssä on, että Apple tallentaa sanelut, mukaan lukien taustaäänet, virheelliset ääntämiset, tauot ja monet muut puhevirheet. Analysoimalla nämä tallenteet ja yhdistämällä ne hallussaan oleviin tietoihin Apple pystyy sitten tuottamaan lopullisen version tuesta uudelle kielelle.

"Applella yritys alkaa työskennellä uuden kielen parissa tuomalla ihmiset lukemaan kohtia eri aksentilla ja murteilla, jotka sitten litteroidaan käsin, jotta tietokoneella on tarkka esitys puhutusta tekstistä, josta oppia", Alex sanoi. Acero, Applen puhetiimin johtaja. Apple tallentaa myös erilaisia ​​ääniä eri äänillä. Sieltä rakennetaan kielimalli, joka yrittää ennustaa sanajonoja. Sitten Apple ottaa käyttöön "sanelutilan", tekstistä puheeksi -kääntäjänsä uudella kielellä, Acero sanoi. Kun asiakkaat käyttävät sanelutilaa, Apple tallentaa pienen osan äänitallenteista ja tekee niistä anonyymejä. Ihmiset kopioivat tallenteet, joissa on taustamelua ja mumisia sanoja, mikä prosessi auttaa puolittamaan puheentunnistuksen virheprosentin."

Kaikki tämä monimutkainen toimenpide toistetaan, kunnes sanelujärjestelmä onnistuu tunnistamaan puhutut sanat mahdollisimman oikein. Tietenkin näyttelijöitä käytetään jälleen tallentamaan tiettyjä Sirin tarjoamia vastauksia, Apple yrittää tarjota käyttäjille vain parhaan kokemuksen.

sarjat tukevat uusia kieliä