Hier leest u hoe Siri nieuwe talen leert

Siri is de persoonlijke assistent die door het bedrijf Apple is geïntegreerd in het iOS-besturingssysteem voor iPhone, iPad en iPod Touch en is toonaangevend in het herkennen van gesproken opdrachten in verschillende talen. Apple heeft meerdere teams die werken aan het verbeteren van Siri en het uitbreiden van het aantal talen dat de assistent herkent, en vandaag leren we enkele details over het hele proces.

Het proces van het implementeren van een nieuwe taal in Siri begint met het aannemen van mensen die de nieuwe talen kunnen spreken, inclusief verschillende dialecten en accenten voor hen. Deze mensen lezen verschillende paragrafen die zijn geschreven door een ander team van medewerkers, ze proberen de meest gestelde vragen te raden, maar ook de antwoorden daarop.

De audio-opnamen worden vervolgens getranscribeerd, inclusief de manier waarop de woorden worden uitgesproken. Deze gegevens worden vervolgens ingevoerd in een speciaal voor Siri gemaakt algoritme. Algoritmen proberen deze woorden te combineren en zinnen te voorspellen die Siri zou moeten zeggen, en dit alles wordt in de loop van de tijd verbeterd naarmate gebruikers meer met Siri praten.

Hier leest u hoe Siri nieuwe talen leert

Wanneer de nieuwe taal gereed genoeg is om getest te worden, implementeert Apple deze in het dicteersysteem van iOS en macOS, van waaruit meer gegevens worden gehaald. Terwijl mensen verschillende woorden en zinnen dicteren die het iDevice/Mac moet schrijven, worden de gegevens verzameld en gebruikt om die taal rechtstreeks in Siri te integreren.

Het mooie van deze procedure is dat Apple opnames maakt van de dictaten, inclusief achtergrondgeluiden, onjuiste uitspraken, pauzes en diverse andere spraakgebreken. Door deze opnames te analyseren en te combineren met de beschikbare gegevens, kan Apple een definitieve versie van ondersteuning voor een nieuwe taal produceren.

"Bij Apple begint het bedrijf aan een nieuwe taal te werken door mensen passages in een reeks accenten en dialecten te laten lezen, die vervolgens met de hand worden getranscribeerd, zodat de computer een exacte weergave van de gesproken tekst heeft waar hij van kan leren", aldus Alex. Acero, hoofd van het spraakteam bij Apple. Apple legt ook een reeks geluiden vast in verschillende stemmen. Van daaruit wordt een taalmodel gebouwd dat woordreeksen probeert te voorspellen. Vervolgens implementeert Apple de 'dicteermodus', de tekst-naar-spraakvertaler, in de nieuwe taal, zei Acero. Wanneer klanten de dicteermodus gebruiken, legt Apple een klein percentage van de audio-opnamen vast en maakt deze anoniem. De opnames, compleet met achtergrondgeluid en gemompelde woorden, worden door mensen getranscribeerd, een proces dat helpt het aantal fouten in de spraakherkenning te halveren."

Al deze complexe procedures worden herhaald totdat het dicteersysteem erin slaagt de gesproken woorden zo correct mogelijk te herkennen. Natuurlijk worden er weer acteurs ingezet om bepaalde antwoorden vast te leggen die Siri biedt, waarbij Apple alleen de beste ervaring voor gebruikers probeert te bieden.

series ondersteunen nieuwe talen