Doorgaans worden van elke versie van NaturallySpeaking 3 edities uitgebracht: Standard, Preferred en Professional. De belangrijkste reden om Preferred te nemen i.p.v. Standard, is dat je met Preferred kan naluisteren wat je hebt gedicteerd. Je kan zo nagaan of het aan je uitspraak of articulatie ligt als het pakket je verkeerd verstaat. Het grote voordeel van Professional is dat je er zelf nieuwe commando's (macro's) mee kan maken. Op de site van Scansoft vind je de zgn. feature compatibility matrix, een overzicht van de verschillen tussen de versies.
In de loop der tijd is er niet voor elke Engelstalige versie ook een Nederlandstalige variant geproduceerd. Een kort overzicht van de versies van de laatste jaren:
Bij het trainen van NaturallySpeaking schijnt minder meer te zijn. Je kan een hele serie teksten voorlezen om NaturallySpeaking aan je stemgebruik te laten wennen, maar volgens Chuck Runquist, iemand die sterk betrokken was bij DNS 5 en 6, kan je je beter beperken tot 1 a 2 van de keuzemogelijkheden.
Select-and-Say is de mogelijkheid om een stukje tekst dat je even eerder hebt gedicteerd, en dat nog op het scherm te zien is, te selecteren en daarna te vervangen door andere tekst. Stel dat ik de titel van deze sectie zou willen wijzigen, dan zou ik achtereenvolgens kunnen zeggen 'Selecteer geschikt maken voor' en 'aanpassen aan'. De titel wordt dan: "Programma's aanpassen aan Select-and-Say".
In de knowledgebase van Scansoft staat een uitgebreid artikel over het onderwerp van deze sectie. Dit artikel is behoorlijk complex, en de methodes verschillen voor DNS 5, 6 en 7. Aangezien we in Nederland voorlopig alleen 5 hebben, zal ik me daarop concentreren. Ook Joel Gould heeft een pagina geschreven over Select-and-Say, maar die is niet bijgewerkt sinds 1999, en gaat over DNS 3. De informatie is waarschijnlijk correct voor versies t/m 5.
Select-and-Say is standaard maar in een klein aantal programma's (volledig) beschikbaar, o.a. in Word(pad), Kladblok, DragonPad en WordPerfect. Het werkt bv. niet in het e-mail programma dat veel mensen gebruiken, Outlook Express. Of Select-and-Say werkt hangt voor een groot deel af van het type venster waarin je probeert te dicteren (in programmeervocabulaire heet dat de 'class name'). Scansoft noemt het venster waarin je tekst kunt intikken een 'edit control'.
Er zijn 4 types venster waarin Select-and-Say in elk geval zou moeten kunnen werken: Edit, RichEdit20W, RichEdit20A en RichEdit. Als ik het goed begrijp detecteert DNS 7 deze vensters zelf, en werkt het automatisch. In DNS 5 moet je, afgezien van de hierboven genoemde standaard programma's, iets speciaals doen. Datzelfde geldt voor vensters die familie van de zojuist genoemde types zijn. In EditPad, mijn favoriete tekstverwerker, is dit bv. TRicherEdit.
In het Scansoft artikel zeggen ze dat je wijzigingen moet aanbrengen in NSSYSTEM.INI, maar op mijn PC bestaat dat bestand helemaal niet. Ik heb nog geprobeerd er zelf 1 te maken, met daarin de benodigde informatie, maar dat heeft geen effect. Het blijkt dat er (voor DNS 5 en lager) in het register gesleuteld moet worden (WAARSCHUWING: doe dat alleen als je kennis van zaken hebt). Je kan er de zaak grondig mee verzieken.
Ga met het programma REGEDIT naar [HKEY_LOCAL_MACHINE\Software\Dragon Systems\NaturallySpeaking 5.0\Install\System\Enable Module Names]. Waarschijnlijk staan daar al waarden voor NATSPEAK en WORDPAD. Voeg een identieke waarde toe voor het programma dat je geschikt wilt maken voor Select-and-Say. In mijn geval (zie hierboven) komt links te staan EDITPAD, en rechts {dd100104-6205-11cf-ae61-0000e8a28647}. De selecteer commando's werden vervolgens goed herkend in EditPad (eerst niet), maar helaas werd de tekst niet daadwerkelijk geselecteerd. Dat betekent volgens het Scansoft artikel dat dit type venster niet geschikt is.
Er zijn verschillende programma's waarmee je het type kan bepalen van de onderdelen van je scherm.
Als Select-and-Say niet mogelijk is, passen veel Dragon gebruikers de volgende strategie toe: ze dicteren in DragonPad (wel Select-and-Say), selecteren en copiëren de tekst, schakelen over naar de applicatie waarvoor het bedoeld was, en plakken de tekst daar op de goede positie.
Versie 7 bevat echter een handiger alternatief: het ongedocumenteerde (?) commando "Show dictation box". (In versie 6 moest je een correctie in NaturallySpeaking aanbrengen om deze functionaliteit te krijgen.) Je plaatst de cursor op de plek waar de tekst moet komen, je roept het bovenstaande commando, er verschijnt een dialoogvenster waarin je wel volledige Select-and-Say mogelijkheden hebt, je dicteert je tekst, en tenslotte zeg je "Click OK".
2 probleempjes met de dictation box:
Active Accessibility is soms nodig voor het besturen van menu's en dialogen met spraakopdrachten. Het hangt af van zowel de versie van Windows, als van het programma dat je wilt besturen.
Op het tabblad Overige van de Opties staat een aankruisvakje 'Active Accessibility voor besturing van menu's en dialogen'. Deze optie is niet beschikbaar als de versie van Windows het niet ondersteunt, of als Active Accessibility niet geinstalleerd is.
Het aanzetten van AA zou een negatief effect kunnen hebben op de snelheid van NaturallySpeaking.
DNS past nooit spontaan zijn bestanden aan. Als je de bestanden niet actief opslaat (bij het afsluiten of daarvoor), dan leert DNS niets. Als je bv. op 5 Mei voor het laatst de bestanden hebt opgeslagen, en sindsdien niet meer, dan is de gebruiker volledig onveranderd.
DNS leert niet van dicteren, maar alleen van correctie.
Je kan NaturallySpeaking op een aantal manieren aanpassen aan je schrijfstijl en woordgebruik:
Deze functie is te bereiken via Extra, Nauwkeurigheidscentrum (alleen in NS 7). NaturallySpeaking analyseert documenten en/of e-mail. Alleen de meestgebruikte mailprogramma's worden ondersteund, en alleen documenten in de map 'Mijn documenten' worden meegenomen. Ik heb de indruk dat het bij deze actie alleen gaat om de schrijfstijl, en dat je voor het toevoegen van nieuwe woorden 1 van de 2 andere mogelijkheden moet kiezen.
Deze functie is te bereiken via Extra, Nauwkeurigheidscentrum (NS 7), en via NaturallySpeaking, Woorden (NS 5). De vensters zien er vrijwel identiek uit in NS 5 en NS 7.
Het nadeel t.o.v. de vorige optie is dat je geen e-mail kunt laten analyseren (tenzij je de mailtjes als bestanden opslaat). Andere onplezierige punten:
De voordelen zijn dat je veel meer controle hebt over welke bestanden worden meegenomen, dat NaturallySpeaking nieuwe woorden leert en dat je zelf bepaalt of een woord ook daadwerkelijk wordt meegenomen.
Deze functie is te bereiken via NaturallySpeaking, Geavanceerd (NS 5). In NS 7 is de lexiconbouwer niet meer te starten vanuit de menu's, maar het programma is gelukkig nog wel aanwezig. Zoek in de NaturallySpeaking map naar 'vocbldr.exe' (waarschijnlijk in de map Programs).
Het is vreemd dat Scansoft het gebruik van dit programma kennelijk wil ontmoedigen, want het is het beste van de 3. Voordelen t.o.v. de andere opties:
Als je zegt "3 komma 6 1 miljoen" krijg je "3, 6 een miljoen". Duidelijk niet de bedoeling dus (nog afgezien van extra spatie, die kennelijk door een bug veroorzaakt wordt). Om "3, 61 miljoen" te krijgen zeg je precies dat: "3 komma eenenzestig miljoen".
Dit wordt voor Engelstalige versies duidelijk uitgelegd op de volgende pagina van Rose. Let wel: volgens Rose gaat het alleen om correctiecommando's, maar daarbij noemt ze ook commando's als 'Cap That' (Maak dat hoofdletter) en 'Select Again' (Selecteer nogmaals). Wie weet dus wat er allemaal mogelijk is.
Ik heb geprobeerd in NaturallySpeaking 5 het commando 'Corrigeer dat' te veranderen in 'Repareer het'. Dat lukte zonder problemen. Hieronder de instructies. Maak evt. vooraf een kopie van het bestand waarin je dingen gaat wijzigen!
Ga naar de hoofdmap van NaturallySpeaking, en zoek alle submappen (-folders, -directories) af naar het bestand OPTIONS.INI. Waarschijnlijk zal het zich bevinden in de map '...\Users\gebruikersnaam\current'. Elke sectie in dit bestand begint met een woord tussen vleeshaken ('[' en ']'). Voeg in de sectie '[Options]' de volgende regel toe:
Correct That Command=Repareer het
Het maakt niet uit waar de nieuwe regel in de sectie staat (als het maar op een aparte regel is, gescheiden van de andere opties). Ik heb (nog) niet getest of het ook werkt als je aan de linkerkant van het '='-teken de Nederlandse naam gebruikt, bv. 'Corrigeer Dat Commando=...'. Ik vermoed echter van niet.
Voor de aardigheid heb ik nog gekeken of ik een commando kon veranderen dat niet door Rose genoemd wordt, nl. 'Aanhalingsteken openen'. Dat werkte helaas niet. Het kan wel met de utility VocEdit.
Je wilt niet 15 Okt 2003, maar 15 Oktober 2003. Ga dan naar het tabblad 'Formatting' van de opties. Zorg dat er geen vinkje staat in 'Use abbreviations and contractions'.
Soms moet je regelmatig een vreemd woord dicteren, bv. een ongewone achternaam of een woord uit een andere taal. Ik wil op mijn werk bv. 'system base release' kunnen zeggen (in een Nederlandstalige versie van DNS). In dat geval kan je de volgende strategieen toepassen:
Persoonlijk geef ik dus de voorkeur aan de 3e methode. Eerlijkheidshalve moet ik er wel bij vermelden dat ik niet lang genoeg met DNS heb gewerkt, om te weten of de ene of andere methode op de lange termijn voor- of nadelen heeft.
Ik weet nog niet zeker of dit in de Nederlandse versie werkt. In de Engelse versie van NaturallySpeaking wordt een getal van 7 cijfers automatisch geformateerd als een telefoonnummer, bv. 456-1234 (het streepje hoef je niet zelf te dicteren). Dit formaat wordt gedefinieerd in het bestand NUMWORDS.DAT (in DNS 5 in de subdirectory DATA/NLD, in DNS 7 in DATA/ENX). Vrij bovenaan staat nl. een regel 32=NNN-NNNN. Als je er in de Engelse versie NN,,NN))NNN van maakt, en je dicteert 7 cijfers, voegt DNS automatisch de ,, en )) toe.
Meerdere vocabulaires voor 1 gebruiker zijn alleen mogelijk in Professional. Een lege maak je als volgt: 'manage vocabularies', 'new' en dan de optie empty.
Thuis heb ik vrijwel alleen Engelstalige pakketten. Ik heb met NaturallySpeaking 7 een aantal testen gedaan. Veel menukeuzes worden probleemloos herkend, bv. Edit, View, Insert, Format, Options, Tools, Window, Help, Bookmarks en Go. Wat bij mij niet lukte zijn de keuzes File en Favorites (en View ging een enkele keer wat moeizaam), als je het op zijn Engels uitspreekt. Als je 'File' uitspreekt alsof het een rij auto's is, gaat het prima. Hetzelfde geldt voor Favorites.
Een goed alternatief is 'Druk Alt x', waarbij 'x' de onderstreepte letter in de menukeuze is. Zeker in de Office produkten is vrijwel alles (ook de keuzes als het menu eenmaal uitgeklapt is, of de opties in dialoogvensters) op deze manier te activeren. In een uitgeklapt menu moet je trouwens 'Alt' weglaten. Elders op deze site vind je uitgebreidere uitleg over de toetsen waarmee je Windows kunt besturen.
Als je op een of andere manier een stuk dictaat opneemt, en je wilt dat pas later aan Dragon voeren, dan moet het bestand aan de volgende voorwaarden voldoen:
Ga vervolgens toe naar Geluid (Sound) - Opname uitschrijven (Transcribe recording), en selecteer het .WAV- of .SRI-bestand.
Het is veel gemakkelijker om met spraakherkenning toetsen in te drukken dan de muis te besturen. Je kan bv. zeggen 'Druk Enter', of 'Typ Control P'. Het ligt daarom voor de hand om enige energie te steken in het leren van manieren om dingen met toetsen te doen. Toevallig heb ik daar zelf een vrij lange pagina over geschreven.
Als je toch perse van de muis wilt of moet gebruiken, dan is er om te beginnen het commando 'Muisraster'. Meestal kan je met hooguit 3 cijfers de muispointer op de beoogde plaats krijgen. Het klikken kan je evt. overlaten aan een gratis pakket als MouseTool.
Jeff Carlson van Creative ICR heeft een alternatieve versie van Muisraster ontwikkeld. Naar zijn zeggen kan je daarmee nog sneller de muispointer positioneren. Het zou zowel met Preferred als met Professional moeten werken. Helaas is de tool niet meer op zijn site te vinden. Ik ga nog proberen te achterhalen of hij ergens anders is te downloaden.
Als je zelf commando's kan maken, hetzij met normale macro's (kan alleen als je de Professional versie hebt) of met Natlink, dan kan je kiezen voor 2 strategieën om de muispointer op de goede plek te krijgen:
Er zijn een aantal utilities waarmee je de coordinaten van een punt op je scherm kan bepalen. Ik ken de volgende 3 (ze zijn allemaal gratis, en hoeven geen van allen geinstalleerd te worden):
Als woorden fout herkend worden kan je besluiten ze te gaan trainen, zodat het in de toekomst beter gaat. Doe dat echter alleen als je naluistert wat je hebt ingesproken (kan alleen in Preferred of Professional) en je hoort dat je de tekst inderdaad niet duidelijk hebt uitgesproken.
Als je gaat trainen, doe dat dan zoveel mogelijk met zinsdelen, en niet met losse woorden. Neem echter niet meer dan 3 a 4 woorden tegelijk. In het stuk dat je gaat trainen moeten geen leestekens zitten.
Volgens iemand die op de hoogte zou moeten zijn van de interne zieleroerselen van NaturallySpeaking kan je het beste als volgt met fouten omgaan (onderstaande geldt waarschijnlijk alleen voor versie 6 en hoger). Zeg 'selecteer dat' of 'selecteer het gedeelte dat je wilt verbeteren'. Herhaal, evt. met betere uitspraak, wat er de eerste keer al had moeten staan. Als het dan nog steeds fout gaat kan je alsnog 'corrigeer ...' kiezen. Als je vaak onmiddellijk voor het corrigeer-commando kiest zou dat kunnen leiden tot degradatie van spraakbestanden.
Aansluitend op het bovenstaande, en zeer belangrijk, het volgende (versie 6 en hoger!). Als je iets gedicteerd hebt, en je verwijdert het met toetsen (Backspace, Del) of met het commando 'Schrap dat', dan zal NaturallySpeaking zijn bestanden niet aanpassen (het pakket leert in dit geval niets).
Als je daarentegen tekst selecteert, en je voert iets nieuws in met stem of toetsen, dan bepaalt NaturallySpeaking zelf of hij al niet iets moet leren. Als de nieuw ingevoerde tekst nauwelijks afwijkt van de vorige, dan gaat NaturallySpeaking uit van een correctie, ook al heb je niet 'Corrigeer dat' gezegd. Als het verschil groot is, gaat NaturallySpeaking er van uit dat je van mening veranderd bent.
Kortom, als je denkt dat NaturallySpeaking je bedoeling verkeerd zou kunnen interpreteren, kan je beter geen Select-and-Say gebruiken. Enkele voorbeelden:
Wat voor invloed heeft het op je spraakprofiel, als je met
Select-and-Say tekst corrigeert, die door een ander is gedicteerd,
of is ingetikt?
Waarschijnlijk geen, gezien de volgende passage in de handleiding:
"Even though you are correcting someone else's dictation, your work
won't reduce recognition accuracy for either you or the person who dictated
the text."
Het gaat dus in wezen om tekst waarvoor (in Preferred en hoger)
het commando "Play that back" niet zou werken, omdat je het zelf
niet hebt ingesproken.
Vrijwel elke reeks acties die je regelmatig achter elkaar uitvoert kan je met macro's automatiseren. Je kan de macro (binnen bepaalde grenzen) een naam naar keuze geven.
Macro's zijn te maken en te gebruiken in DragonDictate en in de Professional editie van NaturallySpeaking. De macro-taal van beide pakketten is niet helemaal gelijk, maar de voornaamste verschillen zitten in de manier waarop commando's worden beheerd en toegevoegd. De meeste commando's uit versie 5 kunnen worden meegenomen naar versie 6, maar de taal is uitgebreid met Visual Basic for Applications, of iets wat daar sterk op lijkt.
Hier verzamel ik voorbeelden van macro's, en algemene richtlijnen.
Joel Gould heeft de programma's putwords en getwords gemaakt en op zijn website gezet. Met getwords kan je in alle versies van NaturallySpeaking de woorden die je zelf hebt toegevoegd exporteren naar een tekstbestand, evt. inclusief uitspraak. Met putwords importeer je de woorden weer. Dit kan bv. heel handig zijn als je overgaat van NaturallySpeaking 5 naar 6.
Door te kijken naar de uitspraakweergave in de uitvoer van Getwords, kan je heel veel leren over hoe DNS verwacht dat het woord wordt uitgesproken. Je zult echter wel een flink aantal voorbeelden moeten bestuderen voor je precies snapt welk teken voor welke klank staat. Voorbeelden:
Wie hier echt een studie van wil maken kan gaan naar de site van SAMPA (Speech Assessment Methods Phonetic Alphabet). De daar gebruikte fonetische weergaven komen echter niet overeen met die van GetWords.
Nog een handig programma van Joel Gould. Het werkt in elk geval in de Preferred en Professional uitvoering van NaturallySpeaking versie 5.
Met VocEdit kan je het "gedrag" van elementen uit de vocabulaire veranderen. Normaal is bv. dat er na elke punt (aan het eind van de zin) een spatie komt, en na een 'aanhalingsteken openen' juist niet. Het 1e woord na een punt begint standaard met een hoofdletter. Maar misschien wil je dat er na een punt geen spatie komt (zou bv. handig kunnen zijn bij programmeren, waar je soms namen hebt in de trant van abc.def.ghi). Als je wilt dat een bepaald woord of teken zich precies zo gedraagt als een ander teken, dan kan je dat zelfs selecteren uit een voorgedefinieerde lijst.
Sommige ingebouwde commando's kan je veranderen (anders aanroepen) door wijzigingen aan te brengen in een bestand met opties, in andere gevallen kan je VocEdit gebruiken. Stel dat je i.p.v. 'aanhalingsteken openen' liever iets zegt als 'open quote'. Je voert dan de volgende stappen uit:
Met VocEdit kan je ook woorden verwijderen die je met de ingebouwde vocabulaire editor niet kwijt kunt raken. De mogelijkheden zijn schier onbegrensd, en op bovengenoemde download pagina noemt Joel Gould er talloze. Er staan ook plaatjes van de dialoogvensters van VocEdit.
Onderstaande lijst wordt geleidelijk uitgebreid, en lang niet alle informatie staat onomstotelijk vast:
[OUTLOOK] OutlkCmds.dvc=1waarbij de 1e regel in Outlook.dvc er als volgt uitziet:
Menu "Outlook"
Voorlopig beperk ik mezelf tot enige verwijzingen. Een groot aantal tekens is al standaard in NaturallySpeaking aanwezig. Zie pag. 170-173 in de gebruikershandleiding van versie 5 (Preferred). Het gaat bv. om tekens als à, ë, ñ, ß en zelfs de 2 zoals in de chemische formule voor water (superscript, weet niet hoe ik dat hier moet produceren).
In een stuk van Larry Allen wordt ook aandacht besteed aan Unicode. Vroeger werden alle tekens in 1 byte (8 bits) weergegeven, waardoor er maximaal 255 beschikbaar zijn. Unicode heeft 2 bytes gereserveerd voor een teken, zodat het zelfs de Chinese taal (vele duizenden tekens) aankan.
Er is een grote collectie speciale commando's beschikbaar voor veel gebruikte pakketten als Excel en Word. Dit zijn de zgn. Natural Language Commands. Helaas zijn deze commando's in de huidige versies van NaturallySpeaking weinig flexibel (in tegenstelling tot de voorloper, VoiceXpress). Er is vaak maar 1 manier om ze uit te spreken, terwijl je bij natuurlijke taal juist zou verwachten dat je dezelfde acties op meerdere manieren kan uitdrukken. Ook liggen de commando's niet lekker in de mond (tenminste in het Engels). Het schijnt dat de problemen voortkomen uit het feit dat MREC, de 'spraakherkenningsmachine' van NaturallySpeaking niet berekend was op dit soort commando's.
Een deel van de commando's kan je waarschijnlijk wel achterhalen via de Opdrachtencentrum (Command Browser), maar in onderstaande secties zal ik een paar voorbeelden geven. Een algemeen kenmerk lijkt te zijn dat ze met een werkwoord beginnen.
Excel 2000 werkt redelijk in combinatie met DNS 6. Het duo Excel 2002/DNS 6 schijnt dramatisch te zijn, en Excel 2002 met DNS 7 gaat weer iets beter.
Mogelijke commando's zijn:
De speciale Microsoft Word commando's zijn in DNS 8 allemaal omgezet naar NLC's (Natural language commands). Op een hele simpele manier kan worden geregeld of deze commando's beschikbaar zijn of niet, nl. via de Opties.
Er zijn nu (sinds DNS 8) 2 sets van NLC's: Constrained (specifiek voor 1 applicatie) en Global (zelfs actief als je in de Opties NLC's hebt ge-disabled).
Afhankelijk van wat je in de opties hebt ingesteld worden er 1 of meerdere backups van je spraakbestanden bijgehouden. Als je bv. merkt dat je bestanden corrupt zijn geraakt, kan je op 1 van de backups terugvallen. Helaas is het aantal backups beperkt, ik geloof maximaal 5.
Als extra veiligheid is het geen slecht idee om af en toe je gebruikersmap met complete inhoud met het handje te kopieren naar een andere partitie of schijf, of zelfs CD/DVD. Doe dat bv. als je van plan bent een riskante operatie te gaan uitvoeren. Afhankelijk van de versie van NaturallySpeaking zijn er verschillende plaatsen waar die map kan staan.
De gegevens in je gebruikersmap zijn heel sterk gerelateerd aan die gebruiker, de microfoon, de geluidskaart, de doorlopen training. Je kan ze dus niet zomaar overzetten naar een andere PC. Dat kan wel met de door jou toegevoegde woorden en commando's.
De toegevoegde woorden kan je exporteren via Woorden (in de Dragon-balk) en dan Exporteren. Een betere manier is gebruik te maken van de utilities GetWords en PutWords. De uitspraak blijft dan ook bewaard.
De zelfgemaakte commando's (alleen in Professional) zitten in het bestand MYCMDS.DAT.
Soms kunnen restanten van vroeger geinstalleerde spraakpakketten de zaak grondig verzieken bij of na de installatie van een nieuw pakket. Overigens is het soms nodig dat er juist iets van een oud pakket aanwezig is, als je een upgrade hebt aangeschaft.
Gebruik voor de deinstallatie van een pakket zoveel mogelijk de geeigende wegen. Kies in het Instellingen ('Control Panel') scherm voor het pakket dat je wilt verwijderen, of maak gebruik van de installatie CD. Die biedt vaak ook een verwijder-optie.
Deze standaard methodes laten vaak restanten achter, zowel in de vorm van bestanden en mappen, als in de vorm van instellingen in het register. WAARSCHUWING: maak altijd een backup van het register voor je er in gaat rotzooien. Het register is cruciaal voor de goede werking van je PC.
Aangezien het verhaal zeer ingewikkeld is, ook al door de vele versies van NaturallySpeaking, verwijs ik naar het artikel How do I completely uninstall Dragon NaturallySpeaking? in de ScanSoft knowledgebase. In punt 5 noemen ze 1 register key niet, die mogelijk ook belangrijk kan zijn:
HKEY_LOCAL_MACHINE\Software\Voice
Er is een gratis tool die je kan helpen bij het schonen van het register: jv16 powertools.