In maart 2003 kwamen de Engelstalige versies van NaturallySpeaking 7 uit. Vooruitlopend op de naderende Nederlandstalige uitvoering heb ik hier alvast wat informatie verzameld, zodat we straks goed beslagen ten ijs komen. Veranderingen en nieuwe features zijn zowel t.o.v. versie 5 als 6, omdat we in Nederland versie 6 hebben overgeslagen.
Ik heb op een Windows 2000 machine (2,4 GHz) met Preferred 5 versie 7 (ook Preferred) geinstalleerd. Ik gebruik een Plantronics SR-1 headset.
Na de installatie heb ik de PC opnieuw gestart. Als je dan NS 7 voor het eerst start krijg je de mogelijkheid om het lexicon te optimaliseren (op basis van bestanden in de map 'Mijn Documenten' en in je e-mail). Ik heb deze stap overgeslagen. Alle door mij aan NS 5 toegevoegde woorden zijn keurig meegenomen naar NS 7.
Als eerste wilde ik bekijken of alle opties in overeenstemming met mijn voorkeuren waren ingesteld. Helaas bevat de Nederlandse handleiding geen hoofdstuk met uitleg over de opties. In het Engelstalige manual (te downloaden van de site van Scansoft) is het hoofdstuk 14. Ook een uitgebreide lijst met opdrachten mist in de Nederlandse handleiding (Appendix A).
Vervolgens heb ik een paar zinnetjes gedicteerd. Aangezien ik betrekkelijk weinig gebruik heb gemaakt van DNS 5 is het voor mij moeilijk te beoordelen of de nauwkeurigheid veranderd is. Ik heb wel de indruk dat NS 7 behoorlijk snel reageert, maar dat kan ook liggen aan mijn nog maar een paar maanden oude PC.
Op het werk maak ik gebruik van een antiek 400 MHz systeem met Windows NT (Service Pack 6). De upgrade ging even voorspoedig als thuis. Helaas heb ik tijdens het dicteren een voor mij zeer irritant probleem. Als ik na een 'Corrigeer ...'-commando een keuze wil maken uit het lijstje, werkt het 'Kies <cijfer>'-commando niet. Dit lijkt veel op de beschrijving in technote 4046, maar de oplossing vind ik niet fijn. Die luidt nl. kort door de bocht: typen of spellen.
Iedereen heeft zijn eigen criteria om te bepalen of het pakket voldoende waar voor zijn geld biedt. Zo is de toevoeging van Natural Language Commands voor mij van geen betekenis, omdat ik bijna geen Microsoft produkten gebruik. Aan de andere kant ben ik heel blij met de Opdrachtencentrum (Command Browser), terwijl velen daar waarschijnlijk niet vaak naar zullen kijken.
Onderstaand enkele overwegingen:
N.B. Ik heb zelf nog niet het genoegen mogen smaken om met DNS 7 te werken. Het onderstaande is dus niet gebaseerd op eigen ervaringen.
De technotes waar ik aan refereer staan in de Scansoft knowledge base. Je kan ze vinden door in het zoekvenster het betreffende nummer in te tikken.
Als laatste fase bij het invoeren van een nieuwe gebruiker (speelt dus waarschijnlijk niet bij een upgrade) worden (optioneel) de documenten in de map 'Mijn Documenten' geanalyseerd. Als de map leeg is of vreemde/corrupte documenten bevat, kan o.a. de installatie blijven hangen (technote 4288). Ook is het belangrijk dat de map niet veel documenten bevat die niet door jezelf zijn geschreven. Sla deze fase over, of controleer vooraf de inhoud van de map.
Als de gebruikersnaam een punt ('.') bevat kan de upgrade mislukken (technote 4493). Wijzig voor de upgrade de naam.
Professional: Als de gebruikersnaam een plusteken ('+') bevat worden zelfgemaakte (als ik het goed begrijp) commando's niet meegenomen bij een upgrade. Dit is na de upgrade nog recht te breien, maar je kan ook vooraf de naam wijzigen (technote 4283).
Onder Windows XP, 2000 en NT heb je Administrator rechten nodig om NaturallySpeaking te kunnen installeren (technote 4116).
Een upgrade vanaf NaturallySpeaking 4 of lager is niet mogelijk (technote 3022). Je kan in dat geval het beste de zelf toegevoegde woorden veilig stellen met de utility Getwords. Nadat je een nieuwe gebruiker hebt gemaakt in NS 7 kan je woorden weer importeren.
WordPerfect versies 9 en lager worden niet ondersteund door NS 7 (technote 4211). Waarschijnlijk kan je wel dicteren in deze versies, maar er zijn geen speciale commando's voor gemaakt, en Select-and-Say werkt mogelijk niet correct.
Outlook 97 wordt niet ondersteund (technote 4487). Echter, zelfs op mijn werk, waar we meestal mijlenver achter lopen bij de ontwikkelingen, zitten we al op Outlook 2000.
Het upgraden van de huidige versie van NaturallySpeaking op je PC, zonder die eerst te deinstalleren, is zeker mogelijk. Verschillende mensen hebben echter gerapporteerd dat problemen die in versie 7 zijn opgelost, dan toch nog optreden. Sommige verbeteringen in versie 7 werken juist niet als er een upgrade gedaan is. Als je het werk er voor over hebt, is het waarschijnlijk beter om je PC volledig (inclusief registervermeldingen e.d.) te ontdoen van NaturallySpeaking, en dan pas de nieuwe versie te installeren.
Belangrijk: er is een groot verschil in de werking van Select-and-Say met DNS 5! In versie 5 werden de spraakbestanden alleen aangepast als je fouten verbeterde met correctiecommando's. In versie 7 gebeurt dat soms ook bij het gebruik van Select-and-Say. NaturallySpeaking bepaalt dat zelf, op grond van hoe sterk zijn oorspronkelijke interpretatie afwijkt van wat je als verbetering ingetikt of gedicteerd hebt. Als het verschil klein is, beschouwt NS 7 het als een correctie (hij leert er van)! Ik leg het allemaal nog uitgebreider uit op de Dragon pagina.
Belangrijk: de vocabulary optimizer (hoe gaan ze dat in het Nederlands noemen: lexicon optimaliseerder?) is de opvolger van de vocabulary builder (lexicon bouwer). In het manual wordt aangeraden dit programma regelmatig uit te voeren. De vocabulary optimizer kijkt echter alleen maar in de map 'Mijn Documenten', en er zijn enige problemen over gerapporteerd. Mijn advies is om voor het uitvoeren van de voc. optimizer je spraakbestanden te backuppen. Verder is de gouwe ouwe voc. builder nog steeds aanwezig (en schijnt goed te werken), alleen niet bereikbaar vanuit NaturallySpeaking. Zoek in de Dragon mappen naar vocbldr.exe.
De macro's die je gemaakt hebt in versie 5 kan je meenemen via Opdrachtencentrum (Command Browser), Manage, Import.
Van geimporteerde commando's wordt de parameter van het Wait-commando nog steeds geinterpreteerd als millisecondes. In nieuwe macro's is dat veranderd in secondes.
HeardWord commando's leveren bij het importeren waarschijnlijk de nodige waarschuwingen op. Ik heb hier geen verdere informatie over.
DVC files kan je copieren en dan importeren in versie 7. Als de import procedure vraagt of je bestaande commando's wilt overschrijven kan je het beste kiezen voor 'nee'. Dan blijven de meegeleverde macro's tenminste intact. Als er problemen ontstaan bij het importeren kan je proberen de macro's in kleine groepjes te importeren, totdat je ontdekt waar het probleem zit.
Er is een 'Opdrachtencentrum (Command Browser)', waarmee je de lijst van toegestane commando's kan bekijken (net als vroeger in DragonDictate). T.o.v. versie 6 schijnt deze browser niet zo plezierig te werken.
Er zijn weer verschillende modes, zoals 'command mode' en 'dictation mode'. Als je bv. weet dat je voorlopig alleen commando's (zoals 'ga 3 woorden naar links') zult gebruiken is 'command mode' handig, omdat je niet het risico loopt dat NaturallySpeaking het commando als dictaat opvat en opschrijft.
Je kan Natural Punctuation aanzetten. Dat houdt in dat je punten, komma's e.d. niet meer hoeft uit te spreken, maar dat NaturallySpeaking ze zelf op de goede plaatsen probeert toe te voegen. Dit feature verkeert waarschijnlijk nog meer in een experimenteerstadium dan dat het echt goed werkt.
In zowel Internet Explorer als Eudora (dus waarschijnlijk alle mailprogramma's) zorgt het 'click text'-commando er voor dat tekst links genummerd worden. Je kan ze vervolgens makkelijk activeren.
Je kan een deel van de commando's exporteren en importeren in XML formaat. Waarschijnlijk gaat het alleen om de commando's in MYCMDS.DAT. Op de site van Scansoft staat de zgn. Document Type Definition van zo'n XML file.
De uitgesproken 1 leidt default blijkbaar tot 'one', in tegenstelling tot in eerdere versies. Als je perse het cijfer 1 wilt, moet je 'numeral one' zeggen. Deze keuze van de programmeurs is niet onlogisch, omdat je geen mogelijkheid hebt om de geschreven versie te forceren. Het bovenstaande geldt alleen voor de getallen 1 t/m 9. Als je weet dat je vaak bv. '4.' dicteert, en je wilt niet 'vier.', dan kan je een nieuw term definieren (geschreven/gesproken): "4./vier punt".
In de Engelstalige versie kan je via Tools, Options, Formatting uitschakelen dat uitdrukkingen als "I am" worden samengetrokken tot "I'm". In sommige uitvoeringen schijnt dit meer problemen op te leveren dan het voordeel waard is.
In het correctievenster kan je niet meer zeggen 'Kies nummer 2', maar alleen nog 'Kies 2'.
Als je veel met spraakherkenning Excel bestuurt, kan je misschien beter niet overstappen op DNS 7. Elders meer over de combinatie Excel/NaturallySpeaking.
Als je de titel van bv. een boek of een film dicteert, zoals "De Grote Verhalen", dan loop je kans dat de woorden 'Grote' en 'Verhalen' aan het lexicon worden toegevoegd (het is me niet helemaal duidelijk of Select-and-Say hierbij een rol speelt). De volgende keren krijg je 'grote' steeds met een hoofdletter.
DNS 7 is aangepast aan een nieuwe versie van MSAA (Microsoft Active Accessability), nl. 1.3. Hierdoor zal correctie waarschijnlijk in minder applicaties werken dan eerst. Een van de 'slachtoffers' is Mozilla (de beste browser die er bestaat, zeker voor mensen met RSI).
In Internet Explorer moet je de naam van de link volledig uitspreken. In eerdere versies waren een aantal woorden voldoende.
In Internet Explorer werken de commando's 'Favorite ...' en
'Go to favorite ...' niet meer.
Dit is op te lossen door de favorieten te copieren naar een
nieuwe submap van Start Menu/Programs.
Aangezien de favorietenlijst doorgaans regelmatig wijzigt,
zou je het beste een .BAT file kunnen maken die het automatisch
doet bij het starten van Windows.
Vanaf Service Pack 1 is dit probleem verholpen.
De Vocabulary Optimizer kijkt alleen naar documenten in de map 'My Documents'. Onder sommige Windows versies (2003?!) lijkt hij zelfs helemaal niets te zien, en het is ook niet helemaal duidelijk of de documenten perse in submappen van 'My Documents' moeten zitten.
Nog een nadeel is dat de woorden die gevonden zijn in de geanalyseerde documenten niet gesorteerd kunnen worden op frequentie. Ze kunnen ook niet allemaal in 1 keer gedeselecteerd worden.
Overigens is de voorganger 'vocbldr.exe' nog steeds te gebruiken. Het is niet mogelijk om een shortcut ervan op de desktop te zetten, wel het complete programma. (Een andere bron zegt dat het met een shortcut wel werkt.)
De analysefase gaat in beide gevallen zo snel, dat mensen nauwelijks kunnen geloven dat er echt iets gebeurd is. Waarschijnlijk gebeurt er dus ook niet echt veel.
In tegenstelling tot in eerdere versies, kunnen e-mails in Outlook Express geanalyseerd worden.
Larry Allen heeft op zijn site een ontzettend mooie, overzichtelijke lijst gezet van bekende problemen. Elk probleem heeft een link naar de knowledgebase van Scansoft.
Als je een foute herkenning wilt corrigeren met 'Correct that'
(Corrigeer dat) wordt de tekst soms op de verkeerde plaats gezet.
Door het oproepen van de correctiedialoog verspringt de cursor
om een of andere duistere reden.
Het is nog onduidelijk wat de onderliggende condities zijn.
Een workaround zou kunnen zijn om 'Selecteer' te gebruiken i.p.v. 'Corrigeer'.
Dit probleem is niet opgelost in SR1.
Uit verschillende bronnen wordt gerapporteerd dat de Acoustic Optimizer een enkele keer zorgt voor problemen. Aan het begin wordt soms een extreem hoge geschatte benodigde tijd gemeld, en na afloop werken allerlei commando's niet meer. Exporteer daarom vooraf de nog goed werkende gebruiker!
Het lijkt er op dat de Acoustic Optimizer soms woorden weer toevoegt, die je daarvoor uit het lexicon had verwijderd. Het gaat daarbij niet om zelf gecreëerde woorden, maar om woorden die standaard aanwezig zijn.
De Acoustic Optimizer zorgt er voor dat .DRA files worden opgeruimd, als de maximaal aangegeven grens is bereikt (het absolute maximum is 120 MB). Als je de Acoustic Optimizer niet draait, vanwege bovenstaand probleem, dan loopt je harde schijf snel vol: 1.5 MB per minuut dictaat.
Als je met de lexiconbewerker (vocabulary editor) termen toevoegt waarvan de gesproken vorm uit meer dan 1 woord bestaat, dan worden er soms allerlei rare combinaties aan het lexicon toegevoegd. Voorbeeld: iemand had toegevoegd (geschreven/gesproken) "version 5/version five", maar had later ook als bonus "5/version". De nieuwe term schijnt de default eigenschappen te krijgen.
In o.a. Wordpad en DragonPad ontbreken commando's om de cursor een aantal regels/paragrafen te verplaatsen, of om er een aantal te selecteren. Waarschijnlijk is dit een vergissing van de programmeurs. Een workaround is de betreffende commando's uit versie 5 te exporteren, en ze in versie 7 te importeren.
Dicteren van een getal als 2.234 geeft (soms, altijd???) "2.2 34".
Opgelost in SP1.
Als je een woord corrigeert dat voor een komma staat, wordt er een
extra spatie toegevoegd.
Niet opgelost in SP1!
Commando's zoals 'Plak dat' worden onder water vertaald in een toetscombinatie,
in dit geval Ctrl+V.
De toetscombinaties die een Ctrl-toets bevatten leveren in Microsoft
Word niet altijd het gewenste resultaat op (maar in plaats daarvan bv. een
vierkantje).
Niet opgelost in SP1!
Niet echt een bug, maar wel ongelooflijk irritant: het starten van de Opdrachtencentrum (Command Browser) duurt op de meest geavanceerde computer die je maar kunt bedenken nog 15 seconden.
Bij enkele tientallen procenten gebruikers is NaturallySpeaking niet vooruit te branden. Dit verschijnsel lijkt pas op te treden na een aantal weken intensief gebruik. Onmiddellijk na het installeren is versie 7 veel sneller dan versie 6, maar na enige tijd kan dat teruglopen tot wel 4 keer zo langzaam. NS 7 heeft dan bv. 15 seconden nodig om 22 woorden te typen (aldus KnowBrainer, iemand die verzamelingen macro's maakt en verkoopt voor de Pro-uitvoering).
De "Wissel naar" commando's ('Wissel naar vorig venster', etc.) doen een 'Restore' ('Herstellen' in het Nederlands??) van het venster waar je naar toe gaat.Half september 2003 is Service Pack 1 uitgekomen voor de Engelstalige versie van NaturallySpeaking 7, die daarmee wordt opgewaardeerd naar versie 7.2. Het lijkt erop dat in de Nederlandstalige versies (7.1) het Service Pack al is geintegreerd.
De gebruikersbestanden worden op andere plaatsen neergezet!
Bij 1 gebruiker ging de installatie halverwege fout. DNS 7 was echter ook onbruikbaar geworden. Bij minstens 2 andere gebruikers heeft SP1 geleid tot meer problemen dan daarvoor. Maak dus bij elke belangrijke overgang vooraf backups!
Na de installatie van het service pack waren bij iemand de registry keys van een Spaanse en een Italiaanse versie van DNS 4 verwoest.
Bij de bugs die al in DNS 7 zaten en in de vorige sectie beschreven staan, heb ik bij elke bug vermeld of hij is opgelost in dit service pack.
Ik weet niet of dit echt een bug is, maar het is niet langer mogelijk om iets met TTS te doen vanuit een macro ('advanced scripting').
Het commando "mouse double-click" werkt niet meer. Ook "ButtonClick 1,2" in een macro doet niets. Larry Allen heeft op zijn site een macro staan om het probleem voor Professional gebruikers op te lossen.
Na een vraagteken ('?') begint het volgende woord soms niet met een hoofdletter. Het is niet zeker of dit probleem pas in SP1 is ontstaan.
Iemand heeft perioden waarin het processorgebruik 99% is, blijkbaar door DNS. Bij het afsluiten, of overschakelen naar een andere gebruiker, krijgt hij regelmatig het Blue Screen of Death. Hij gebruikt Windows 2000, wat het extra ongewoon maakt.