Software


Naar het begin van de pagina

De populairste spraakherkenningspakketten

Rond 2000 waren er 4 allround produkten van evenzoveel bedrijven:

Ergens in 2000 echter werd Dragon Systems overgenomen door het Belgische bedrijf Lernaut en Hauspie. De 2 productlijnen (Dragon NaturallySpeaking en VoiceXPress) zijn daarbij samengevoegd onder de eerste naam. Vervolgens is L&H failliet gegaan, en is een deel van het bedrijf overgenomen door Scansoft. FreeSpeech was een rampprodukt dat ergens rond 2002 ter ziele is gegaan.

Rond 2004 zijn de enige 2 serieuze softwarepakketten dus ViaVoice van IBM, en Dragon NaturallySpeaking van Scansoft. Helaas lijkt het eerste pakket ook tot de ondergang gedoemd. IBM heeft de verkoop uitbesteed aan concurrent Scansoft, en lijkt niet erg hard bezig te zijn met het ontwikkelen van nieuwe versies. Er is wel een nieuwe speler in opkomst, maar of we daar blij mee moeten zijn?! Het is Micro$oft, die spraakherkenning heeft geintegreerd in Office.

Sept. 2004: ik las iets over dat IBM spraakherkenningstechnologie ter beschikken gaat stellen van de open source gemeenschap, maar ik weet er nog niet het fijne van.


Naar het begin van de pagina

Welk pakket aanschaffen?

Een aantal criteria waar je bij het kopen van een pakket op kan letten zijn:

Op de site van Susan Fulton staat een zeer uitgebreide tabel waarin de eigenschappen van de pakketten worden vergeleken.

Freespeech

Deze sectie is eigenlijk alleen voor historische redenen interessant. Philips is nl. gestopt met het verkopen van Freespeech. Men maakt geen produkt meer dat rechtstreeks aan consumenten wordt verkocht, maar een pakket (SpeechMagic) dat door anderen kan worden gekocht en gebruikt om zelf software te ontwikkelen.

Van de mensen die ervaring hebben met meerdere pakketten zijn er weinig enthousiast over Freespeech. Ook in vergelijkende tests (bv. in tijdschriften) eindigt Freespeech vaak onderaan.

Ik heb zelf alleen ervaring met Freespeech 98. De trainingsfase is (alhoewel eenmalig) zeer langdurig en vervelend, het pakket is vrij traag en het aanbrengen van correcties gaat veel te moeizaam. De nieuwste versie (Freespeech 2000?!) ken ik niet.

ViaVoice

De meest recentie versie van ViaVoice is versie 10, in 4 verschillende uitvoeringen (Personal, Standard, Advanced en Pro USB).

ViaVoice schijnt qua herkenning nog net iets beter te zijn dan NaturallySpeaking, maar is niet volledig met de stem te besturen.

NaturallySpeaking

Dragon head NaturallySpeaking is mijn persoonlijke favoriet, zowel op grond van wat ik hoor als wat ik zelf ervaren heb (al heb ik nog niet zelf met ViaVoice gewerkt).

Een groot deel van deze site is gewijd aan Dragon produkten. Er is een algemene Dragon pagina, en verder o.a. pagina's over macro's, problemen, opties en instellingen (nogal technisch) en de nieuwste versie (7) van NaturallySpeaking.



Naar het begin van de pagina

Minimale systeemeisen

Bezuinig vooral niet op memory als je fatsoenlijk met spraakherkenning wil werken. Voor mij is 256 MB het absolute minimum. Op mijn systeem (met 1 GB, oftewel meer dan 1000 MB geheugen) daalt alleen al na het starten van NaturallySpeaking 7.1 het vrije geheugen met bijna 100 MB (misschien later nog meer?). En dan maak ik nog niet eens gebruik van wangedrochten als Microsoft Word (met 5000 overbodige functies).

Meer informatie over de apparatuur die je nodig hebt voor succesvol werken met spraakherkenning vind je op mijn pagina over hardware.


Naar het begin van de pagina

Andere interessante produkten

Game Commander

Game Commander is, zoals de naam al zegt, een pakket dat in eerste instantie bedoeld is om spelletjes mee te kunnen besturen. Midden 2001 kostte het slechts $29,95. Ik heb er nog niet mee geexperimenteerd, maar denk dat er veel dingen mee mogelijk zijn waar ik nu DragonDictate voor gebruik.

Shoot

Shoot is net als Game Commander hoofdzakelijk gemaakt voor het spelen van spellen. Het pakket is gratis, en hier verkrijgbaar. Nadeel is dat je er het .Net framework voor moet installeren. De complete download is 52 MB!

Microsoft spraakherkenning in Word

In de laatste versies van Microsoft Office (vanaf 2002), Word en Excel is spraakherkenning ingebouwd. Dit pakket verkeert nog in een onvolwassen stadium. De herkenning schijnt nog niet eens superslecht te zijn, maar de mogelijkheid om de omgeving met commando's te besturen is zeer beperkt. Na een korte pauze in het midden van de zin, of na een komma, produceert het pakket vaak een hoofdletter (opgelost in de 2003 versie?!).

Er zijn enkele fervente aanhangers van Microsoft SR, die menen dat het wat betreft dicteren zelfs het beste pakket is. Ga bv. eens kijken op de pagina's van Itamar Even-Zohar. Er is ook een mailing list gewijd aan MS SR.

Op de site van Microsoft zelf staat een goed artikel over het gebruik van spraakherkenning onder Windows XP. Je moet daarvoor minimaal Service Pack 1 geinstalleerd hebben. Een andere voorwaarde is dat je een pakket (Office, Word of Excel) hebt waar de SRE (Speech Recognition Engine) in geintegreerd is. Je kan de SRE echter ook krijgen (kopen) als onderdeel van Windows XP PLUS! Pack (ca. 30 dollar). De SRE is zelfs gratis te downloaden als onderdeel van de Microsoft Speech Software Development Kit 5.1, maar deze optie wordt alleen aanbevolen voor gevorderde gebruikers.

Als je met 1 van de betere pakketten, zoals Dragon NaturallySpeaking, werkt, dan kan je het beste de spraakherkenning van Word uitschakelen.


Naar het begin van de pagina

Spraakherkenning voor niet-Windows systemen

Macintosh

Er bestaat een pakket met de naam iListen, waar ik verder niets van weet. Meer informatie kan je ongetwijfeld krijgen via het Macintosh forum over spraakherkenning.

ViaVoice for Linux

Goed nieuws voor de Linux fans! Er bestaat (volgens mij ook nu nog) een versie van ViaVoice voor Linux. Net als de reguliere ViaVoice is het pakket Engelstalig. Of het echter makkelijk in Nederland te krijgen is...

Linux m.b.v. NaturallySpeaking

Iemand gebruikt Exceed (weet niet wat dat precies doet, geloof wel dat het duur is en verkrijgbaar bij Hummingbird) en VNC (gratis software om de ene PC vanaf de andere te besturen, ze mogen verschillende besturingssystemen hebben) om vanaf een PC waar Windows XP op draait, te programmeren in Linux m.b.v. NaturallySpeaking. VNC (Virtual Network Computing) wordt gemaakt door AT&T Laboratories Cambridge en is hier verkrijgbaar.


Naar het begin van de pagina

Valid XHTML 1.0!

© Henk Dalmolen
Reageer via E-mail (dalmolen@xs4all.nl)

Deze pagina is voor het laatst gewijzigd op: 6 november 2004