Hier zunächst ein akustisches Beispiel der mit Sprich synthetisierten Sprache:
Wie man hört, klingt das Ganze zwar recht abgehackt und monoton, ist aber nach etwas Gewöhnung durchaus verständlich.
Die (übrigens frei definierbare) Phonemsprache, mit der man das Programm als Textdatei oder interaktiv füttern muß, sieht folgendermaßen aus:
m i t 100 h i l f 3 100 d i s 3 z 100 p r o g r a m 3 z 100 k 3 n 3 n 100 s i: 100 i0 r 3 m 100 r ä c n 0 100 d a z 100 sch p r ä c 3 n 100 b ai b r i ng 3 n 500
d i: 100 ai n tz 3 l n 3 n 100 w 30 t 0 100 w äa d 3 n 100 d a b ai 100 au z 100 f o n e: m 3 n 100 tz u s a m 3 n g 3 s ä tz t 500
f o n e: m 3 100 s i n t 100 tz u m 100 b ai sch p i: l 100 w o k a: l 3 100 u n t 100 k 0 n s o n a n t 3 n 500
d a r au z 100 l a z 3 n 100 s i c 100 d a n 100 w 30 t 0 100 u n t 100 s ä tz 3 100 b i l d n
Die Zahlen wie 100 oder 500 sind dabei Pausen von 0,1 bzw. 0,5 Sekunden.
Hier nochmal der Originaltext zum Mitlesen, falls das o.g. Soundbeispiel tatsächlich nicht verständlich gewesen sein sollte:
Mit Hilfe dieses Programmes können Sie Ihrem Rechner das Sprechen beibringen.
Die einzelnen Wörter werden dabei aus Phonemen zusammengesetzt.
Phoneme sind zum Beispiel Vokale und Konsonanten.
Daraus lassen sich dann Wörter und Sätze bilden.
Die Verständlichkeit der Sprache ist bei Phonemsynthese natürlich eher bescheiden, was daran liegt, daß die Übergänge zwischen den einzelnen Phonemen oft sehr hart sind und die zusammengefügten Phoneme eigentlich nicht zusammenpassen. Aus diesem Grunde verwendeten spätere Sprachsynthese-Systeme das Verfahren der Diphonesynthese. Hierbei werden nicht einzelne Phoneme abgespeichert, sondern die Übergänge zwischen den Phonemen, und zwar in allen möglichen vorkommenden Kombinationen. Da es sehr viele solcher Kombinationen gibt (ca. 2500), müßte eine entsprechend große Sound-Datenbank angelegt werden. Damalige DOS-Rechner wären damit vermutlich überfordert gewesen.
Homepage > DOS-Museum > Sprich