Работа с Microsoft Speech API в Delphi
В ходе создания программного обеспечения возникает желание дополнить возможности создаваемого приложения голосовым интерфейсом. Если возможности распознания голоса ещё далеки от совершенства и простому программисту не по силам, то заставить ваше приложение весьма сносно заговорить может любой программист. Об этом позаботились специалисты Microsoft выпустив на рынок бесплатный ActiveX компонент TextToSpeech входящий в стандартную комплектацию WinMe и Win 2x. Если у Вас этого компонента нет Вам необходимо скачать и установить Microsoft Speech API 4.0 825 Кб и Lernout &Hauspie Text-To-Speech 2.9 Мб (русский мужской и женский голос.) Применение этого компонента позволяет значительно расширить функциональные возможности интерфейса создаваемой программы. Приятно когда программа говорит «человеческим голосом». Как пример моя программа общения по сети. Исходный текст прилагаю.. Рассмотрим пример применения Microsoft Speech API. Используем позднее связывание освобождающее программиста от написания лишнего кода и облегчающего в дальнейшем модификацию приложения. Для размещения ActiveX компонентов будем использовать универсальный класс-контейнер TAxControl, подробно описанный в книге «Delphi для профессионалов» авторы Александровский А.Д., Шубин В.В. unit axControl; { Класс-контейнер для ActiveX (компонента управления). } interface uses Windows, Messages, Classes, Controls, ActiveX, OleCtrls,StdCtrls; // ///******************************************************************** type TAxControl = class(TOleControl) // private CControlData : TControlData2; // Информация об ActiveX. protected procedure InitControlData; override; public property CData : TControlData2 read CControlData; constructor Create (AOwn : TComponent;AGUID : TGUID); end; implementation ////////////////////////////////////////////////////////////////////////////// constructor TAxControl. Create (AOwn : TComponent ;AGUID : TGUID); begin FillChar(CControlData,sizeof(CControlData),0); // Обнуляете поле с информацией об Active CControlData.ClassID :=AGUID; // Указываете QUID компонента,который будет создаваться. inherited Create (AOwn); // Вызываете конструктор предка. ControlStyle := ControlStyle + [csClickEvents]; // Стиль отображения end ; /////////////////////////////////////////////////////////////////////////////////// procedure TAxControl. InitControlData; begin ControlData := @CControlData; // Указываете адрес, где находится информация об ActiveX. end; Размещаем TextToSpeech на Delphi компонент Panel и устанавливаем стандартные свойства. В случае отсутствия данного компонента на Вашем компьютере, обрабатываем исключение связыванием с компонентом WebBrowser и запускаем скачивание данного компонента с http://activex.microsoft.com/activex/controls/sapi/spchapi.exe. Если же на вашем компьютере уже установлены компоненты, произойдёт инициализация TextToSpeech, который озвучит текущее время. var compon:TAxControl; Рассмотрим более подробно наиболее общие свойства и методы TextToSpeech: var Text:string; ... compon.OleObject.Speak(Text); //Произнести текст. В большинстве программ хватает этих свойств и методов. Но SpeechToText некоторые слова произносит некорректно. Для решения этой проблемы существует несколько путей:
Подключение словарей через вызов LexiconDlg, вручную, неудобно - библиотеку типов этого модуля, лично я, не нашел. Остаётся создание своего обработчика с вызовом методов: procedure TForm1.Button5Click(Sender: TObject); begin compon.OleObject.TextData(2,0,edit2.Text); //произнести фонемный код end; Используя фонетический алфавит Вы можете в широких пределах изменять произношение. SpeechAPI компонент удобен для любителей Web-программирования, так как поддерживает интерфейс IObjectSefety и соответственно безопасен для использования в сценариях JavaScript и VbScript. Пример использования в Web на сайте magdelphi.boom.ru
Страница сайта http://silicontaiga.ru
Оригинал находится по адресу http://silicontaiga.ru/home.asp?artId=6383 |