Akademik

РЕЧЬ

РЕЧЬ: в акустике, последовательность звуков речи, произносимых, как правило, слитно, с паузами только после отд. слов или групп звуков. Слитность произношения звуков Р., вследствие непрерывности движений артикуляц. органов Р., вызывает взаимное влияние смежных звуков друг на друга. Артикуляц. органы имеют неодинаковые размеры у разных людей, и каждому человеку свойственна своя манера произнесения звуков Р., поэтому звуки Р. каждого человека имеют индивидуальный характер. Но при всём их многообразии они явл. физ. реализациями (произнесением) небольшого числа фонем (наименьшая звук. единица данного языка, существующая в Р. в целом ряде конкретных звуков). В русской Р. их насчитывается 41:6 гласных («а», «о», «у», «э», «и», «ы»), 3 твёрдых согласных («ш», «ж», «ц»), 2 мягких («ч», «и») и 15 в твёрдом и мягком видах; звуки Р. «я», «ю», «е», «ё» относятся к составным («йа», «йу», «йэ», «йо»).

Звуки Р. неодинаково информативны. Так, гласные звуки содержат малую информацию о смысле Р., а согласные наиболее информативны. Напр., в слове «посылка»: последовательность «о. ы. а» ничего не говорит, а — «п. с. лк.» даёт почти однозначный ответ о смысле слова. Точность передачи Р. (напр., в системах связи) оценивают с помощью артикуляц. метода: передают набор элементов Р. (напр., слов или слогов), отражающий состав звуков Р. данного языка, и определяют относит. кол-во принятых элементов. Разборчивость Р. при этом в значит. мере определяется разборчивостью глухих согласных.

Импульсы потока воздуха, создаваемые голосовыми связками при произнесении звонких звуков Р., с достаточной точностью могут считаться периодическими. Соответствующий период колебаний наз. периодом осн. тона голоса, а обратная величина — частотой осн. тона (она лежит обычно в пределах от 70 до 450 Гц). При произнесении звуков Р. частота осн. тона изменяется. Это изменение наз. интонацией. У каждого человека свой диапазон изменения осн. тона (обычно немного более октавы) и своя интонация. Последняя имеет большое значение для узнаваемости голоса. Импульсы осн. тона имеют пилообразную форму, и поэтому при их периодич. повторении получается дискретный спектр с большим числом обертонов, или гармоник. При произнесении взрывных и щелевых звуков Р. поток воздуха проталкивается через узкие участки (щели) речевого тракта, поэтому образуются завихрения, создающие шумы с широкополосным сплошным спектром. Т. о., при произнесении Р. через речевой тракт проходит сигнал с тональным или шумовым, или с тем и др. спектром.

Речевой тракт представляет собой сложный акустич. фильтр с рядом резонансных полостей, создаваемых артикуляц. органами Р., поэтому выходной сигнал, т. е. произносимая Р., имеет спектр с огибающей сложной волнообразной формы (рис.).

Спектр. огибающая фонемы «з»: 1—4 — форманты, 5,6 — антиформанты.

Максимумы концентрации энергии в спектре звука Р. наз. формантами, а резкие провалы — антиформантами. В речевом тракте для каждого звука Р. есть свои резонансы и антирезонансы, поэтому спектр. огибающие этого звука имеют индивидуальную форму. Для большинства гласных звуков Р. характерно своё расположение формант и соотношение их уровней; для согласных важен также ход изменения формант во времени (формантные переходы).

Звонкие звуки Р., особенно гласные, имеют высокий уровень интенсивности, глухие — самый низкий. Поэтому при произнесении Р. громкость её непрерывно изменяется, особенно резко при произнесении взрывных звуков. Диапазон уровней Р. находится в пределах 35—45 дБ. Гласные звуки Р. имеют длительность в среднем ок. 0,15 с, согласные — ок. 0,08 с, звук «п» — ок. 0,03 с.

Образование звуков Р. происходит в результате подачи команд в виде электрич. биосигналов мышцам артикуляц. органов Р. от речевого центра мозга. Этих сигналов не более 10, при этом они изменяются медленно (в темпе смены звуков Р., т. е. от 5 до 20 звуков в с), поэтому общий поток этих сигналов составляет до 100 информац. единиц (бит/с), тогда как весь речевой сигнал имеет поток в 1000 раз больше. Объясняется это тем, что речевой сигнал представляет собой своего рода модулир. широкополосную несущую (см. МОДУЛЯЦИЯ КОЛЕБАНИЙ). Вся информация заключается в спектр. модуляции (в изменении формы огибающих спектра и уровня Р.), а в самой несущей информация о смысле Р. содержится только в интонации.

Осн. назначение Р.— передача информации от человека к человеку как при их непосредств. общении, так и с помощью средств связи. Т. к. для передачи натуральной Р. требуется пропускная способность тракта связи ок. 50000—70000 бит/с, то с целью её экономии и соответственно увеличения кол-ва возможных переговоров стремятся сжимать поток речевого сигнала на передающем конце тракта с последующим его расширением на приёмном конце. Напр., ослабляя уровень громких звуков Р., уменьшают разность уровней между громкими и слабыми звуками (сжимают динамич. диапазон). Также можно сжимать частотный диапазон речевого сигнала. Наконец, можно исключать из Р. участки сигнала, не несущие информации (средние участки длит. звуков), т. е. компрессировать Р. во времени. На приёмном конце соответственно восстанавливают диапазоны и заполняют исключённые участки звуков. Если отделить модулирующий сигнал от несущей, то потребуется ещё меньшая пропускная способность тракта связи для передачи Р. Подобную задачу в системах связи решают т. н. вокодеры.

В совр. исследованиях по общению человека с машиной решаются две проблемы: автоматич. управление машинами и процессами с помощью Р. (устный ввод в ЭВМ, автоматич. пишущая машинка и т. п.) и синтез Р. по разл. кодовым сигналам (устный вывод из ЭВМ, говорящие машины для чтения текста слепым и т. п.).

Исследования механизмов слухового и фонетич. анализа Р. относятся к акустике, психоакустике и фонетике.

РЕЧЬ

в акустике - последовательность звуков речи, произносимых, как правило, слитно, с паузами только после отд. слов или групп звуков. Слитность произношения звуков Р. вследствие непрерывности движений артикуляц. органов Р. вызывает взаимное влияние смежных звуков друг на друга. Артикуляц. органы имеют неодинаковые размеры у разных людей, и для каждого человекахарактерна своя манера произнесения звуков Р., поэтому звуки Р. каждогочеловека имеют индивидуальный характер. Но при всём многообразии звуковони являются физ. реализациями (произнесением) небольшого числа фонем (наименьшаязвуковая единица данного языка, существующая в Р. в целом ряде конкретныхзвуков). В русской Р. их насчитывается 41: 6 гласных («а», «о», «у», «и»,«ы», «э»), 3 твёрдые согласные («ш», «ж», «ц»), 2 мягкие («ч», «и») и 15в твёрдом и мягком видах; звуки Р. «я», «ю», «е», «ё» относятся к составным(«йа», «йу», «из», «йо»).

Звуки Р. неодинаково информативны. Точность передачи Р. (напр., в системахсвязи) оценивают с помощью артикуляц. метода: передают набор элементовР. (напр., слов или слогов), отражающий состав звуков Р. данного языка, и определяют относит. кол-во принятых элементов. Разборчивость Р. при этомв значит. мере определяется разборчивостью глухих согласных.

Импульсы потока воздуха, создаваемые голосовыми связками при произнесениизвонких звуков Р., с достаточной точностью могут считаться периодическими. Соответствующий период колебаний наз. периодом осн. тона голоса, а обратнаявеличина - частотой осн. тона (она лежит обычно в пределах от 70 до 450Гц). При произнесении звуков Р. частота осн. тона изменяется. Это изменениеназ. интонацией. У каждого человека свой диапазон изменения осн. тона (обычнонемного более октавы) и своя интонация. Последняя имеет большое значениедля узнаваемости голоса. Импульсы осн. тона имеют пилообразную форму, ипоэтому при их периодич. повторении получается дискретный спектр с большимчислом обертонов, или гармоник. При произнесении взрывных и щелевых звуковР. поток воздуха проталкивается через узкие участки (щели) речевого тракта, поэтому образуются завихрения, создающие шумы с широкополосным сплошнымспектром. Т. о., при произнесении Р. через речевой тракт проходит сигналс тональным, или шумовым, или с тем и др. спектром.

Речевой тракт представляет собой сложный акустич. фильтр с рядом резонансныхполостей, создаваемых; артикуляц. органами Р., поэтому выходной сигнал, т. е. произносимая Р., имеет спектр с огибающей сложной волнообразной формы(рис.). Максимумы концентрации энергии в спектре звука Р. наз. формантами, а резкие провалы - антиформантами. В речевом тракте для каждого звука Р. есть свои резонансы и антирезонансы, поэтому спектральные огибающие этогозвука имеют индивидуальную форму. Для большинства гласных звуков Р. характерносвоё расположение формант и соотношение их уровней; для согласных важентакже ход изменения формант во времени (формантные переходы).

Звонкие звуки Р., особенно гласные, имеют высокий уровень интенсивности, глухие - самый низкий. Поэтому при произнесении Р. громкость её непрерывноизменяется, особенно резко при произнесении взрывных звуков. Диапазон уровнейР. находится в пределах 35-45 дБ. Гласные звуки Р. имеют длительность всреднем ок. 0,15 с, согласные - ок. 0,08 с, звук «п» - ок. 0,03 с.

Образование звуков Р. происходит в результате подачи команд в виде электрич. биосигналов мышцам артикуляц. органов Р. от речевого центра мозга. Этихсигналов не более 10, они изменяются медленно (в темпе смены звуков Р.,т. е. от 5 до 20 звуков в секунду), и общий поток их составляет до 100информац. единиц (бит/с), тогда как весь речевой сигнал имеет поток в 1000раз больше. Объясняется это тем, что речевой сигнал представляет собойсвоего рода модулиров. широкополосную несущую (см. Модуляция колебаний). Вся информация заключается в спектральной модуляции (в измененииформы огибающих спектра и уровня Р.), а в самом несущем колебании информацияо смысле Р. содержится только в интонации.

Осн. назначение Р.- передача информации от человека к человеку как приих непосредств. общении, так и с помощью средств связи. Т. к. для передачинатуральной Р. требуется пропускная способность канала связи ок. 50 000-70000 бит/с, то с целью её экономии и соответственно увеличения кол-ва возможныхпереговоров стремятся сжимать поток речевого сигнала на передающем концеканала с последующим его расширением на приёмном конце. Напр., ослабляяуровень громких звуков Р., уменьшают разность уровней между громкими ислабыми звуками (сжимают динамич. диапазон). Так же можно сжимать частотныйдиапазон речевого сигнала. Наконец, можно исключить из Р. участки сигнала, не несущие информации (ср. участки длит. звуков), т. е. компрессироватьР. во времени. На приёмном конце соответственно восстанавливают диапазоныи заполняют исключённые участки звуков. Если отделить модулирующий сигналот несущей, то потребуется ещё меньшая пропускная способность канала связидля передачи Р. Подобную задачу в системах связи решают т. н. вокодеры.

В совр. исследованиях по общению человека с машиной решаются две проблемы:автоматич. управление машинами и процессами с помощью Р. (устный ввод вЭВМ, автоматич. пишущая машинка и т. п.) и синтез Р. по разд. кодовым сигналам(устный вывод из ЭВМ, говорящие машины для чтения текста слепым и т. п.).Исследования механизмов слухового и фонетич. анализа Р. относятся к акустике, психоакустике и фонетике.

Лит.: Сапожков М. А., Речевой сигнал в кибернетике и связи, М.,1963; Фант Г., Акустическая теория речеобразования, пер. с англ., М., 1964;Фланаган Д. Л., Анализ, синтез и восприятие речи, пер. с англ., М., 1968;Физиология речи. Восприятие речи человеком, Л., 1976. М. А. Сапожков.

Физическая энциклопедия. В 5-ти томах. — М.: Советская энциклопедия. Главный редактор А. М. Прохоров. 1988.