top of page
konnichiwa_edit.jpg
PREFACE

音声を加工して聞きやすくする
Process the speech signal to make it easier to understand

音声は人間にとって最も自然で便利なコミュニケーション手段です。最近は音声を用いて人とコンピュータとが情報をやり取りする音声インターフェースを備えた機器が増えてきました。しかし音声を聞く人の聴取能力には個人差があります。したがって音声を加工してその人の聴取能力に合わせて聞きやすくすることで、情報を正確かつ効率的に獲得できるようになると考えます。ここではそのような試みを行う音声信号処理のWindowsアプリケーションをいくつか紹介します。
Voice is the most natural and convenient means of communication for humans. Recently, more and more devices are equipped with voice interfaces that allow people and computers to exchange information using voice. However, there are individual differences in the hearing ability of people who listen to voice. Therefore, we believe that information can be acquired accurately and efficiently by processing the voice to make it easier to listen to according to the listening ability of the person. In this section, we will introduce some Windows applications for speech signal processing that attempt to do so.

MENU

​音声信号処理アプリケーション一覧

​LINEUP OF AUDIO SIGNAL PROCESSING APPLICATION

​アプリケーション APPLICATIONS

 1.音声速度変換    TIME SCALE MODIFICATION OF SPEECH  SIGNAL   

 2.ピッチ変換     PITCH CONVERSION                 

 3.雑音抑圧      NOISE SUPPRESSION

 4.残響抑圧      ENHANCEMENT OF REVERBERATED SPEECH SIGNAL 

 5.高域強調      HIGH-FREQUENCY EMPHASIS            

 6.子音強調      CONSONANT ENHANCEMENT            

 7.フォルマント強調     FORMANT ENHANCEMENT                                        

 8.ダイナミックレンジ圧縮 DYNAMIC RANGE COMPRESSION        

 9.音声区間検出    VOICE ACTIVITY DETECTION

10.背景音抑圧          BACKGROUND SOUND SUPPRESSION            

11.音源分離      BLIND SOURCE SEPARATION                                            

ツール TOOLS

 1.ボイスレコーダー    VOICE RECORDER              

 2.ステレオ/モノラル変換 CONVERSION FROM STEREO TO MONAURAL

 3.モノラル/ステレオ変換 CONVERSION FROM MONAURAL TO STEREO

 4.​サンプリング周波数変換 SAMPLING FREQUENCY CONVERSION   ​ 

 5.WAVファイルフォーマット表示   WAV FILE FORMAT DISPLAY         

 6.周波数分析          SPECTRAL ANALYSIS                                   

 7.3次元周波数分析                SPECTRAL ANALYSIS IN 3 DIMENSION            

 8.実時間3次元周波数分析     REAL-TIME 3-D SPECTRAL ANALYSIS               

 9.ケプストラム分析    CEPSTRAL ANALYSIS             

10.実時間ケプストラム分析    REAL-TIME CEPSTRAL ANALYSIS                    

11.グラフィックイコライザ GRAPHIC EQUALIZER               

おまけ SUPPLEMENT

 1.声質変換          VOICE CHANGER              ​ 

 2.周波数帯域拡張            BANDWIDTH EXTENSION OF AUDIO SIGNALS 

APPLICATIONS

音声信号処理アプリケーション
APPLICATIONS IN AUDIO SIGNAL PROCESSING

TSM

​1.​音声速度変換

       TIME SCALE MODIFICATION OF SPEECH SIGNAL

​音の高さを変えずに再生時間を伸縮します。

Speeding up or slowing down a sound without affecting the frequency content.

PC

​2.ピッチ変換

    PITCH CONVERSION

再生時間を変えずに音の高さを上下させます。

Pitch shifting of a sound without affecting the time content.

NS

​​3.雑音抑圧

    NOISE SUPPRESSION

​​雑音が重畳した音声から雑音を低減することで、S/N比を改善します。

Improves the signal-to-noise ratio by reducing only noise from noisy  speech.

DR

4.残響抑圧
ENHANCEMENT OF REVERBERATED SPEECH SIGNAL

残響のある部屋で録音された音声から残響を低減します。
Derverberation of speech signal that is recorded in a reverberant room.

HFE

5.高域強調
HIGH-FREQUENCY EMPHASIS

音声の高い周波数成分は低い周波数成分に比べて振幅が小さく、かつ加齢とともに聞こえにくくなるので、この部分を強めることで聞こえやすさを改善します。

Since the higher frequency components of speech have smaller amplitudes than the lower frequency components and become harder to hear with age, strengthening this part of the voice improves the ease of hearing.

CE

​6.​子音強調

    CONSONANT ENHANCEMENT

​子音と母音から構成される音声において、子音の振幅を大きくすることで、母音から子音への聴覚マスキングを低減して明瞭度を改善します。

In speech consisting of consonants and vowels, increasing the amplitude of consonants improves intelligibility by reducing the auditory masking from vowel to consonant.

FE

​7.​フォルマント強調
    FORMANT ENHANCEMENT

​音声知覚にとって重要なパラメータであるホルマント周波数の信号成分を強調します。

It emphasizes the signal component of the formant frequency, an important parameter for speech perception.

DRC

​8.​ダイナミックレンジ圧縮
    DYNAMIC RANGE COMPRESSION

​最大音と最小音との音量差を小さくすることで、小さい音が大きい音に埋もれて聞こえにくくなることを防ぎます。

By reducing the difference in volume between the loudest and the quietest sounds, it prevents the quieter sounds from being overshadowed by the louder ones and becoming difficult to hear.

VAD

​9.​音声区間検出
    VOICE ACTIVITY DETECTION

​入力信号から音声信号が含まれる区間を検出することで、音声信号処理を効果的または効率的に行います。

Effective or efficient speech signal processing is performed by detecting sections of the input signal that contain voice signals.

BSS

​11.​音源分離
    BLIND SOURCE SEPARATION

​2つの音源から発生した音を2本のマイクロホンで収音する時に生じるクロストーク(漏話)を低減して分離度を改善します。

It improves separation by reducing crosstalk that occurs when two microphones are used to capture sound generated by two sound sources.

​10.背景​音抑圧
    BACKGROUND SOUND SUPPRESSION

​ステレオ信号において、音声が中央に定位していない区間には背景音のみが存在すると仮定し、その区間の振幅を抑圧することで、うるささを低減します。

In a stereo signal, it is assumed that only background sound exists in the section where the voice is not localized in the center, and the amplitude of that section is suppressed to reduce the noisiness.

BGSS
TOOLS

音声信号処理ツール

AUDIO SIGNAL PROCESSING TOOLS

VR

1.ボイスレコーダー

​​ VOICE RECORDER

​マイクロホンから入力した音声をWAVファイルに変換して保存します。​得られたWAVファイルを各種音声信号処理の入力とすることができます。

Converts audio input from a microphone into a WAV file and saves it. The resulting WAV file can be used as input for above audio signal processing.

S2M

2.ステレオ/モノラル変換

​​ CONVERSION FROM STEREO TO MONAURAL

​WAVファイルのチャンネル数をステレオからモノラルに変換します。

Converts the number of channels in a WAV file from stereo to monaural.

M2S

3.モノラル/ステレオ変換

​​ CONVERSION FROM MONAURAL TO STEREO

​WAVファイルのチャンネル数をモノラルからステレオに変換します。

Converts the number of channels in a WAV file from monaural to stereo.

SC

4.サンプリング周波数変換

​​ SAMPLING FREQUENCY CONVERSION

​WAVファイルのサンプリング周波数を変更します。

Changes the sampling frequency of the WAV file.

5.WAVファイルフォーマット表示

​​ WAV FILE FORMAT DISPLAY

​WAVファイルのフォーマット情報を表示します。

Displays WAV file format information.

WAV
SP

6.周波数分析
​​ SPECTRAL ANALYSIS

​WAVファイルに記録されている時間軸波形を周波数軸に変換して表示します。

スペクトログラムだけでなく、メルスペクトログラムとケプストラムを表示することもできます。

Converts the time-axis waveform recorded in the WAV file to the frequency axis and displays it.

In addition to the spectrogram, the mel spectrogram and cepstrum can also be displayed.

SP3D

7.3次元周波数分析
​​ SPECTRAL ANALYSIS IN THREE DIMENSION

​WAVファイルに記録されている時間軸波形を周波数軸に変換して3次元表示します。

Converts time-axis waveform recorded in WAV file to frequency axis and displays it in three dimension.

SP3DR

8.実時間3次元周波数分析
​​ REAL-TIME 3-D SPECTRAL ANALYSIS

​マイクロホンから入力した信号を実時間で周波数軸に変換して3次元表示します。

The signal input from the microphone is converted to a frequency axis in real time and display it in three dimension.

CEP

9.ケプストラム分析
​​ CEPSTRAL ANALYSIS

WAVファイルに記録されている時間軸波形をケプストラム分析し、スペクトル包絡と微細構造を周波数軸上で表示します。

ケプストラムだけでなく、LPCスペクトラムを表示することもできます。

Cepstral analysis of time-axis waveforms recorded in WAV files is performed to display spectral envelope and fine structure on the frequency axis.

In addition to the cepstrum, the LPC spectrum can also be displayed.

CEP.jpg
CEPR

10.実時間ケプストラム分析
​​ REAL-TIME CEPSTRAL ANALYSIS

​マイクロホンから入力した信号を実時間でケプストラム分析し、スペクトル包絡と微細構造を周波数軸上で表示します。

ケプストラムだけでなく、LPCスペクトラムを表示することもできます。

Cepstral analysis of the signal input from the microphone is performed in real time to display the spectral envelope and fine structure on the frequency axis.

In addition to the cepstrum, the LPC spectrum can also be displayed.

11.グラフィックイコライザ
​​ GRAPHIC EQUALIZER

​入力信号を1オクターブ毎の周波数帯域に分割し、それぞれの利得を増減することで周波数特性を変えて音質を調整します。

The input signal is divided into frequency bands of one octave each, and the frequency characteristics are changed by increasing or decreasing the gain of each band to adjust the sound quality.

GEQ
SUPPLEMENT

おまけ

SUPPLEMENT​

VC

1.声質変換

​​ VOICE CHANGER

空気よりも音速の速いヘリウムガスを吸って発声すると、共振周波数が高い周波数にシフトして音色が変化する現象を模擬します。
When helium gas, which has a faster speed of sound than air, is inhaled and vocalized, the resonance frequency shifts to a higher frequency and the tone changes. This software simulates such phenomenon.

BWE

2.周波数帯域拡張
​​ BANDWIDTH EXTENSION OF AUDIO SIGNALS

​WAVファイルのサンプリング周波数を2倍にし、拡張された周波数帯域に高調波を加算します。

Adds harmonics to the frequency band extended by doubling the sampling frequency of the WAV file.

よくある問い合わせ

FREQUENTLY ASKED QUESTIONS

ソースコードは開示しないのでしょうか。

WILL THE SOURCE CODE BE DISCLOSED?

ソースコードを開示する予定はありません。

We do not plan to disclose the source code.

アプリケーションのアップデート頻度を教えてください。
HOW OFTEN IS THE APPLICATION UPDATED?

気が付いたりご指摘をいただいた不具合の修正や機能の改善を可能な範囲で適宜、予告なく行います。
I will fix defects that we notice or that are pointed out to me and improve the functionality of the site as appropriate to the extent possible and without notice.

ファイルをダウンロードできません。
UNABLE TO DOWNLOAD FILE.

Microsoft Edgeのセキュリティ機能によって「*.zipは Microsoft Edge によってブロックされました」のメッセージが表示される場合、下記の操作を行ってください。

1.画面右上の「*.zipは Microsoft Edge によってブロックされました」にマウスポインターを移動。

2.「・・・」→「保存」ボタンの順にクリック。

3.「保持する」をクリック。

4.「名前を付けて保存」→「保存(s)」ボタンの順にクリック。

5.「*.zipは一般的にダウンロードされていません」にマウスポインターを移動。

6.「・・・」→「保存」ボタンの順にクリック。

7.「*.zipを開く前に、信頼できることを確認してください」と表示されるので「詳細表示▽」をクリック。

8.「保持する」をクリック。

9.「*.zipは一般的にダウンロードされていません」のメッセージが消えていることを確認。

10.ダウンロードフォルダに*.zipが保存されていることを確認。

なお、この手順は使用されているブラウザやそのバージョンにより異なりますので、適宜対応してください。

If you are blocked from downloading by browser's security features, please find a workaround accordingly.

お問い合わせ

送信が完了しました。

掲載しているアプリケーションのご利用にあたって

掲載しているアプリケーションは、ご自由に利用いただいてかまいませんが、以下の点にご注意ください。

  • 掲載している内容については、動作保障を含めていかなる保障もいたしません。

  • アプリケーションを利用して発生した、いかなる損害も、作者は責任を負いません。

  • 作者は、アプリケーションに対する不具合の改修および、機能改善のためのバージョンアップの義務を負いません。

  • 作者は、アプリケーションに対する、いかなるサポートの義務を負いません。

  • 掲載しているアプリケーションの著作権は放棄いたしません。著作権は作者にあります。

  • 掲載しているアプリケーションを、そのまま再配布するときは、事前に作者の許可が必要です。

​開発環境

  • Borland C++ Compiler 5.5

  • Visual Studio 2019

  • ​Windows10

©2021 by 音声信号処理アプリ。Wix.com で作成されました。

bottom of page