Description

【発明の属する技術分野】本発明は、音声信号を低いビットレートで高品質に符号化するための音声符号化装置に関するものである。 The present invention relates to relates to a speech coding apparatus for encoding high quality at a low bit rate speech signal.

【０００２】 [0002]

【従来の技術】音声信号を高能率に符号化する方式としては、例えば、Ｍ． 2. Description of the Related Art As methods of encoding a speech signal with high efficiency, for example, M.Ｓｃｈｒｏｅｄｅｒ ａｎｄ Ｂ． Schroeder and B.Ａｔａｌ氏による“Ｃｏｄｅ−ｅｘｃｉｔｅｄ ｌｉｎ Atal "by Mr. Code-excited linｅａｒｐｒｅｄｉｃｔｉｏｎ： Ｈｉｇｈ ｑｕａｌｉ earprediction: High qualiｔｙ ｓｐｅｅｃｈ ａｔｖｅｒｙ ｌｏｗ ｂｉｔ ty speech atvery low bitｒａｔｅｓ”（Ｐｒｏｃ．；ＩＣＡＳＳＰ，ｐｐ．９３ rates "(Proc;. ICASSP, pp.93７−９４０，１９８５年）と題した論文（文献１）や、 7-940, thesis titled 1985) (Ref. 1) and,Ｋｌｅｉｊｎ氏らによる“Ｉｍｐｒｏｖｅｄ ｓｐｅｅ By Kleijn et al "Improved speeｃｈ ｑｕａｌｉｔｙ ａｎｄ ｅｆｆｉｃｉｅｎｔ ch quality and efficientｖｅｃｔｏｒ ｑｕａｎｔｉｚａｔｉｏｎ ｉｎ ＳＥ vector quantization in SEＬＰ”（Ｐｒｏｃ．ＩＣＡＳＳＰ，ｐｐ．１５５−１５ LP "(Proc.ICASSP, pp.155-15８，１９８８年）と題した論文（文献２）などに記載されているＣＥＬＰ（Ｃｏｄｅ Ｅｘｃｉｔｅｄ Ｌｉｎ 8, 1988) entitled papers (CELP that is described in such literature 2) (Code Excited LinｅａｒＰｒｅｄｉｃｔｉｖｅ Ｃｏｄｉｎｇ）が知られている。 earPredictive Coding) is known.この従来例では、送信側では、フレーム毎（例えば２０ｍｓ）に音声信号から線形予測（ＬＰＣ）分析を用いて、音声信号のスペクトル特性を表すスペクトルパラメータを抽出する。 In this conventional example, on the transmission side, by using linear prediction (LPC) analysis from the speech signal for each frame (e.g. 20 ms), and extracts a spectrum parameter representing the spectrum characteristics of the speech signal.フレームをさらにサブフレーム（例えば５ｍｓ）に分割し、サブフレーム毎に過去の音源信号を基に適応コードブックにおけるパラメータ（ピッチ周期に対応する遅延パラメータとゲインパラメータ）を抽出し、適応コードブックにより前記サブフレームの音声信号をピッチ予測する。 Frame further divided into subframes (for example 5 ms), and extracting parameters (delay parameter and a gain parameter corresponding to a pitch period) in an adaptive codebook based on past excitation signal for each subframe, the an adaptive codebook the audio signal of the sub-frame to predict the pitch.ピッチ予測して求めた音源信号に対して、予め定められた種類の雑音信号からなる音源コードブック（ベクトル量子化コードブック） Against sound source signal obtained by the pitch prediction, excitation codebook of predetermined kinds of noise signals (vector quantization codebook)から最適な音源コードベクトルを選択し、最適なゲインを計算することにより、音源信号を量子化する。 Selecting an optimal excitation code vector from by calculating the optimum gain, quantizing the excitation signal.音源コードベクトルの選択の仕方は、選択した雑音信号により合成した信号と、前記残差信号との誤差電力を最小化するように行う。 Method of selecting the sound source code vector is performed so as to minimize the signal synthesized by the noise signal selected, the error power between the residual signal.そして、選択されたコードベクトルの種類を表すインデクスとゲインならびに、前記スペクトルパラメータと適応コードブックのパラメータをマルチプレクサ部により組み合わせて伝送する。 The index and gain which represents the type of the selected code vector and transmits the parameters of the adaptive codebook and the spectral parameter by combining the multiplexer unit.受信側の説明は省略する。 Description of the receiving side will be omitted.

【０００３】 [0003]

【発明が解決しようとする課題】前記従来法では、音源コードブックから最適な音源コードベクトルを選択するのに多大な演算量を要するという問題があった。 In the conventional method [SUMMARY OF THE INVENTION], it takes a great amount of calculation to select the optimum excitation code vector from the excitation codebook.これは、文献１や２の方法では、音源コードベクトルを選択するのに、各コードベクトルに対して一旦フィルタリングもしくは畳み込み演算を行ない、この演算をコードブックに格納されているコードベクトルの個数だけ繰り返すことに起因する。 This is, in Documents 1 and 2 of the method, to select the sound source code vector, once subjected to filtering or convolution operation for each code vector, is repeated by the number of code vectors stored the operation in the code book in particular due to.例えば、コードブックのビット数がＢビットで、次元数がＮのときは、フィルタリングあるいは畳み込み演算のときのフィルタあるいはインパルス応答長をＫとすると、演算量は１秒当たり、Ｎ×Ｋ×２ For example, the number of bits codebook with B bits, when the number of dimensions of the N, if the filter or impulse response length when the filtering or convolution operation to K, the amount of calculation per second, N × K × 2B ×８０００／Ｎだけ必要となる。 It is necessary only B × 8000 / N.一例として、Ｂ＝１ As an example, B = 1０、Ｎ＝４０、Ｋ＝１０とすると、１秒当たり８１，９ 0, when N = 40, K = 10, per second 81,9２０，０００回の演算が必要となり、極めて膨大であるという問題点があった。 20,000 times of operation is required, there is a problem in that it is extremely huge.

【０００４】音源コードブック探索に必要な演算量を低減する方法として、種々のものが提案されている。 As a method for reducing the amount of computation required for the excitation code book search it has been proposed various ones.例えば、ＡＣＥＬＰ（Ａｒｇｅｂｒａｉｃ Ｃｏｄｅ Ｅｘ For example, ACELP (Argebraic Code Exｃｉｔｅｄ Ｌｉｎｅａｒ Ｐｒｅｄｉｃｔｉｏｎ）方式が提案されている。 cited Linear Prediction) system has been proposed.これは、例えば、Ｃ． This is, for example, C.Ｌａｆｌａ Laflaｍｍｅらによる“１６ ｋｂｐｓ ｗｉｄｅｂａｎｄｓ By mme et al. "16 kbps widebandsｐｅｅｃｈ ｃｏｄｉｎｇ ｔｅｃｈｎｉｑｕｅ ｂａ peech coding technique baｓｅｄ ｏｎ ａｌｇｅｂｒａｉｃ ＣＥＬＰ”と題した論文（Ｐｒｏｃ．ＩＣＡＳＳＰ，ｐｐ．１３−１６， sed on algebraic CELP "entitled paper (Proc.ICASSP, pp.13-16,１９９１）（文献３）等を参照することができる。 1991) (reference may be made to document 3) or the like.文献３の方法によれば、音源信号を複数個のパルスで表し、 According to the method of Reference 3, it represents a sound source signal by a plurality of pulses,各パルスの位置をあらかじめ定められたビット数で表し伝送する。 Transmitting represents the position of each pulse predetermined by the number of bits.ここで、各パルスの振幅は＋１．０もしくは−１．０に限定されているため、パルス探索の演算量を大幅に低減化できる。 Here, the amplitude of each pulse because it is limited to +1.0 or -1.0, it can greatly reduce the computation amount of pulse search.

【０００５】文献３の従来法では、演算量を大幅に低減化することが可能となるが、音質も充分ではないという問題点があった。 [0005] In the conventional method of Reference 3, although it is possible to greatly reduce the calculation amount, there is a problem that the sound quality is also not sufficient.この理由としては、各パルスが正負の極性のみしか有しておらず、絶対値振幅はパルスの位置によらず常に１．０であるため、振幅を極めて粗く量子化したことになり、このために音質が劣化していた。 The reason for this, each pulse has only only positive or negative polarity, the absolute value amplitude is always 1.0 irrespective of the position of the pulse, it will be a very coarsely quantized amplitude, Thus sound quality had deteriorated.

【０００６】本発明の目的は、上述の問題を解決し、ビットレートが低い場合にも、比較的少ない演算量で音質の劣化の少ない音声符号化方式を提供することにある。 An object of the present invention is to solve the above problems, even if the bit rate is low, is to provide a low speech coding sound quality degradation in a relatively small amount of computation.

【０００７】 [0007]

【課題を解決するための手段】本発明によれば、入力した音声信号からスペクトルパラメータを求めて量子化するスペクトルパラメータ計算部と、前記音声信号の音源信号が個数Ｍの非零のパルスから構成され、前記パルスをＭよりも小さい個数ずつのグループに分割する分割部と、前記スペクトルパラメータを用いてパルスの振幅を前記個数ずつまとめて量子化する際に、隣接グループでの量子化候補出力値による評価値と当該グループでの量子化値による評価値を加算して歪みを評価し少なくとも一つの量子化候補を選択し出力する音源量子化部とを有する音声符号化装置が得られる。 According to the present invention According to an aspect of the spectral parameter calculator for quantizing seeking spectral parameter from a speech signal inputted, consists nonzero pulse of the source signal is the number M of said sound signal by a dividing portion that divides the pulse into groups of smaller number than M, in quantizing together amplitude of the pulse by the number using the spectral parameters, the quantized candidate output values ​​at adjacent groups evaluation value and the speech coding apparatus and a sound source quantization section for by adding the evaluation values ​​by the quantization value selecting at least one quantization candidate by evaluating the distortion output in the group by is obtained.

【０００８】本発明によれば、入力した音声信号からスペクトルパラメータを求めて量子化するスペクトルパラメータ計算部と、音源が個数Ｍの非零のパルスから構成され、前記パルスの振幅をＭよりも小さい個数ずつのグループに分割し前記個数ずつまとめて量子化するコードブックを有し、前記パルスの位置を複数セット計算し、 According to the present invention, the spectral parameter calculator for quantizing seeking spectral parameter from a speech signal inputted, the sound source is composed of non-zero pulse number M, less than M the amplitude of the pulse divided into groups of the number collectively by the number has a code book for quantizing the position of the pulse plurality set computing,前記複数セットの位置の各々に対し、前記スペクトルパラメータを用いてパルスの振幅を前記個数ずつまとめて量子化する際に、隣接グループでの量子化候補出力値による評価値と当該グループでの量子化値による評価値を加算して歪みを評価し少なくとも一つの量子化候補を選択し、位置のセットとコードベクトルの組合せを選択することにより音源信号を量子化する音源量子化部を有する音声符号化装置が得られる。 The relative location of each of the plurality of sets, in quantizing together amplitude of the pulse by the number using the spectral parameters, quantization of the evaluation value and the group due to the quantization candidate output value in the adjacent groups speech encoding having an excitation quantization section for quantizing a sound source signal by selecting at least one quantization candidate by evaluating the distortion by adding the evaluation value by value, selects a combination of the set and the code vector position device is obtained.

【０００９】本発明によれば、入力した音声信号から一定時間毎にスペクトルパラメータを求めて量子化するスペクトルパラメータ計算部と、前記音声信号から特徴量を抽出してモードを判別するモード判別部と、あらかじめ定められたモードの場合に、前記音声信号の音源が個数Ｍの非零のパルスから構成され、前記パルスの振幅をＭよりも小さい個数ずつのグループに分割し前記個数ずつまとめて量子化するコードブックを有し、前記パルスの位置を複数セット計算し、前記複数セットの位置に対し、前記スペクトルパラメータを用いてパルスの振幅を前記個数Ｌずつまとめて量子化する際に、隣接グループでの量子化候補出力値による評価値と当該グループでの量子化値による評価値を加算して歪みを評価し少なくとも一つの量子化候 According to the present invention, the spectral parameter calculator for quantizing seeking spectral parameter every predetermined time from the audio signal input, a mode determination unit for determining the mode by extracting a feature from the voice signal , in the case of the predetermined mode, the sound source of the audio signal is composed of non-zero pulse number M, by dividing the amplitude of the pulses into groups of smaller number than M quantized together by the number has a codebook, the position of the pulse plurality set computing, with respect to the position of the plurality of sets, in quantizing together amplitude of the pulse by the number L using the spectral parameter, with adjacent groups quantization climate of at least one evaluated distortion by adding the evaluation value by the quantization value of the evaluation value and the group due to the quantization candidate output valueを選択し、位置のセットとコードベクトルの組合せを選択することにより音源信号を量子化する音源量子化部を有する音声符号化装置が得られる。 Select, speech encoding apparatus having a sound source quantization section for quantizing a sound source signal is obtained by selecting a combination of the set and the code vector position.

【００１０】第１の発明では、音源がＭ個の振幅が非零のパルスから構成される。 [0010] In the first invention, sound source are M amplitude is composed of non-zero pulses.音源量子化部において、Ｍ個のパルスをＬ（Ｌ＜Ｍ）個ずつのグループに分割し、各グループにおいて、パルスの振幅をＬ個ずつまとめて量子化する。 In the excitation quantization part, divides the M pulses to a group of L (L <M) or by, in each group, we quantize together amplitude pulses by L cells.

【００１１】一定時間毎に、音源として、Ｍ個のパルスを立てる。 [0011] at regular intervals, as a sound source, make the M pulses.時間長はＮサンプルとする。 Length of time the N samples.ｉ番目のパルスの振幅、位置をそれぞれ、ｇ i 、ｍ iとする。 The amplitude of the i th pulse, position, respectively, g i, and m i.このとき、音源信号は下式のように表せる。 At this time, the sound source signal can be expressed as the following equation.

【００１２】 [0012]

【数１】 [Number 1]

【００１３】以下では、パルスの振幅を振幅コードブックを用いて量子化するものとする。 [0013] In the following, it shall be quantized using the amplitude of the pulse amplitude codebook.振幅コードブックに格納されているｋ番目のコードベクトルをｇ′ ikとし、 The k-th code vectors stored in the amplitude codebook and g 'ik,パルスの振幅をＬ個ずつ量子化するとすれば、音源は If quantizing the amplitude of the pulse by L cells, sound source

【００１４】 [0014]

【数２】 [Number 2]

【００１５】と表せる。 [0015] and can be expressed.ここで、Ｂは、振幅コードブックのビット数である。 Here, B is the number of bits amplitude codebook.

【００１６】このとき、式（２）を用いて再生した信号と入力音声信号との歪みは、次式で表せる。 [0016] At this time, distortion of the signal and the input audio signal reproduced by using the equation (2) is expressed by the following equation.

【００１９】式（３）を最小化するには、Ｌ個ずつのパルスのグループについて、上式を最小化するｋ番目のコードベクトルと位置ｍ iの組合せを求めれば良い。 [0019] To minimize equation (3), for a group of pulses of L pieces each, may be determined combination of position and k-th code vector to minimize the above equation m i.このときに、隣接グループでの量子化候補出力値による評価値と当該グループでの量子化値による評価値を加算して歪みを評価し、少なくとも一つの量子化候補を選択し出力する。 At this time, to evaluate the distortion by adding the evaluation value by the quantization value of the evaluation value and the group due to the quantization candidate output value in the adjacent groups, to select at least one quantization candidate output.

【００２０】第２の発明では、パルスの位置を複数セット出力し、複数セットの位置の候補の各々に対して、第１の発明と同一の処理を行ない、パルスの振幅をＬ個ずつまとめて量子化し、最終的に、位置と振幅コードベクトルの最適な組合せを選択する。 [0020] In the second invention, the position of the pulse and multiple sets output, for each of the candidate positions of the plurality sets, performs the first invention and the same process, together with the amplitude of the pulse by L cells quantized, ultimately, to select the optimum combination of positions and amplitudes codevector.

【００２１】第３の発明では、音声信号から特徴量を抽出してモードを判別する。 [0021] In the third invention, to determine the mode by extracting a feature quantity from the speech signal.あらかじめ定められたモードでは、音源信号は、個数Ｍの非零のパルスから構成され、さらに、第２の発明と同様に、複数セットの位置の候補の各々に対して、第１の発明と同一の処理を行ない、パルスの振幅をＬ個ずつまとめて量子化し、最終的に、位置と振幅コードベクトルの最適な組合せを選択する。 The predetermined mode, the sound source signal is composed of non-zero pulse number M, further, similarly to the second invention, for each of the candidate positions of the plurality sets, identical to the first aspect of the present invention performs processing, and quantization together amplitude pulses by L cells, ultimately, to select the optimum combination of positions and amplitudes codevector.

【００２２】 [0022]

【発明の実施の形態】図１は本発明による音声符号化装置の一実施例を示すブロック図である。 Figure 1 DETAILED DESCRIPTION OF THE INVENTION is a block diagram showing an embodiment of a speech coding apparatus according to the present invention.

【００２３】図において、入力端子１００から音声信号を入力し、フレーム分割回路１１０では音声信号をフレーム（例えば１０ｍｓ）毎に分割し、サブフレーム分割回路１２０では、フレームの音声信号をフレームよりも短いサブフレーム（例えば５ｍｓ）に分割する。 In [0023] Figure, enter the audio signal from the input terminal 100, the frame division circuit 110 an audio signal is divided into each frame (e.g. 10 ms), the sub-frame dividing circuit 120, shorter than the frame speech signal of the frame It is divided into subframes (e.g., 5 ms).

【００２４】スペクトルパラメータ計算回路２００では、少なくとも一つのサブフレームの音声信号に対して、サブフレーム長よりも長い窓（例えば２４ｍｓ）をかけて音声を切り出してスペクトルパラメータをあらかじめ定められた次数（例えばＰ＝１０次）を計算する。 [0024] In the spectrum parameter calculation circuit 200, the audio signals of at least one subframe, a predetermined degree of spectral parameters cut out voice over subframe longer window than length (e.g. 24 ms) (e.g. P = 10 order) is calculated.ここでスペクトルパラメータの計算には、周知のＬＰＣ Here, the calculation of the spectral parameters, a well-known LPC分析や、Ｂｕｒｇ分析等を用いることができる。 Analysis and can be used Burg analysis or the like.ここでは、Ｂｕｒｇ分析を用いることとする。 Here, it is assumed that the use of Burg analysis.Ｂｕｒｇ分析の詳細については、中溝著による“信号解析とシステム同定”と題した単行本（コロナ社１９８８年刊）の８２〜 For more information about the Burg analysis, 82 to the book entitled "Signal Analysis and System Identification" by the middle groove Author (Corona Publishing Co., Ltd. 1988)８７頁（文献４）等に記載されているので説明は略する。 87 pp explanation will (document 4) and the like will be omitted.さらにスペクトルパラメータ計算部では、Ｂｕｒｇ In yet spectrum parameter calculation unit, Burg法により計算された線形予測係数α i （ｉ＝１，…，１ Linear prediction coefficients calculated by modulo α i (i = 1, ... , 1０）を量子化や補間に適したＬＳＰパラメータに変換する。 0) is converted into LSP parameters suitable for quantization and interpolation.ここで、線形予測係数からＬＳＰへの変換は、菅村他による“線スペクトル対（ＬＳＰ）音声分析合成方式による音声情報圧縮”と題した論文（電子通信学会論文誌、Ｊ６４−Ａ、ｐｐ．５９９−６０６、１９８１年） Here, conversion from the linear prediction coefficient into the LSP, but mura et article entitled "line spectral pair (LSP) voice information compression by vocoding scheme" (IEICE Journal, J64-A, pp.599 -606, 1981)（文献５）を参照することができる。 It can be referred to (reference 5).例えば、第２サブフレームでＢｕｒｇ法により求めた線形予測係数を、Ｌ For example, the linear predictive coefficient calculated by the Burg method in the second subframe, LＳＰパラメータに変換し、第１サブフレームのＬＳＰを直線補間により求めて、第１サブフレームのＬＳＰを逆変換して線形予測係数に戻し、第１，２サブフレームの線形予測係数α il （ｉ＝１，…，１０，ｌ＝１，…， Into a SP parameter, the LSP of the first subframe obtained by linear interpolation, returned to linear prediction coefficients and inverse transform the LSP of the first subframe, the linear prediction coefficients of the first and second subframe alpha il (i = 1, ..., 10, l = 1, ...,２）を聴感重み付け回路２３０に出力する。 And it outputs a 2) to the perceptual weighting circuit 230.また、第２ In addition, the secondサブフレームのＬＳＰをスペクトルパラメータ量子化回路２１０へ出力する。 And outputs the LSP sub-frame to the spectral parameter quantization circuit 210.

【００２５】スペクトルパラメータ量子化回路２１０では、あらかじめ定められたサブフレームのＬＳＰパラメータを効率的に量子化し、下式の歪みを最小化する量子化値を出力する。 [0025] In the spectral parameter quantization circuit 210 quantizes the LSP parameters of the subframes predetermined efficiently, and outputs a quantization value which minimizes the distortion of the following equation.

【００２９】また、スペクトルパラメータ量子化回路２ Further, the spectral parameter quantization circuit 2１０では、第２サブフレームで量子化したＬＳＰパラメータをもとに、第１サブフレームのＬＳＰパラメータを復元する。 In 10, on the basis of the LSP parameter quantized in the second sub-frame, to restore the LSP parameters of the first subframe.ここでは、現フレームの第２サブフレームの量子化ＬＳＰパラメータと１つ過去のフレームの第２サブフレームの量子化ＬＳＰを直線補間して、第１サブフレームのＬＳＰを復元する。 Here, the quantized LSP of the second subframe of the quantized LSP parameter and one past frame of the second sub-frame of the current frame by linear interpolation, to restore the LSP of the first subframe.ここで、量子化前のＬＳＰ Here, before the quantization of LSPと量子化後のＬＳＰとの誤差電力を最小化するコードベクトルを１種類選択した後に、直線補間により第１サブフレームのＬＳＰを復元できる。 And a code vector that minimizes the error power between the LSP after quantization after selecting one type, can be restored LSP of the first subframe by linear interpolation.

【００３０】以上により復元した第１サブフレームのＬ The first sub-frame restored by the above LＳＰと第２サブフレームの量子化ＬＳＰをサブフレーム毎に線形予測係数α′ il （ｉ＝１，…，１０，ｌ＝１， Linear prediction coefficients SP and the quantized LSP of the second subframe for each subframe α 'il (i = 1, ..., 10, l = 1,…，２）に変換し、インパルス応答計算回路３１０へ出力する。 ..., it is converted into 2), and outputs to the impulse response calculation circuit 310.また、第２サブフレームの量子化ＬＳＰのコードベクトルを表すインデクスをマルチプレクサ４００に出力する。 Also outputs an index representing the code vector of the quantized LSP of the second subframe to a multiplexer 400.

【００３１】聴感重み付け回路２３０は、スペクトルパラメータ計算回路２００から、各サブフレーム毎に量子化前の線形予測係数α i （ｉ＝１，…，Ｐ）を入力し、 The perceptual weighting circuit 230, the spectral parameters calculated from the circuit 200, the linear prediction coefficients α i (i = 1, ... , P) before quantization for each subframe type a,前記文献１にもとづき、サブフレームの音声信号に対して聴感重み付けを行ない、聴感重み付け信号を出力する。 Based on the document 1, it performs perceptual weighting on the speech signal of the subframe, and outputs a perceptual weighting signal.

【００３２】応答信号計算回路２４０は、スペクトルパラメータ計算回路２００から、各サブフレーム毎に線形予測係数α iを入力し、スペクトルパラメータ量子化回路２１０から、量子化、補間して復元した線形予測係数α′ iをサブフレーム毎に入力し、保存されているフィルタメモリの値を用いて、入力信号を零ｄ（ｎ）＝０とした応答信号を１サブフレーム分計算し、減算器２３５ The response signal calculation circuit 240 from the spectral parameter calculator circuit 200 inputs the linear prediction coefficients alpha i for each subframe from the spectral parameter quantization circuit 210, quantization, linear prediction coefficient restored by interpolating the alpha 'i type for each subframe, using the value of filter memory stored, a response signal with zero d (n) = 0 the input signal to calculate one subframe, the subtracter 235へ出力する。 To output to.ここで、応答信号ｘ z （ｎ）は下式で表される。 Here, the response signal x z (n) is expressed by the following equation.

【００３５】減算器２３５は、下式により、聴感重み付け信号から応答信号を１サブフレーム分減算し、ｘ′ w The subtractor 235 by the following equation, by subtracting one subframe a response signal from the perceptual weighting signals, x 'w（ｎ）を適応コードブック回路３００へ出力する。 (N) is output to the adaptive codebook circuit 300.

【００３８】適応コードブック回路３００では、重み付け信号計算回路３６０から過去の音源信号ｖ（ｎ）を、 [0038] In the adaptive code book circuit 300, a past sound source signal v from the weighting signal calculation circuit 360 (n),減算器２３５から出力信号ｘ′ w （ｎ）を、インパルス応答計算回路３１０から聴感重み付けインパルス応答ｈ The output signal x 'w from the subtracter 235 (n), perceptual weighting impulse response h from the impulse response calculation circuit 310w （ｎ）を入力する。 to enter a w (n).ピッチに対応する遅延Ｔを下式の歪みを最小化するように求め、遅延を表すインデクスをマルチプレクサ４００に出力する。 Seeking a delay T corresponding to the pitch so as to minimize the distortion of the following equation, and outputs an index representative of the delay to the multiplexer 400. FIG.

【００４１】ゲインβを下式に従い求める。 [0041] determine the gain β in accordance with the following formula.

【００４２】 [0042]

【数８】 [Equation 8]

【００４３】ここで、女性音や、子供の声に対して、遅延の抽出精度を向上させるために、遅延を整数サンプルではなく、小数サンプル値で求めてもよい。 [0043] In this case, women and sound, for the children of the voice, in order to improve the extraction accuracy of the delay, rather than the integer sample delay, may be obtained by fractional sample value.具体的な方法は、例えば、Ｐ． The specific method, for example, P.Ｋｒｏｏｎらによる、“Ｐｉｔｃｈ By Kroon et al., "Pitchｐｒｅｄｉｃｔｏｒｓ ｗｉｔｈ ｈｉｇｈ ｔｅｍ predictors with high temｐｏｒａｌ ｒｅｓｏｌｕｔｉｏｎ”と題した論文（Ｐ poral resolution "entitled paper (Pｒｏｃ． roc.ＩＣＡＳＳＰ，ｐｐ． ICASSP, pp.６６１−６６４，１９９ 661-664,199０年）（文献１０）等を参照することができる。 0 years) (reference may be made to document 10), and the like.

【００４６】以下では、パルスの振幅をＬパルス分（Ｌ [0046] In the following, L pulses the amplitude of the pulse (L＜Ｍ）まとめて量子化するための、Ｂビットの振幅コードブックを有しているものとして説明する。 <M) collectively it is described as having for quantizing, the B-bit amplitude code book.この振幅コードブックは３５１に格納されている。 The amplitude codebook is stored in 351.

【００４７】音源量子化回路３５０の構成を示すブロック図を図２に示す。 [0047] A block diagram showing the configuration of a excitation quantization circuit 350 in FIG.

【００５０】位置計算回路８００は、あらかじめ定められた個数Ｍの非零の振幅のパルスの位置を計算する。 The position calculation circuit 800 calculates the amplitude position of the pulse of the non-zero number of M predetermined.これには、文献３と同様に、各パルス毎に、あらかじめ定められた位置の候補について、次式を最大化するパルスの位置を求める。 To do this, like the document 3, for each pulse, the candidate of the predetermined position, determining the position of the pulse that maximizes the following equation.

【００５１】例えば、位置の候補の例は、サブフレーム長をＮ＝４０、パルスの個数をＭ＝５とすると、下表のように表せる。 [0051] For example, examples of the position of the candidate sub-frame length N = 40, the number of pulses and M = 5, represented as shown in the table below.

【００５２】 [0052]

【表１】 [Table 1]

【００５３】各パルスについて、位置の候補を調べ、次式を最大化する位置を選択する。 [0053] For each pulse, examine the candidate positions, selecting the position which maximizes the following equation.

【００５４】 [0054]

【数１０】 [Number 10]

【００５５】ここで、 [0055] In this case,

【００５６】 [0056]

【数１１】 [Number 11]

【００５７】である。 [0057] a.ここでｓｇｎ（ｋ），ｓｇｎ Here sgn (k), sgn（ｉ）は、それぞれ、パルスの位置ｍ k ，ｍ iにおける極性を表わす。 (I), respectively, the position m k of the pulse represents the polarity of m i.Ｍ個のパルスの位置は分割回路３２０に出力される。 Position of the M pulses is output to the divider circuit 320.

【００５８】分割回路８２０は、Ｍ個のパルスをＬ個ずつのグループに分割する。 [0058] division circuit 820 divides the M pulses to the group of L pieces each.ここでグループの個数をＵとする。 Here, the number of group and U.Ｕ＝Ｍ／Ｌである。 It is U = M / L.

【００５９】振幅量子化回路８３０ 1 〜８３０ Qは、パルスの振幅をＬ個ずつ、振幅コードブック３５１を用いて量子化する。 The amplitude quantizer 830 1 ~830 Q is the amplitude of the pulse L pieces each, are quantized using the amplitude codebook 351.ここで、振幅を分割して量子化することによる劣化をできる限り低減化するために以下の処理を行なう。 Here, the following processing is performed in order to reduce as much as possible deterioration due to the quantization by dividing the amplitude.まず、第１の振幅量子化回路８３０ 1では、次式を最大化する順に、複数個（Ｑ個）の振幅コードベクトル候補を出力する。 First, the first amplitude quantizer 830 1, the order to maximize the following equation, and outputs an amplitude code vector candidates a plurality (Q units).

【００６０】 Ｃ j2 ／Ｅ j （１９） ここで、 [0060] C j 2 / E j (19 ) here,

【００６１】 [0061]

【数１２】 [Number 12]

【００６２】である。 [0062] a.

【００６３】第２の振幅量子化回路８３０ 2では、第１ [0063] In the second amplitude quantizer 830 2, firstの振幅量子化回路８３０ 1のＱ個の量子化候補の各々による評価値と、第２グループのＬ個のパルスの振幅量子化値による評価値を加算しながら次式を計算する。 An evaluation value according to each of the amplitude quantizer 830 1 of Q quantization candidates, while adding the evaluation value by the amplitude quantization values of the L pulses of the second group to calculate the following equation.ここで、 here,

【００６４】 [0064]

【数１３】 [Number 13]

【００６５】となる。 The [0065].

【００６６】これらから、次式の評価値を最大化する順に、コードベクトルをＱ個出力する。 [0066] From these, in order to maximize the evaluation value of the following equation, the code vector to the Q output.

【００６７】 Ｃ j2 ／Ｅ j （２４） 第３の振幅量子化回路８３０ 3では、第２の振幅量子化回路８３０ 2のＱ個の量子化候補の各々による評価値と、第３グループのＬ個のパルスの振幅量子化値による評価値を加算しながら、次式により評価値を計算する。 [0067] In C j 2 / E j (24 ) third amplitude quantization circuit 830 3, an evaluation value according to each of the second amplitude quantizer 830 2 of Q quantization candidates, the third group while adding the evaluation value by the amplitude quantization values ​​of the L pulses, calculates an evaluation value by the following equation.ここで、 here,

【００７０】 Ｃ j2 ／Ｅ j （２７） 図１に戻って、パルスの位置をあらかじめ定められたビット数で量子化し、位置を表すインデクスをマルチプレクサに出力する。 [0070] Returning to C j 2 / E j (27 ) 1, quantized by the number of bits defined the position of the pulse in advance, and outputs an index representing the position to the multiplexer.

【００７３】位置の情報と、Ｑ種類の振幅コードベクトルのインデクスは、ゲイン量子化回路３６５に出力される。 [0073] and position information, index Q types of amplitude code vector is outputted to the gain quantization circuit 365.

【００７４】ゲイン量子化回路３６５は、ゲインコードブック３５５からゲインコードベクトルを読みだし、選択された位置に対して、Ｑ個の振幅コードベクトルの各々に対して、下式を最小化するベルトコードベクトルを選択し、最終的に歪みを最小化する振幅コードベクトルとゲインコードベクトルの組合せを選択する。 [0074] gain quantization circuit 365, belt cords from the gain codebook 355 reads out gain code vectors, to the selected position, for each of the Q amplitude code vector to minimize the formula select vector, finally selects a combination of amplitude code vector and gain code vector which minimizes the distortion.

【００７５】ここでは、適応コードブックのゲインとパルスで表した音源のゲインの両者を同時にベクトル量子化する例について示す。 [0075] Here, an example in which at the same time the vector quantization gain of both the sound source in terms of gain and pulse of the adaptive codebook.

【００７６】 [0076]

【数１５】 [Number 15]

【００７７】ここで、β′ t 、Ｇ′ tは、ゲインコードブック３５５に格納された２次元ゲインコードブックにおけるｋ番目のコードベクトルである。 [0077] Here, β 't, G' t is the k-th code vector in the two-dimensional gain codebook stored in the gain codebook 355.上式の計算を、 The calculation of the above equation,Ｑ個の振幅コードベクトルの各々に対して繰り返し、歪みＤ tを最小化する組合せを選択する。 Repeat for each of the Q amplitude code vectors to select a combination that minimizes the distortion D t.

【００７９】重み付け信号計算回路３６０は、それぞれのインデクスを入力し、インデクスからそれに対応するコードベクトルを読みだし、まず下式にもとづき駆動音源信号ｖ（ｎ）を求める。 [0079] weighting signals calculation circuit 360 receives the respective indexes, read a code vector corresponding to the index, first determine the excitation signal v based on the following equation (n).

【００８０】 [0080]

【数１６】 [Number 16]

【００８１】ｖ（ｎ）は適応コードブック回路３００に出力される。 [0081] v (n) is output to the adaptive code book circuit 300.

【００８２】次に、スペクトルパラメータ計算回路２０ [0082] Then, the spectral parameter calculator 20０の出力パラメータ、スペクトルパラメータ量子化回路２１０の出力パラメータを用いて下式により、応答信号ｓ w （ｎ）をサブフレーム毎に計算し、応答信号計算回路２４０へ出力する。 0 of the output parameters, by the following equation using the output parameters of the spectral parameter quantization circuit 210 calculates the response signal s w (n) to each sub-frame, and outputs the response signal calculating circuit 240.

【００８３】 [0083]

【数１７】 [Number 17]

【００８４】以上により、第１の発明に対応する実施例の説明を終える。 The [0084] This concludes the description of the embodiment corresponding to the first invention.

【００８５】第２の実施例を示すブロック図を図３に示す。 [0085] A block diagram showing a second embodiment in FIG.

【００８６】図においては、音源量子化回路５００の動作が異なる。 [0086] In the figure, the operation of the sound source quantization circuit 500 is different.音源量子化回路５００の構成を図４に示す。 The configuration of the sound source quantization circuit 500 shown in FIG.

【００８７】図４において、位置計算回路８５０は、式（１６）を最大化する順に、複数セット（例えばＹセット）の位置の候補を分割回路８６０に出力する。 [0087] In FIG. 4, the position calculation circuit 850, in order to maximize the expression (16), and outputs the candidates for the positions of the plurality sets (e.g. Y set) dividing circuit 860.

【００８８】分割回路８６０は、Ｍ個のパルスをＬ個ずつのグループに分割し、各グループに対してＹセットの位置の候補を出力する。 [0088] dividing circuit 860 divides the M pulses to a group of L pieces each, and outputs the candidate location of the Y set for each group.

【００８９】振幅量子化回路８３０ 1 〜８３０ Qは、Ｌ [0089] amplitude quantization circuit 830 1 ~830 Q is, L個ずつのパルスに対して、各々の位置の候補について、 Relative number by the pulse, the candidate of each position,図２と同様の方法で、振幅コードベクトルの候補をＱ個求め、次の段に出力する。 In the same manner as in FIG. 2, the candidate of the amplitude code vector Q number determined, and outputs to the next stage.

【００９０】選択回路８７０は、各位置の候補ごとに、 [0090] Selection circuit 870, for each candidate at each position,Ｍパルス全体の歪みを求め、歪みを最小にする位置の候補を選択し、Ｑ種の振幅コードベクトルと、選択された位置を出力する。 Obtains the distortion of the entire M pulses, select the location of the candidate lowest distortion, and outputs a Q species amplitude code vector, the selected position.

【００９１】図５は第３の実施例の構成を示すブロック図である。 [0091] FIG. 5 is a block diagram showing the configuration of a third embodiment.

【００９２】モード判別回路９００は、聴感重み付け回路２３０からフレーム単位で聴感重み付け信号を受取り、モード判別情報を音源量子化回路６００へ出力する。 [0,092] mode discrimination circuit 900 receives a perceptual weighting signal in units of frames from the perceptual weighting circuits 230, and outputs the mode discrimination information to the excitation quantization circuit 600.ここでは、モード判別に、現在のフレームの特徴量を用いる。 Here, the mode determination, using a characteristic quantity of the current frame.特徴量としては、例えば、フレームで平均したピッチ予測ゲインを用いる。 As the feature amount, for example, a pitch prediction gain averaged over the frame.ピッチ予測ゲインの計算は、例えば下式を用いる。 Calculation of the pitch prediction gain is, for example, a following equation.

【００９３】 [0093]

【数１８】 [Number 18]

【００９４】ここで、Ｌはフレームに含まれるサブフレームの個数である。 [0094] Here, L is the number of subframes included in the frame.Ｐ i 、Ｅ iはそれぞれ、ｉ番目のサブフレームでの音声パワ、ピッチ予測誤差パワを示す。 P i, respectively E i is, i-th speech power in the sub-frame, indicating the pitch prediction error power.

【００９５】 [0095]

【数１９】 [Number 19]

【００９６】ここで、Ｔは予測ゲインを最大化する最適遅延である。 [0096] Here, T is the optimum delay which maximizes the predictive gain.

【００９７】フレーム平均ピッチ予測ゲインＧをあらかじめ定められた複数個のしきい値と比較して複数種類のモードに分類する。 [0097] Compared to frame average pitch prediction gain G a predetermined plurality of threshold is classified into a plurality kinds of modes.モードの個数としては、例えば４を用いることができる。 The number of modes, can be used 4 for example.モード判別回路９００は、モード情報を音源量子化回路６００、マルチプレクサ４００へ出力する。 Mode discrimination circuit 900 outputs the mode information to the excitation quantization circuit 600, the multiplexer 400.

【００９８】音源量子化回路６００の構成を図６に示す。 [0098] Figure 6 shows the structure of the excitation quantization circuit 600.判別回路８８０は、端子８０５から、モード情報を入力し、モード情報があらかじめ定められたモードを示すかどうかを判別し、その場合に、スイッチ回路８９０ Discrimination circuit 880, the terminal 805 receives the mode information, to determine whether indicating the mode in which mode information is predetermined, in that case, the switch circuit 8901と８９０ 2を上側に倒し、図４と同一の動作を行なう。1 and 890 2 to pivot it upward, it performs the same operation as FIG.

【００９９】上述した実施例に限らず、種々の変形が可能である。 [0099] not limited to the aforementioned embodiments, and various modifications are possible.

【０１００】モード情報を用いて適応コードブック回路や、ゲインコードブックを切替える構成とすることもできる。 [0100] or adaptive code book circuit using mode information may be configured to switch the gain codebook.

【０１０１】パルスの振幅を量子化する際に、Ｌ個ずつのパルスの各グループについて、振幅コードブック３５ [0101] the amplitude of the pulse at the time of quantization, for each group of pulse of L pieces each, amplitude code book 35１から複数個のコードベクトルを予備選択し、予備選択されたコードベクトルを用いてパルスの振幅を量子化するようにしてもよい。 1 a plurality of code vectors preliminarily selected from the amplitude of the pulses may be quantized using a code vector which has been pre-selected.この処理により、振幅量子化に要する演算量を低減化できる。 This process can reduce the computation amount required for amplitude quantization.

【０１０２】予備選択の方法の例を次に示す。 [0102] shown below is an example of how the pre-selection.

【０１０３】式（３４）もしくは、式（３５）を最大化する順に、振幅コードベクトルを複数種類予備選択し、 [0103] Equation (34) or, in order to maximize the expression (35), and a plurality of types preselection amplitude code vector,音源量子化回路に出力する。 And outputs it to the sound source quantization circuit.

【０１０４】 [0104]

【数２０】 [Number 20]

【０１０５】 [0105]

【発明の効果】以上説明したように、本発明によれば、 As described in the foregoing, according to the present invention,音源量子化部において、音源がＭ個の振幅が非零パルスから構成され、前記パルスをＭよりも小さい個数Ｌずつに分割し、パルスの振幅をＬずつまとめて量子化する際に、隣接グループでの量子化候補出力値による評価値と当該グループでの量子化値による評価値を加算して歪みを評価し、少なくとも一つの量子化候補を選択し出力するので、パルスの振幅を比較的少ない演算量で良好に量子化できるという効果がある。 In the excitation quantization part, when the sound source is the M amplitude consists nonzero pulse, the pulse is divided into individual smaller number L than M, quantizes together amplitude pulses by L, adjacent groups by adding the evaluation value by the quantization value of the evaluation value and the group due to the quantization candidate output value and evaluate the strain at, since the selecting at least one quantization candidate output, relatively small amplitude of the pulse well there is an effect that it quantized in computation amount.

【０１０６】さらに、本発明によれば、上記構成において、複数セットのパルスの位置の各々に対して、振幅の量子化を行ない、最終的に歪みを最小にする振幅コードベクトルと位置の組合せを選択するので、パルスの振幅量子化の性能を大幅に向上させることができる。 [0106] Further, according to the present invention, in the above configuration, for each position of the plurality of sets pulses performs quantization of the amplitude, eventually a combination of position and amplitude code vector lowest distortion since selecting a pulse amplitude quantization performance can be greatly improved.

【０１０７】さらに、本発明によれば、フレームの音声からモードを判別し、あらかじめ定められたモードにおいて、上記構成をとるので、音声の特徴に応じて適応的に処理を行なうことができるため、従来方式に比べ音質が改善される。 [0107] Further, according to the present invention, to determine the mode from the speech of the frame, at a predetermined mode, since the above configuration, it is possible to perform the adaptive processing in accordance with the characteristic of the speech, sound quality compared to conventional method is improved.

【図面の簡単な説明】 BRIEF DESCRIPTION OF THE DRAWINGS

【図１】第１の実施例を示す図である。 1 is a diagram showing a first embodiment.

【図２】音源量子化回路３５０の構成を示す図である。 2 is a diagram showing a configuration of a sound source quantization circuit 350.

【図３】第２の実施例を示す図である。 3 is a diagram showing a second embodiment.

【図４】音源量子化回路５００の構成を示す図である。 4 is a diagram showing a configuration of a sound source quantization circuit 500.

【図５】第３の実施例を示す図である。 5 is a diagram showing a third embodiment.

【図６】音源量子化回路６００の構成を示す図である。 6 is a diagram showing a configuration of a sound source quantization circuit 600.

Claims (3)

Translated from Japanese

(57)【特許請求の範囲】 (57) [the claims]

【請求項１】入力した音声信号からスペクトルパラメータを求めて量子化するスペクトルパラメータ計算部と、 A spectral parameter calculator for quantizing seeking spectral parameter from a speech signal according to claim 1 was input,前記音声信号の音源信号が個数Ｍの非零のパルスから構成され、前記パルスをＭよりも小さい個数ずつのグループに分割する分割部と、前記スペクトルパラメータを用いてパルスの振幅を前記個数ずつまとめて量子化する際に、隣接グループでの量子化候補出力値による評価値と当該グループでの量子化値による評価値を加算して歪みを評価し少なくとも一つの量子化候補を選択し出力する音源量子化部とを有する音声符号化装置。 The sound source signal of the audio signal is composed of non-zero pulse number M, a dividing unit that divides the pulse into groups of smaller number than M, summarized by the number of amplitude pulses using the spectral parameter sound source Te in quantizing and by adding the evaluation value by the quantization value of the evaluation value and the group due to the quantization candidate output value at the adjacent group by selecting at least one quantization candidate by evaluating the distortion output speech encoding apparatus and a quantization unit.

【請求項２】入力した音声信号からスペクトルパラメータを求めて量子化するスペクトルパラメータ計算部と、 A spectral parameter calculator for quantizing seeking spectral parameter from a speech signal wherein the input,音源が個数Ｍの非零のパルスから構成され、前記パルスの振幅をＭよりも小さい個数ずつのグループに分割し前記個数ずつまとめて量子化するコードブックを有し、前記パルスの位置を複数セット計算し、前記複数セットの位置の各々に対し、前記スペクトルパラメータを用いてパルスの振幅を前記個数ずつまとめて量子化する際に、 Sound source is constructed from a non-zero pulse number M, has a code book for quantizing collectively by the number to divide the amplitude of the pulses into groups of smaller number than M, a plurality sets the position of the pulse calculated, for each position of the plurality of sets, in quantizing together amplitude of the pulse by the number using the spectral parameter,隣接グループでの量子化候補出力値による評価値と当該グループでの量子化値による評価値を加算して歪みを評価し少なくとも一つの量子化候補を選択し、位置のセットとコードベクトルの組合せを選択することにより音源信号を量子化する音源量子化部を有する音声符号化装置。 Selecting at least one quantization candidate by evaluating the distortion by adding the evaluation value by the quantization value of the evaluation value and the group due to the quantization candidate output value in the adjacent groups, the combination of the set and the code vector position speech encoding apparatus having a sound source quantization section for quantizing a sound source signal by selecting.

【請求項３】入力した音声信号から一定時間毎にスペクトルパラメータを求めて量子化するスペクトルパラメータ計算部と、前記音声信号から特徴量を抽出してモードを判別するモード判別部と、あらかじめ定められたモードの場合に、前記音声信号の音源が個数Ｍの非零のパルスから構成され、前記パルスの振幅をＭよりも小さい個数ずつのグループに分割し前記個数ずつまとめて量子化するコードブックを有し、前記パルスの位置を複数セット計算し、前記複数セットの位置に対し、前記スペクトルパラメータを用いてパルスの振幅を前記個数ずつまとめて量子化する際に、隣接グループでの量子化候補出力値による評価値と当該グループでの量子化値による評価値を加算して歪みを評価し少なくとも一つの量子化候補を選択し、位置の 3. A seeking spectral parameter every predetermined time from the input speech signal spectrum parameter calculation unit for quantizing a mode discrimination section for discriminating a mode by extracting a feature from the audio signal, predetermined in the case of the mode, the audio signal of the sound source is composed of non-zero pulse number M, the codebook quantized together by the number divided into groups of smaller number than M the amplitude of the pulse a, the position of the pulse plurality set computing, with respect to the position of the plurality of sets, in quantizing together amplitude of the pulse by the number using the spectral parameter, the quantization candidate output of an adjacent group selecting at least one quantization candidate by evaluating the distortion by adding the evaluation value by the quantization value of the evaluation value and the group by value, locationットとコードベクトルの組合せを選択することにより音源信号を量子化する音源量子化部を有する音声符号化装置。 Speech encoding apparatus having a sound source quantization section for quantizing a sound source signal by selecting a combination of Tsu preparative code vector.