Um Novo Método Usando Autocorrelação para Extração da Freq¨uência Fundamental em Sinais de Voz
DOI:
https://doi.org/10.5540/tema.2007.08.02.0191Resumo
Este artigo descreve o algoritmo de extração da freqüência fundamental do sinal de voz usado na implementação do programa P-NAV (Programa Neuro Analizador Vocal), por Brandão (2006). O método proposto toma como base o algoritmo descrito por Boersma (1993), que usa o método da autocorrelação, e desenvolve quatro algoritmos obtendo, com isso, um método mais robusto para marcar corretamente os períodos do sinal de voz, mesmo em trechos severamente perturbados e diplofônicos.Referências
P. Boersma, Accurate short-term analysis of the fundamental frequency and the harmonics-to-noise ratio of a sampled sound, IFA Proceedings, 17 (1993), 97-110.
A. Brandão, F.R. Leta, Usando redes neurais para classificação de padrões de voz, em “XXVII CNMAC - Congresso Nacional de Matemática Aplicada e Computacional”, SBMAC, 2005.
A. Brandão, “Classificação de Vozes Naturais e de Vozes Sintetizadas através de Modelos Mecânicos de Laringe e de Trato Vocal usando Redes Neurais”, Dissertação de Mestrado, Universidade Federal Fluminense, Niterói, RJ, 2006.
A. Brandão, E. Cataldo, R. Sampaio, “Análise e Processamento de Sinais”, Apostila, SBMAC, 2005.
J. Cernocky, “Speech Processing Using Automatically Derived Segmental Units”, PhD Thesis, ESIEE, France, 1998.
M.P. Karnell, Laryngeal perturbation analysis: minimum length of analysis window, Journal of Speech and Hearing Research, 34 (1991), 544-548.
A.P. Klapuri, Multiple fundamental frequency estimation based on harmonicity and spectral smoothness, IEEE Transactions on Speech and Audio Processing, 11, No. 6 (2003).
P. Lieberman, Perturbation in vocal pitch, Journal of the Acoustical Society of America, 33 (1961), 597-603.
P. Motlíˇcek, L. Burget, “Reliability Improvement of Speech Pitch Detetion Using Paths”, Institute of Radio Electronics, Faculty of Electrical Engineering, TU Brno, 2000.
L.R. Rabiner, et al., A comparative performance study of several pitch detection algorithms, IEEE Transactions on Acoustics, Speech, and Signal Processing, ASSP-24, No. 5 (1976).
D. Talkin, “A Robust Algorithm for Pitch Tracking (RAPT). Speech Coding and Synthesis”. New York, Elsevier, 1995.
D. Wong, R. Lange, I. Titze, C.G. Guo, Mechanisms of Jitter-Induced Shimmer in a driven model of vocal fold vibration, in “NCVS Status and Progress Report”, pp. 33-41, 1995.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Política para Periódicos de Acesso Livre
Autores que publicam nesta revista concordam com os seguintes termos:
- Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
- Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
- Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado (Veja O Efeito do Acesso Livre).
- Esta é uma revista de acesso aberto, o que significa que todo o conteúdo é livremente disponível gratuitamente para o usuário ou sua instituição. Os usuários estão autorizados a ler, baixar, copiar, distribuir, imprimir, pesquisar ou vincular os textos completos dos artigos, ou usá-los para qualquer outro propósito legal, sem pedir permissão prévia do editor ou do autor. Isso está de acordo com a definição de acesso aberto do BOAI.
Todo o conteúdo do periódico está licenciado sob uma Licença Creative Commons do tipo atribuição BY.