Ajuste do algoritmo de loudness ITU-R BS.1770 baseado em reverberação (original) (raw)

Ritmo Musical Adaptável à Latência de Rede no Sistema Public Sound Objects

Quando estabelecidos sobre redes informáticas de longa distância os sistemas de criação musical colaborativos comportam um problema critico: a latência da rede, que é um impedimento à comunicação musical em tempo real. Num estudo recente, foi estabelecida a relação entre tolerância à latência e o ritmo musical. Este resultado emergiu de uma experiência levada a cabo pelos autores deste artigo, na qual foram aplicadas condições simuladas de latência de rede à performance de diferentes músicos enquanto tocavam temas clássicos de Jazz. O projecto Public Sound Objects - PSOs é um espaço musical partilhado na web, que tem constituído um paradigma experimental para implementação e teste de diferentes abordagens para a comunicação musical on-line. Este artigo descreve a implementação da última versão do sistema PSOs, incluindo uma componente para instrumentos de música em rede que incorpora a latência como uma funcionalidade de software, que adapta dinamicamente o seu ritmo à latência de c...

Minimização dos ruidos das imagens CBERS-2 através da inversão do algoritmo de classificação isodata em região de Floresta Amazônica

Anais, 2007

The main objective of this work is to minimize the noises of CBERS-2 images using the inversion of the Isodata classification technique. The Amazonian forest is the localization for that study. The followed hypothesis establishes the possibility of obtaining an image with radiometric quality for change detection. The parameters for noises minimized are extracted from the own image. The images results improved much in their visual quality. It's expected that the results of the application of change detection techniques can reach good quality, because expressive noises were not observed.

Discriminador Voz/Música Baseado na Estimação de Múltiplas Freqüências Fundamentais

IEEE Latin America Transactions, 2007

artigo introduz uma nova técnica para discriminação entre música e voz. A estratégia é baseada no conceito de estimação de múltiplas freqüências fundamentais, o qual fornece os elementos para extração de três parâmetros do sinal: proporção de freqüências fundamentais elevadas, prevalência da freqüência fundamental principal e variabilidade da freqüência. A discriminação entre voz e música é obtida pela combinação apropriada de tais parâmetros. O reduzido número de parâmetros, combinado ao fato de que nenhuma etapa de treinamento é necessária, torna essa estratégia muito robusta a uma vasta gama de condições práticas. O desempenho da técnica é analisado e comparado com trabalhos anteriores levando-se em conta a precisão da separação voz/música, a robustez frente a condições extremas e o esforço computacional.

Redução adaptativa de eco e de ruído para terminais viva-voz

2002

Há um grande interesse hoje em desenvolver terminais viva-voz que permitam aos participantes de uma conversa à distância contarem com um bom grau de naturalidade e inteligibilidade. O objetivo deste trabalho é apresentar solução para dois impedimentos que surgem quando se deseja projetar um terminal viva-voz para ser utilizado em automóveis: o eco acústico resultante do acoplamento entre microfone e alto-falante do terminal; e o ruído ambiente produzido por exemplo pelo vento, pneus e motor do veículo. A solução proposta envolve o uso de filtros adaptativos e alterações no espectro do sinal de voz para minimizar os problemas mencionados. Os aspectos teóricos são abordados de forma breve, sem deixar no entanto que nenhum detalhe importante fique de fora. Uma implementação prática e eficiente em processador digital de sinais é um dos destaques do trabalho. VI

Construção e teste de uma câmara reverberante em escala reduzida para medição do coeficiente de espalhamento sonoro

XXVIII Encontro da SOBRAC

Este trabalho apresenta a construção e teste de uma câmara reverberante em escala reduzida destinada à medição do coeficiente de espalhamento sonoro devido à incidência aleatória, conforme descrito na norma ISO 17497-1. Com exceção do microfone e dispositivos de processamento de sinais, o equipamento pode ser descrito como de "baixo custo". A mesa giratória foi montada com um motor de passo e o deslocamento da fonte sonora e do microfone foram automatizados, de forma a reduzir o tempo requerido para completar um ensaio. Um sensor de temperatura e umidade foi instalado para fins de monitoramento. Amostra de perfil senoidal, para o qual coeficientes de espalhamento são conhecidos, foi construída e usada para avaliar o equipamento. Os resultados demonstraram que a construção foi feita com sucesso. Limitações do método e do equipamento são discutidas.

Dereverberação de voz baseada em dois estágio de predição linear utilizando múltiplos microfones

Anais do XXII Simpósio Brasileiro de Telecomunicações

Resumo-Neste trabalho apresentamos um m• etodo de dereverberac ‚ão de voz utilizando m • ultiplos microfones baseado em predic ‚ão linear (PL). Em um primeiro est• agio de PL, poucos coeficientes são suficientes para branquear o envelope espectral do sinal de voz. Em um segundo est• agio de PL, um grande n • umero de coeficientes • e utilizado para branquear o envelope espectral devido a reverberac ‚ão. O envelope espectral da voz • e reintroduzido para produzir a estimativa do sinal dereverberado. Os sinais reverberados obtidos por meio de m • ultiplos microfones são diferentes entre si, o que contribui para a melhora da an• alise de PL em cada est• agio. O processo • e adequado para filtragem adaptativa. Resultados baseados em respostas impulsivas de reverberac ‚ão e filtragem adaptativa FTF apontam para um bom potencial de desempenho.

Redução de ruído em aparelhos auditivos binaurais baseada no MWF e na coerência interaural

Anais de XXXVII Simpósio Brasileiro de Telecomunicações e Processamento de Sinais

Resumo-O filtro de Wiener multicanal (MWF) tem sido extensivamente utilizado para redução de ruído em aparelhos auditivos binaurais. Entretanto, apresenta a desvantagem de distorcer as pistas acústicas do ruído residual, alterando a percepção da localização da fonte sonora pelo usuário. Este trabalho propõe uma variação do MWF baseada na coerência interaural. Resultados preliminares indicam que o novo método permite a preservação do cenário acústico original ao custo de uma diminuição controlada da capacidade de redução de ruído do MWF convencional. Palavras-Chave-Aparelhos auditivos binaurais, MWF, redução de ruído, coerência interaural.

Estudo Comparativo do Impacto de Algoritmos de Compensação de Jitter sobre a Qualidade da Fala

grcm.dcc.ufam.edu.br

O jitter é a variação do atraso de entrega de pacotes de voz transmitidos através de redes de dados IP. Existem alguns algoritmos na literatura, os algoritmos de compensação de jitter, cujo objetivo é amenizar os efeitos do jitter sobre a qualidade da fala. Contudo, a eficácia desses algoritmos varia conforme as condições da rede de comunicação. O presente artigo apresenta os resultados da implementação de alguns algoritmos de compensação de jitter em um softphone de código aberto, fazendo com que seja possível testar cada um deles sob diferentes condições da rede e realizar uma avaliação de desempenho desses algoritmos.

Robosonic: Manipulação de Sons Aleatória Assistida por Robots

2009

Neste texto, pretendemos explorar as possibilidades de manipulação de sons num contexto de realidade aumentada (AR) através da utilização de robots. Utilizamos o comportamento aleatório dos robots, num espaço circunscrito para a modulação em tempo real de duas ...

Adaptação acústico-prosódica entre falantes

Revista da Associação Portuguesa de Linguística

This paper presents a global analysis of entrainment in map-task dialogues in European Portuguese, including 48 dialogues, between 24 speakers. Our main goal is to analyze the acoustic-prosodic similarities between speaker pairs, namely if there are global entrainment cues displayed in the dialogues, if entrainment is manifested in distinct sets of features shared amongst the speakers, if entrainment depends on the gender and role of the speaker (giver or follower), and if speakers tend to entrain more with specific interlocutors regardless of the role. Results show that globally speakers tend to be more similar to their partners than to their own speech in the majority of the analyzed features, a strong evidence for entrainment. Moreover, almost all the pairs of speakers display cues of global entrainment, even though in different degrees (speakers entrain but in distinct features). Additionally, the role and gender effects tend to be less striking than the specific interlocutor ef...