Ramazan Çolak - Academia.edu (original) (raw)
Papers by Ramazan Çolak
Ses etkinligi algilama, genelde konusma tanima, konusma sikistirma gibi konusma isleme sureclerin... more Ses etkinligi algilama, genelde konusma tanima, konusma sikistirma gibi konusma isleme sureclerinin basinda kullanilan bir uygulamadir. Konusma sesinin olup olmadigini tespit etmede kullanilir ve buna gore uygulamanin devamina yon verir. Sesin varligini tespit etmede kullanilan belli basli ozellikler vardir. Kullanilan ozelliklerin fazla olmasi algoritmanin verimliligi ile dogrudan iliskilidir. Klasik VAD algoritmalari genelde STE kullanilarak olusturuldugundan, dusuk sinyal gurultu orani degerlerinde cok hassastir, bu yuzden istenilen sonuclari veremeyebilir. Cozumde kullanilan ozellikler icin gercek zamanli sesler kullanarak sesli bolge ve gurultulu bolge ayirt edilmeye calisilmistir. Bu calismada sesin varligini tespit etmek icin STE, periyodiklik ve Spektral duzluk gibi uc ozellik kullanilmistir, kullanilan bu uc ozellik ile dusuk SNR degerlerinde de istenilen sonuclar elde edilmistir. Bu yontemin, ozellikle dusuk SNR degerlerinde klasik metotlara gore daha iyi performans elde ettigi gozlemlenmistir.
IEEE Access, 2021
In this study, a voice activity detection technique is designed using features such as short-term... more In this study, a voice activity detection technique is designed using features such as short-term energy, periodicity and spectral flatness. The desired results are obtained by using these three features, even at low signal to noise ratio values. In addition, performance of multi-channel noise reduction algorithms such as Wiener speech distortion weighted, spatial prediction, minimum variance distortion-less response are compared using the proposed voice activity detection. Two different audio signals and three different noise types are used in the experiment. Noisy speech and only detection of noisy areas have been performed by proposed voice activity detection algorithm. The filter coefficients have been calculated for each filter algorithm used after detection of noisy speech and only noisy areas. The calculated filter coefficients have been multiplied by the frequency components of the signal received from the reference microphone to obtain an enhanced signal. Segmental signal to noise ratio, an objective method, and mean opinion score as a subjective method have been used to evaluate the performance of the filters. Speech distortion weighted Wiener filter has been found to be the best filter for noise reduction performance.
DergiPark (Istanbul University), Dec 18, 2018
Ses etkinliği algılama, genelde konuşma tanıma, konuşma sıkıştırma gibi konuşma işleme süreçlerin... more Ses etkinliği algılama, genelde konuşma tanıma, konuşma sıkıştırma gibi konuşma işleme süreçlerinin başında kullanılan bir uygulamadır. Konuşma sesinin olup olmadığını tespit etmede kullanılır ve buna göre uygulamanın devamına yön verir. Sesin varlığını tespit etmede kullanılan belli başlı özellikler vardır. Kullanılan özelliklerin fazla olması algoritmanın verimliliği ile doğrudan ilişkilidir. Klasik VAD algoritmaları genelde STE kullanılarak oluşturulduğundan, düşük sinyal gürültü oranı değerlerinde çok hassastır, bu yüzden istenilen sonuçları veremeyebilir. Çözümde kullanılan özellikler için gerçek zamanlı sesler kullanarak sesli bölge ve gürültülü bölge ayırt edilmeye çalışılmıştır. Bu çalışmada sesin varlığını tespit etmek için STE, periyodiklik ve Spektral düzlük gibi üç özellik kullanılmıştır, kullanılan bu üç özellik ile düşük SNR değerlerinde de istenilen sonuçlar elde edilmiştir. Bu yöntemin, özellikle düşük SNR değerlerinde klasik metotlara göre daha iyi performans elde ettiği gözlemlenmiştir.
Ses etkinligi algilama, genelde konusma tanima, konusma sikistirma gibi konusma isleme sureclerin... more Ses etkinligi algilama, genelde konusma tanima, konusma sikistirma gibi konusma isleme sureclerinin basinda kullanilan bir uygulamadir. Konusma sesinin olup olmadigini tespit etmede kullanilir ve buna gore uygulamanin devamina yon verir. Sesin varligini tespit etmede kullanilan belli basli ozellikler vardir. Kullanilan ozelliklerin fazla olmasi algoritmanin verimliligi ile dogrudan iliskilidir. Klasik VAD algoritmalari genelde STE kullanilarak olusturuldugundan, dusuk sinyal gurultu orani degerlerinde cok hassastir, bu yuzden istenilen sonuclari veremeyebilir. Cozumde kullanilan ozellikler icin gercek zamanli sesler kullanarak sesli bolge ve gurultulu bolge ayirt edilmeye calisilmistir. Bu calismada sesin varligini tespit etmek icin STE, periyodiklik ve Spektral duzluk gibi uc ozellik kullanilmistir, kullanilan bu uc ozellik ile dusuk SNR degerlerinde de istenilen sonuclar elde edilmistir. Bu yontemin, ozellikle dusuk SNR degerlerinde klasik metotlara gore daha iyi performans elde e...
Ses etkinligi algilama, genelde konusma tanima, konusma sikistirma gibi konusma isleme sureclerin... more Ses etkinligi algilama, genelde konusma tanima, konusma sikistirma gibi konusma isleme sureclerinin basinda kullanilan bir uygulamadir. Konusma sesinin olup olmadigini tespit etmede kullanilir ve buna gore uygulamanin devamina yon verir. Sesin varligini tespit etmede kullanilan belli basli ozellikler vardir. Kullanilan ozelliklerin fazla olmasi algoritmanin verimliligi ile dogrudan iliskilidir. Klasik VAD algoritmalari genelde STE kullanilarak olusturuldugundan, dusuk sinyal gurultu orani degerlerinde cok hassastir, bu yuzden istenilen sonuclari veremeyebilir. Cozumde kullanilan ozellikler icin gercek zamanli sesler kullanarak sesli bolge ve gurultulu bolge ayirt edilmeye calisilmistir. Bu calismada sesin varligini tespit etmek icin STE, periyodiklik ve Spektral duzluk gibi uc ozellik kullanilmistir, kullanilan bu uc ozellik ile dusuk SNR degerlerinde de istenilen sonuclar elde edilmistir. Bu yontemin, ozellikle dusuk SNR degerlerinde klasik metotlara gore daha iyi performans elde ettigi gozlemlenmistir.
IEEE Access, 2021
In this study, a voice activity detection technique is designed using features such as short-term... more In this study, a voice activity detection technique is designed using features such as short-term energy, periodicity and spectral flatness. The desired results are obtained by using these three features, even at low signal to noise ratio values. In addition, performance of multi-channel noise reduction algorithms such as Wiener speech distortion weighted, spatial prediction, minimum variance distortion-less response are compared using the proposed voice activity detection. Two different audio signals and three different noise types are used in the experiment. Noisy speech and only detection of noisy areas have been performed by proposed voice activity detection algorithm. The filter coefficients have been calculated for each filter algorithm used after detection of noisy speech and only noisy areas. The calculated filter coefficients have been multiplied by the frequency components of the signal received from the reference microphone to obtain an enhanced signal. Segmental signal to noise ratio, an objective method, and mean opinion score as a subjective method have been used to evaluate the performance of the filters. Speech distortion weighted Wiener filter has been found to be the best filter for noise reduction performance.
DergiPark (Istanbul University), Dec 18, 2018
Ses etkinliği algılama, genelde konuşma tanıma, konuşma sıkıştırma gibi konuşma işleme süreçlerin... more Ses etkinliği algılama, genelde konuşma tanıma, konuşma sıkıştırma gibi konuşma işleme süreçlerinin başında kullanılan bir uygulamadır. Konuşma sesinin olup olmadığını tespit etmede kullanılır ve buna göre uygulamanın devamına yön verir. Sesin varlığını tespit etmede kullanılan belli başlı özellikler vardır. Kullanılan özelliklerin fazla olması algoritmanın verimliliği ile doğrudan ilişkilidir. Klasik VAD algoritmaları genelde STE kullanılarak oluşturulduğundan, düşük sinyal gürültü oranı değerlerinde çok hassastır, bu yüzden istenilen sonuçları veremeyebilir. Çözümde kullanılan özellikler için gerçek zamanlı sesler kullanarak sesli bölge ve gürültülü bölge ayırt edilmeye çalışılmıştır. Bu çalışmada sesin varlığını tespit etmek için STE, periyodiklik ve Spektral düzlük gibi üç özellik kullanılmıştır, kullanılan bu üç özellik ile düşük SNR değerlerinde de istenilen sonuçlar elde edilmiştir. Bu yöntemin, özellikle düşük SNR değerlerinde klasik metotlara göre daha iyi performans elde ettiği gözlemlenmiştir.
Ses etkinligi algilama, genelde konusma tanima, konusma sikistirma gibi konusma isleme sureclerin... more Ses etkinligi algilama, genelde konusma tanima, konusma sikistirma gibi konusma isleme sureclerinin basinda kullanilan bir uygulamadir. Konusma sesinin olup olmadigini tespit etmede kullanilir ve buna gore uygulamanin devamina yon verir. Sesin varligini tespit etmede kullanilan belli basli ozellikler vardir. Kullanilan ozelliklerin fazla olmasi algoritmanin verimliligi ile dogrudan iliskilidir. Klasik VAD algoritmalari genelde STE kullanilarak olusturuldugundan, dusuk sinyal gurultu orani degerlerinde cok hassastir, bu yuzden istenilen sonuclari veremeyebilir. Cozumde kullanilan ozellikler icin gercek zamanli sesler kullanarak sesli bolge ve gurultulu bolge ayirt edilmeye calisilmistir. Bu calismada sesin varligini tespit etmek icin STE, periyodiklik ve Spektral duzluk gibi uc ozellik kullanilmistir, kullanilan bu uc ozellik ile dusuk SNR degerlerinde de istenilen sonuclar elde edilmistir. Bu yontemin, ozellikle dusuk SNR degerlerinde klasik metotlara gore daha iyi performans elde e...