狠狠色丁香婷婷综合尤物/久久精品综合一区二区三区/中国有色金属学报/国产日韩欧美在线观看 - 国产一区二区三区四区五区tv

LOGO OA教程 ERP教程 模切知識交流 PMS教程 CRM教程 開發(fā)文檔 其他文檔  
 
網(wǎng)站管理員

C#實現(xiàn)語音預處理:降噪、靜音檢測、自動增益(附Demo源碼)

freeflydom
2025年7月4日 10:27 本文熱度 40

      無論是在音視頻錄制系統(tǒng),還是音視頻通話系統(tǒng)、或視頻會議系統(tǒng)中,對從麥克風采集到的說話的聲音數(shù)據(jù)進行預處理,都是是非常必要的。

      語音數(shù)據(jù)預處理主要包括:降噪(Noise Reduction)、靜音檢測(Silence Detection/VAD)、自動增益(Automatic Gain Control, AGC) 。

一. 語音預處理的作用

   我們先解釋一下,降噪、靜音檢測、自動增益,這些語音預處理分別起什么作用。

(1)降噪

      降噪,用于消除背景噪聲,比如馬路車流聲、環(huán)境雜音等,以保留清晰的說話人聲。

      更高級的,結(jié)合AI模型訓練,還可以消除電腦的風扇聲、鍵盤敲擊聲等等。

(2)靜音檢測

      靜音檢測,又稱為語音活動檢測,用于識別音頻流中的靜音片段(沒有講話人聲),這樣可以簡化后續(xù)的編碼等環(huán)節(jié),并可以節(jié)省傳遞所需要的帶寬。

(3)自動增益

      自動增益,用于動態(tài)調(diào)整說話聲音的音量,使輸出電平保持穩(wěn)定,以避免講話的聲音忽大忽小。

二. 實現(xiàn)語音預處理

      接下來,我們使用C#實現(xiàn)一個Demo,這個Demo將從麥克風采集聲音數(shù)據(jù),然后進行語音預處理,并且將處理后的聲音數(shù)據(jù)實時播放出來。Demo的運行效果如下圖所示:

      

      Demo 功能很簡單,那我們來具體看看代碼是如何實現(xiàn)的。

1. 創(chuàng)建采集器、預處理器、播放器

     麥克風聲音數(shù)據(jù)采樣率我們選擇16K、單聲道。 

WaveSampleRate sr = WaveSampleRate.S16k;
int channelCount = 1;
//創(chuàng)建語音預處理器,開啟降噪、自動增益、靜音檢測
this.voicePreprocessor = CapturerFactory.CreateVoicePreprocessor(sr, channelCount, true ,true);
//創(chuàng)建麥克風采集器
this.microphoneCapturer = CapturerFactory.CreateMicrophoneCapturer(int.Parse(this.textBox_mic.Text), sr);
this.microphoneCapturer.AudioCaptured += new ESBasic.CbGeneric<byte[]>(microphoneCapturer_AudioCaptured);
//創(chuàng)建聲音播放器
this.audioPlayer = PlayerFactory.CreateAudioPlayer(int.Parse(this.textBox_speaker.Text), (int)sr, channelCount, 16, 2);                
this.microphoneCapturer.Start();

  CreateVoicePreprocessor 方法的最后兩個參數(shù)可以指定在降噪的同時,是否開啟靜音檢測和自動增益功能。

2. 預處理語音數(shù)據(jù)

      語音預處理器每次處理10ms的聲音數(shù)據(jù),而現(xiàn)在的麥克風采集器每次采集的是20ms的PCM數(shù)據(jù),所以,我們將其拆成兩個10ms數(shù)據(jù),再提交給預處理器處理。

void microphoneCapturer_AudioCaptured(byte[] audioData)
{
    if (this.checkBox_enabled.Checked)
    {
        //麥克風每次采集20ms數(shù)據(jù),降噪器每次處理10ms數(shù)據(jù)。
        byte[] frame10ms1 = new byte[audioData.Length / 2];
        byte[] frame10ms2 = new byte[audioData.Length / 2];
        Buffer.BlockCopy(audioData, 0, frame10ms1, 0, frame10ms1.Length);
        Buffer.BlockCopy(audioData, frame10ms1.Length, frame10ms2, 0, frame10ms2.Length);
        this.HandleData(frame10ms1);
        this.HandleData(frame10ms2);
        return;
    }
    this.audioPlayer.Play(audioData);
}

(1)通過一個CheckBox勾選框來實時控制是否啟用語音預處理,這樣在測試時,就可以很方便的對比體驗開啟了語音預處理的效果。

(2)調(diào)用IVoicePreprocessor 的 Process 方法,就可以完成一幀語音數(shù)據(jù)(10ms)的預處理。如下所示:

private void HandleData(byte[] frame10ms)
{
    byte[] res = this.voicePreprocessor.Process(frame10ms);            
    if (res == null) //靜音幀
    {
        ++this.silenceFrameCountTotal;
        this.audioPlayer.Play(this.voicePreprocessor.SlienceFrame);
    }
    else
    {
        this.audioPlayer.Play(res);
    }
}

  如果Process 方法返回的是null,表示檢測到該幀是靜音幀,于是,將內(nèi)置的10ms靜音幀 SlienceFrame 提交給播放器去播放。

3. 統(tǒng)計靜音幀數(shù)量

  一個語音幀是10ms,那么1秒鐘就有100個語音幀,程序中,我們統(tǒng)計了上一秒出現(xiàn)了多少個靜音幀,并在UI左下方顯示出來。

private volatile int silenceFrameCountTotal = 0;
private volatile int silenceFrameCountPre = 0;
private void timer1_Tick(object sender, EventArgs e)
{
    int delt = this.silenceFrameCountTotal - this.silenceFrameCountPre;
    this.silenceFrameCountPre = this.silenceFrameCountTotal;
    //顯示上一秒靜音幀數(shù)量。
    this.label_silenceFrameCount.Text = delt.ToString();
}

   實際測試時可以發(fā)現(xiàn),當不說話時,UI實時顯示1秒鐘出現(xiàn)的靜音幀是100個。

三. Demo源碼下載

        源碼下載:VoicePreprocessDemo.rar

   如果不想打開VS,可以直接到Debug目錄下,雙擊 Oraycn.VoicePreprocessDemo.exe 即可運行Demo,開始體驗語音降噪、靜音檢測、自動增益的處理效果。

        建議使用耳麥測試,對比效果會更明顯。當開啟預處理時,能立即感覺到背景噪音消失了,而且說話的聲音變大了(AGC),不說話時,UI顯示靜音幀的數(shù)量變多。

   來下載試試語音預處理的效果吧。

轉(zhuǎn)自https://www.cnblogs.com/zhuweisky/p/18936492


該文章在 2025/7/4 10:27:14 編輯過
關(guān)鍵字查詢
相關(guān)文章
正在查詢...
點晴ERP是一款針對中小制造業(yè)的專業(yè)生產(chǎn)管理軟件系統(tǒng),系統(tǒng)成熟度和易用性得到了國內(nèi)大量中小企業(yè)的青睞。
點晴PMS碼頭管理系統(tǒng)主要針對港口碼頭集裝箱與散貨日常運作、調(diào)度、堆場、車隊、財務費用、相關(guān)報表等業(yè)務管理,結(jié)合碼頭的業(yè)務特點,圍繞調(diào)度、堆場作業(yè)而開發(fā)的。集技術(shù)的先進性、管理的有效性于一體,是物流碼頭及其他港口類企業(yè)的高效ERP管理信息系統(tǒng)。
點晴WMS倉儲管理系統(tǒng)提供了貨物產(chǎn)品管理,銷售管理,采購管理,倉儲管理,倉庫管理,保質(zhì)期管理,貨位管理,庫位管理,生產(chǎn)管理,WMS管理系統(tǒng),標簽打印,條形碼,二維碼管理,批號管理軟件。
點晴免費OA是一款軟件和通用服務都免費,不限功能、不限時間、不限用戶的免費OA協(xié)同辦公管理系統(tǒng)。
Copyright 2010-2025 ClickSun All Rights Reserved