|
10楼
发表于 2022-7-29 23:04:24
|
只看该作者
广东省佛山市
有点复杂 如果不是对实时性要求特别高不建议你这么搞,过年在家时搞的了,现在的电脑没有代码 没法发给你参考,就简单说下过程你自己研究了
1.拼接PCM,可以用 bass库 “论坛搜索” 监听16000采样率16位音频,获取到音频的PCM数据流 然后拼接成一定长度(PCM就是字节集 每个字节=1个分贝dB,字节的大小就是声音大小的分贝)
2.预加重,对PCM的低频率部分放大处理 音频频率计算公式 就自己百d了
3.对预加重的PCM进行 分帧 加窗 可以看这个文章 信号处理(二)音频信号的分帧, 加窗
3.FFT(快速傅里叶变换) ,对分帧, 加汉明窗后的PCM数据 调用FFTW库来进行FFT计算
4.语谱图,把进行FFT计算后的PCM数据,调用ImGui内存画板来画语谱图,性能会很快,大概 1ms左右,怎么画可以看上面这个文章的其他篇
yolo怎么分类训练 你就要自己学了
补充内容 (2022-7-29 23:04):
https://blog.csdn.net/chumingqian/article/details/121653741
补充内容 (2022-7-29 23:09):
除了FFT计算这部分,其他的论坛 基本都有 |
|