博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
初识windows语音采集和回放
阅读量:6695 次
发布时间:2019-06-25

本文共 2760 字,大约阅读时间需要 9 分钟。

一、数字音频基础知识Fourier级数: 

    任何周期的波形可以分解成多个正弦波,这些正弦波的频率都是整数倍。级数中其他正线波的频率是基础频率的整数倍。基础频率称为一级谐波。 PCM: 
    pulse code modulation,脉冲编码调制,即对波形按照固定周期频率采样。为了保证采样后数据质量,采样频率必须是样本声音最高频率的两倍,这就是Nyquist频率。样本大小:
    采样后用于存储振幅级的位数,实际就是脉冲编码的阶梯数,位数越大表明精度越高,这一点学过数字逻辑电路的应该清楚。 声音强度: 
    波形振幅的平方。两个声音强度上的差常以分贝(db)为单位来度量, 计算公式如下: 
    20*log(A1/A2)分贝。A1,A2为两个声音的振幅。如果采样大小为8位,则采样的动态范围为20*log(256)分贝=48db。如果样本大小为16位,则采样动态范围为20*log(65536)大约是96分贝,接近了人听觉极限和痛苦极限,是再线音乐的理想范围。windows同时支持8位和16位的采样大小。二、相关API函数,结构,消息
对于录音设备来说,windows 提供了一组wave***的函数,比较重要的有以下几个: 打开录音设备函数 
MMRESULT waveInOpen(
  LPHWAVEIN phwi,            //输入设备句柄
  UINT uDeviceID,            //输入设备ID
  LPWAVEFORMATEX pwfx,       //录音格式指针
  DWORD dwCallback,          //处理MM_WIM_***消息的回调函数或窗口句柄,线程ID
  DWORD dwCallbackInstance,  
  DWORD fdwOpen              //处理消息方式的符号位
);为录音设备准备缓存函数 
MMRESULT waveInPrepareHeader(  HWAVEIN hwi,  LPWAVEHDR pwh, UINT bwh );  给输入设备增加一个缓存 
MMRESULT waveInAddBuffer(  HWAVEIN hwi, LPWAVEHDR pwh, UINT cbwh );  开始录音 
MMRESULT waveInStart(  HWAVEIN hwi  );  清除缓存 
MMRESULT waveInUnprepareHeader( HWAVEIN hwi,LPWAVEHDR pwh, UINT cbwh);  停止录音 
MMRESULT waveInReset( HWAVEIN hwi );  关闭录音设备 
MMRESULT waveInClose( HWAVEIN hwi );  Wave_audio数据格式 
typedef struct { 
    WORD  wFormatTag; //数据格式,一般为WAVE_FORMAT_PCM即脉冲编码
    WORD  nChannels; //声道
    DWORD nSamplesPerSec; //采样频率
    DWORD nAvgBytesPerSec; //每秒数据量
    WORD  nBlockAlign; 
    WORD  wBitsPerSample;//样本大小 
    WORD  cbSize; 
} WAVEFORMATEX;  waveform-audio 缓存格式  
typedef struct { 
    LPSTR  lpData; //内存指针
    DWORD  dwBufferLength;//长度 
    DWORD  dwBytesRecorded; //已录音的字节长度
    DWORD  dwUser; 
    DWORD  dwFlags; 
    DWORD  dwLoops; //循环次数
    struct wavehdr_tag * lpNext; 
    DWORD  reserved; 
} WAVEHDR;  相关消息  
MM_WIM_OPEN:打开设备时消息,在此期间我们可以进行一些初始化工作
MM_WIM_DATA:当缓存已满或者停止录音时的消息,处理这个消息可以对缓存进行重新分配,实现不限长度录音
MM_WIM_CLOSE:关闭录音设备时的消息。
相对于录音来说,回放就简单的多了,用到的函数主要有以下几个: 打开回放设备  
MMRESULT waveOutOpen(
  LPHWAVEOUT phwo,           
  UINT uDeviceID,            
  LPWAVEFORMATEX pwfx,       
  DWORD dwCallback,          
  DWORD dwCallbackInstance,  
  DWORD fdwOpen              
);  为回放设备准备内存块  
MMRESULT waveOutPrepareHeader(
  HWAVEOUT hwo,  
  LPWAVEHDR pwh, 
  UINT cbwh      
);写数据(放音)  
MMRESULT waveOutWrite(
  HWAVEOUT hwo,  
  LPWAVEHDR pwh, 
  UINT cbwh      
);相应的也有三个消息,用法跟录音的类似: 三、程序设计一个录音程序的简单流程: 打开录音设备waveInOpen===>准备wave数据头waveInPrepareHeader===>
准备数据块waveInAddBuffer===>开始录音waveInStart===>停止录音(waveInReset) ===>
关闭录音设备(waveInClose)
当开始录音后当buffer已满时,将收到MM_WIM_DATA消息,处理该消息可以保存已录好数据。回放程序比这个要简单的多: 
打开回放设备waveOutOpen===>准备wave数据头waveOutPrepareHeader===>写wave数据waveOutWrite===>
停止放音(waveOutRest) ===>关闭回放设备(waveOutClose)如何处理MM消息: 
MSDN告诉我们主要有 CALLBACK_FUNCTION、CALL_BACKTHREAD、CALLBACK_WINDOW 三种方式,常用的是
Thread,window方式。
 线程模式
waveInOpen(&hWaveIn,WAVE_MAPPER,&waveform,m_ThreadID,NULL,CALLBACK_THREAD),我们可以继承MFC的CwinThread类,只要相应的处理线程消息即可。
MFC线程消息的宏为: 
    ON_THREAD_MESSAGE,可以这样添加消息映射: 
    ON_THREAD_MESSAGE(MM_WIM_CLOSE, OnMM_WIM_CLOSE)  窗口模式
类似于线程模式,参见源程序即可。 

转载于:https://www.cnblogs.com/tkppain/archive/2013/06/07/3123405.html

你可能感兴趣的文章
CodeHub#1 回顾 | 敏捷开发与动态更新在支付宝 App 内的实践 ...
查看>>
阿里云图数据库GDB公测,高度连接数据查询效率提升10倍 ...
查看>>
Mysql存储之ORM框架SQLAlchemy
查看>>
45个值得收藏的 CSS 形状
查看>>
Aop说明
查看>>
国外 服务器,阿里云海外服务器-海外节点云服务器全线2折起挺好
查看>>
高仙机器人秦宝星:2019年,服务机器人量产之年
查看>>
企业应用混合云网络解决方案
查看>>
spring boot2 整合(一)Mybatis (特别完整!)
查看>>
如何购买阿里云服务器(ECS)
查看>>
设计模式简介
查看>>
书籍:python网络编程 Python Network Programming - 2019
查看>>
5G火车站来了!上海虹桥火车站5G网络建设正式启动
查看>>
Flutter终将逆袭!1.2版本发布,或将统一江湖
查看>>
社区团购公司“邻邻壹” 完成 3000 万美元 A 轮融资,今日资本领投
查看>>
mysql5.7获取root密码
查看>>
【C#】使用fo-dicom完成BMP,JPG,PNG图片转换为DICOM文件
查看>>
java8学习:Optional的简单使用
查看>>
Docker实战(三)之访问Docker仓库
查看>>
Spring Boot中使用Swagger2
查看>>