MEMS麦克风驱动下一代语音编解码器改进_产业_新闻资讯

作者：CML Microcircuits无线语音和数据产品经理David Brooke

引言

微机电系统（MEMS）技术已在物联网（IoT）行业得到广泛应用，可帮助实现各种微型、低功耗传感器，这些传感器也正在改变我们与设备进行交互的方式。得益于这项创新技术，并伴随数字视听通信设备变得越来越普及和越来越可靠，人们用在敲击键盘，移动定点设备或操作开关上的时间也大幅减少。

在物联网中的MEMS传感器中，以MEMS麦克风最为突出，它可为基于语音的应用提供更广泛的可能性，能够实现入侵者警报、智能扬声器、车内控制系统等设计。随着物联网领域成本和上市时间的压力不断增大，现成可用的高质量数字技术对基于语音的设备开发至关重要。但是，由于市场最近关注的重点放在多媒体技术，因此语音技术已被忽略，导致缺少适用于MEMS麦克风的接口器件。

在本文中，我们将看到，随着开发厂商努力寻求利用MEMS麦克风技术带来的巨大机遇，MEMS麦克风接口器件的短缺情况正在发生改变。

MEMS技术

MEMS这个术语也涵盖微制造工艺，涉及在微观尺度内实现机械部件的移动。通过将电气和机械组件集成到单个芯片，MEMS技术可用于生产微型机电传感器，其尺寸从几个微米到毫米级。

与传统的机械传感器相比，MEMS传感器很容易实现大批量生产，从而具有更好的规模经济效果，其紧凑的尺寸、大幅降低的功耗和更高的灵敏度使MEMS传感器得到更广泛采用，尤其是在物联网领域。如今，在我们所有人都随身携带的智能手机、智能手表和健身追踪器中都采用了各种MEMS器件。例如，智能手机中的MEMS陀螺仪重量不到1毫克，其体积不到一粒沙子大小。

静电传导（Electrostatic transduction）涉及可变的电容，由于可以对微加工的硅进行掺杂以提供导电性，并且在制造过程中不需要其他材料，传统上这种技术是MEMS传感器中最受欢迎的类型。图1所示为一个数字MEMS麦克风的功能框图。传感器元件包含一个可移动的膜片和一个固定的背板（backplate），它们之间的电容随着声波的气压导致膜片弯曲度变化。板载放大器将该电容转换为电信号，然后由ADC转换为二进制数字信号。

图1：MEMS麦克风功能框图。

(来源: https://www.eenewsanalog.com/content/analog-and-digital-mems-microphone-design-considerations/page/0/1)

尽管MEMS麦克风可提供模拟和数字输出，但常见的更直接，更方便的是采用数字接口来设计和实现解决方案，从而导致数字MEMS麦克风在市场上更受欢迎。尤其是需要在恶劣或嘈杂电磁环境中工作的系统。数字MEMS麦克风采用脉冲密度调制（PDM）方式，受噪声和串扰影响相对较小，能够产生高度过采样的单位（single-bit）数据流作为输出。PDM还具有其它优势，可以使两个数字麦克风共享同一公共时钟和数据线，每个麦克风都配置为在时钟信号的不同时沿产生其输出。

数字MEMS麦克风具有更高信噪比（SNR）、更低功耗和更高灵敏度，以及出色的温度特性，能够以超小型封装提供，并与表面安装组装工艺完全兼容。

随着越来越多的现代智能手机和其他智能设备能够处理语言和语音指令，对高质量，紧凑型声音技术（包括麦克风）的需求呈现出强劲增长态势。除智能手机之外，MEMS麦克风也用于耳机、笔记本电脑和助听器、以及越来越多的IoT设备等设计，如可穿戴设备、远程控制设备以及冰箱、空调和服务机器人等家用电器。

麦克风本身在智能设备中的价值有限，最终其输出信号必须经过进一步处理才能被系统控制器分析，因此具体应用的开发人员必须选择合适的接口器件。

下一代语音编解码器

与麦克风的接口长期以来一直由语音编解码器实现，但传统的编解码器被设计为与驻极体麦克风兼容，而不兼容现代数字MEMS麦克风。之前的语音编解码器缺少与MEMS麦克风端接所需的许多功能，其中包括抽取滤波（decimation filtering），其作用是将PDM转换为PCM格式以便进一步处理。此外，在包括扬声器和麦克风阵列在内的许多应用中，具有更高效率的D类放大器已成为任何MEMS麦克风接口的重要组成部分。

在智能电话和平板电脑市场兴起的推动下，最近业界关注的编解码器开发优先考虑多媒体应用，这些器件并非是专门针对语音应用要求而开发的解决方案。因而，这种情况导致出现了最新语音编解码器市场的空白，可能使应用开发人员必须在现有器件基础上添加额外的电路。

幸运的是，一些元器件制造商已经意识到市场对下一代语音编解码器的需求，并把更多的功能集成到小型，低成本器件中，且具有与电池供电设备适应的高能效水平。

新一代语音编解码器的一个典型示例是CML Microcircuits的CMX655D，如图2所示。CMX655D是一款超低功耗语音编解码器，它支持最新的MEMS麦克风技术，专为始终在线的数字语音应用而设计。CMX655D具有超低功耗，在立体声录音模式下通常只消耗500µA的电流，而在低功耗聆听模式下所消耗的电流则更少，因此非常适合电池供电设备。该芯片支持普通电话（300Hz～3.4kHz）和高清语音（50Hz～7kHz）的常用带宽，以及50Hz～20kHz的全音频模式。

此外，通过与两个麦克风同时连接，并在整个设备上保持相同的两条路径相位匹配，该器件还能够实现外部噪声消除。CMX655D封装还包括一个集成式高效D类扬声器驱动器，可提供高达1W的输出。包括通用DSP在内的其他同类器件通常不提供该项功能，因此需要额外的外部IC。

图2：CMX655D语音编解码器简化功能框图。

通过选择诸如CM655D之类的语音编解码器，开发人员能够简化硬件设计任务，并可将功能齐全的MEMS麦克风系统轻松集成到特定应用。尽管器件的选择对于降低开发成本和缩短上市时间至关重要，但这并不是选择解决方案时要考虑的唯一因素。在尝试集成任何器件时，开发环境是非常关键的因素，尤其在竞争激烈的物联网市场，器件的选择在很大程度上需要考虑支持工具套件的功能、易用性和经济性。

开源开发工具包

许多制造商都在提供定制的硬件和软件开发套件来支持其设备，但是，由于缩短开发时间和降低成本在物联网领域极其重要，因此开发人员越来越多地选择开源方案。在这种情况下，诸如Raspberry Pi（RPi）之类的系统已经不再局限于开发爱好者和教育领域，进而成为专业工程师的实用工具。

2014年发布的RPi Model B+引入了顶部硬件连接（HAT）接口，从而使第三方硬件更容易直接嵌入RPi基础架构（见图3所示）。这项强大的功能，再加上RPi基于Linux的操作系统，可实现快速开发、测试和原型制作，从而帮助设计团队更快地进入概念验证阶段。最重要的是，与使用定制开发板和专有软件的方案相比，这种方法可大大降低成本，并且为将来的进一步开发奠定坚实基础。

图3：CML Microcircuits的EV6550DHAT可添加板。

随着CMX655D的发布，CML Microcircuits已选择遵循这种开源技术途径。通过为HAT格式的CMX655D编解码器解决方案创建EV6550DHAT评估板，CML Microcircuits能够使Raspberry Pi社区可以轻松使用该新器件。此外，由于认识到开发人员不可能花很多时间去获取所需的知识，之后再将音频功能成功集成到具体应用，CML Microcircuits还为CMX655D-RPi配置提供了Linux驱动程序。这种低级别驱动程序可使开发环境适合于任何音频应用，并遵循标准高级Linux声音体系架构（ALSA）接口。ALSA体系架构具有非常灵活的界面，能够提供一个抽象级别，从而极大地简化涉及声音的应用开发。

结论

MEMS技术正在物联网领域得到广泛应用，可以针对各种应用场景实现批量生产的低成本传感器。数字MEMS麦克风是MEMS技术的一个典型示例，采用数字MEMS麦克风技术能够完成全新的人机交互，从而可以在智能手机、智能扬声器、可穿戴设备等许多领域实现高质量音频应用。

新一代编解码器支持MEMS麦克风的集成，并将所需的接口功能集成到具有小外形尺寸的低成本、低功耗器件中。通过使这些器件支持RPi和ALSA等开源开发工具软件框架，CML Microcircuits等创新制造商正在帮助客户降低开发成本，加快产品上市速度。

David Brooke, Wireless Voice and Data Product Manager

David has nearly 40 years of experience working in the electronics industry. As CML’s Wireless/Wireline Voice and Data Product Manager, specialising in baseband solutions, he works across all CML departments managing the products under his care. When he gets some time to himself, he can often be found cooking at home with a glass of red wine in hand