视障者音乐制作交流基地

标题: 电脑音乐制作扫盲篇-第四章：音频设备常识-第四节：声卡与音频数字化 [打印本页]

作者: 王晓波 时间: 2015-8-21 15:17
标题: 电脑音乐制作扫盲篇-第四章：音频设备常识-第四节：声卡与音频数字化
本文作者：王晓波，出处：视障者音乐制作交流基地（szzyyzz.com）。做人要厚道，转载请注明作者与出处，谢谢！
亲们好！这次我们来聊聊“声卡与音频数字化”这个话题，请没有来的同学举手，好，不错，都到齐了哈。亲们可要仔细点哈，本节内容真的真的真的超级重要，其重要程度胜过火星探测！！真的不学不行！！！！一定要仔细做笔记哈。
模拟信号被放大后，要进入电脑了，模拟信号进出电脑的途径是声卡。这就是我们为什么需要声卡了。在以前我们曾经聊过，声卡是干什么的，它的“工作职责”很简单，就是负责声音的进出。也就是音频I/O。老王说：“‘IC’、‘IP’、‘IQ’我都知道是什么意思，‘IO’是什么？”哦，“I”就是“In”，“O”就是“Out”。I／O当然就是进和出啦。通常情况下，在录音的时候，声卡把声音变成数字，而播放的时候，声卡把数字变成声音。声卡就是干这个的。我们所说的“专业声卡”，是被设计用来编曲、录音、混音等音乐制作的。而“民用声卡”，则是为娱乐、欣赏而设计的。专业声卡也被称为“音频接口”或者“音频卡”。声卡除了有能让模拟信号流入、流出电脑这个功能外，还有例如数字信号与模拟信号之间的转换等其他功能。有一些声卡上还有DSP效果器芯片，可以把效果器的效果提供给硬件监听和混音使用。DSP就是数字信号处理器的英文缩写。
我们先来着重聊聊模拟信号与数字信号的转换。
可能很多初学的朋友一直都对“模拟”和“数字”感到很不理解。如果你还不明白究竟“模拟”是一个什么概念，那么我们来复习一些内容。
前面我们已经讲过了，世界上第一个话筒，是贝尔发明的电话机的话筒。它是一个小盒子里装满了炭粒，两端都接着电线。亲们知道炭粒是导电的。当对着话筒说话，炭粒振动，引起电流随着说话而忽强忽弱变化。这个强弱变化的电流经过放大后，在电话另一端的听筒上就使得听筒的振膜产生同样的振动，而再现出声音。这就是电话的原理。现在，无论是动圈、电容还是驻极体话筒等等，同样也都是这一个功能，那就是把话筒内振膜的振动转化成强弱不同的电流输送出来。而这个电流信号，就是我们所说的“模拟”信号。它和振膜的振动是完全一致的。
小妹疑惑的说：“那这种信号为什么要叫做‘模拟’呢，我们一般是指模仿另一个东西叫做‘模拟’啊。”其实，“模拟”是Analog的翻译名，英国人则写成Analogue。他不属于我们中国人的思维模式内的东西，以后我们可能还要碰到很多这样的概念和名称，你不能用我们中国文化里的东西去理解它，就像老外很难理解什么叫“道可道非常道”，什么叫“太极”等等，你只能尽量去体会这种词汇。
那什么是“数字”信号呢？首先我们要搞清楚数字信号是如何来记载信息的。
数字设备记录信息只有两个数：1和0。其实这个一般人都知道，但可能初学的朋友不明白，究竟为什么会是1和0呢？你可以这么理解：机器的语言只有两种，那就是开和关。一个芯片里有成千上亿的晶体管，它们是怎么运算的？其实很简单，它们只有两种模式，那就是开和关。举个例子，假设这么几个晶体管的状态是：“开关开关开开开关”，就这么构成了“10101110”这个机器语言，当然这只是举个例子而已，实际的工作原理不止如此，但归根到底是这么个道理。这就是机器的语言，也就是数字信号。在电脑中，最小的单位是B，全称Byte，叫做字节。一个字节有多大呢，它由8位2进制字符构成。象刚才的那个“开关开关开开开关”就构成了一个字节。一个字节可以记录一个英文字母。一个汉字则要用两个字节。1024B等于1kB，1024kB等于1MB，1024MB等于1GB，1024GB等于1TB。哦，不好意思，一不小心说顺嘴了，扯远了哈。模拟信号转化成数字信号的过程实际上就是一个采样与量化的过程。这个过程中，我们必须要认识的两个概念就是采样率和采样精度。这节的内容对于电脑知识薄弱的朋友来说，可能比较难以理解，我尽量用最容易理解的语言并多多用比喻来为大家解释。
我们在第一张里就讲过了“声波”。得到的结论就是：由于简谐运动是一切声音最基本的样式，所以声波的最基本样式就是正弦波。
下面来聊聊模数转换的全过程。
首先，要以一定的时间间隔对持续的模拟信号，也就是电压波，进行分段，以分段的时刻上的振幅来代表他，这个过程就是我们说的采样。分段时刻就是我们说的采样点。在采样点上的振幅时值就是采样值。单位时间内的采样次数就叫做采样频率。通常情况下，在数字音频领域，我们说的采样率就是指一秒内的采样次数。
这个过程就是，首先通过采样来将模拟信号（电压波）转化成脉冲幅度调制波，接下来，对得到的采样值用0与1的二进制数字信号语言来进行量化，把模拟信号表现为由0与1组成的二进制数值，然后在把0与1对应成电信号中脉冲的有与无，而给出脉冲编码调制波，也就是pcm波，这是一个编码的过程。这样便完成了模拟信号数字化的过程。
接下来，记录的信号被作为脉冲串取出，用这个脉冲串来计算振幅，这个过程就是译码的过程。在通过插补，把各个采样值之间的空添补上，这样就还原出了连续的声波。
接下来，我们要引进一个概念，就是“平面直角坐标系”，大家应该都听说过吧！“是不是就是我们用的读屏软件里的航列概念啊？”老长询问道。没错，可以这样理解平面直角坐标系。简而言之，就是在同一个平面内，用一个横向坐标和一个与横向坐标垂直的纵向坐标就能定位这个平面内的一个点。比如用读屏软件的模拟鼠标定位的时候，“34航、56列”，“1航、1列等等”。
下面来假设一下：我们用水平方向的列数来想象成采样率；用垂直方向的航数来想象成采样精度，这样就构建起了一个平面直角坐标系，通过这个坐标系来描述数字信号曲线的特征。
脉冲串能将声波还原成什么程度取决于两点。
第一、采样率的高低。采样率越高，还原程度越高，也就是在上面假设的平面直角坐标系中，横向分割越细致，比如我们把从左到右分成200列就要比分成100列的列距要短得多，也就是说，模拟鼠标每移动一列的距离就越短。
第二、量化的比特宽度。也叫做量化率，比特率，量化深度，也就是所使用二进制数的位数，直观的看，就是平面直角坐标系纵向分割的细致程度，原理同上。
“晓波，你那么说，我还是一头雾水。”老王目光呆滞的说。哦，那下面我给亲们举几个例子来理解一下。
模拟信号转化成数字信号的过程就像一个人在一定时间内描述一件事情，采样率是让这个人在这段时间内说话的次数，比特率是每一次发言的字数。一定时间内，让这个人说话的次数越多，这件事情就会被描述的越详细；每一次说话的字数越多，这件事情就被描述的越生动形象。
例如，这次晓波和大家一起聊电脑音乐制作扫盲篇。要是站长让晓波一年的时间只和大家聊一次，一次只说一个字，即便晓波再强悍也无能为力，晓波还是回家陪老婆去了哦，哈哈。但是，如果站长让晓波在这一年里，每天和大家聊一次，每一次说他一万字，这样晓波应该就可以在能力范围内，把电脑音乐制作给大家说得相对全面、相对详细了。
只要大家记住一点：我们假设的这个平面直角坐标系的横向分割越细致，声音的离散性就越不明显，声音曲线就越接近线性；纵向分割越细致，声音就越精确，越真实。总之，采样率与采样精度越高，数字声音就越真实。
现在是2015年，目前主流的专业声卡的最高采样率是192kHz。数字信号是离散的，两个采样点之间还可以进行无限的细分，在192kHz的采样率的情况下，两个采样点中还有十九万两千分之一秒的时间可以下功夫，哈哈。
老王说：“既然数字信号是离散的，不连续的，我们岂不是能听出断断续续的感觉，那音频数字化还有什么意义捏？”恩，要是让你能听出断断续续，那就真的没有意义了。
我们完全可以让你听不出来，因为人类的感觉器官是有局限性的，很好欺骗的，只要数字音频能用比人耳能够察觉的最短波长更短的时间间隔，比人耳能够察觉的最小振幅差异更高的精度，来描述模拟波，那么人耳就完全不能分辨模拟波与数字音频之间的差别，这样就可以很好的解决模拟信号的连续性与数字信号的离散性两者之间的矛盾了。
举一个很常见的例子。我们看电视，其实电视播放的画面并不是连贯的，而是在一闪一闪的，用不同画面连接起来的，因为人的视力有残像感，当两幅画面变化的时间小于人的视力能够察觉的最小限度，那么我们就看不出来一下一下闪动的画面和连贯的画面之间的区别了。电视画面闪动的频率有以下几种：25赫兹的是PAL制式；29.970赫兹是NTSC制式，也就是N制；59.94赫兹是double NTSC制式，也就是两个N制。这个频率在视频中的单位是针。当然这些都是题外话了哈，话说回来。
前面我已经说过了，人耳听力最高能达到20kHz左右。而根据注明的耐奎斯特（NYQUIST）采样定理，也就是说用大于一个正弦波的两倍的频率进行采样就能完全真实地还原该波形。以频谱中最高频率的二倍以上的频率进行采样，就可以完全重现原波形。所以我们可以很容易的知道，当采样率达到44.1kHz左右的时候，也就是两倍于20kHz的时候，人耳就无法听出离散的数字音频信号与真实的声音之间的区别了。“ 得了，打住，晓波，你是不是小学数学课也在睡觉阿?”老王连忙说，“20000的两倍应该是40000阿，那为什么这里是44100呢?”哦，我没有上课睡觉哈，看来老王现在听课还比较认真吗，不错，给你点个赞。
这里有个原因，因为在CD发明前，人们是用录像带来记录高音质的数字音频信号，用黑白来记录0与1。而当时的录像带格式是每秒30张，而一张图又可以分为490线，每一条线又可以储存三个采样信号，因此每秒有30乘以490再乘以3等于44100个采样点，这就是44.1kHz的由来。这就是为什么CD是采用44100赫兹采样率的原因。
“那为什么声卡还要支持192kHz这种是人耳听力最高极限八倍多的采样率呢？”阿风好奇的问。恩啦，这是因为，我们可以更精细的处理。
例如，我们在网上看到的图片一般不会大于1024乘以768的像素尺寸，也就是大约八十万像素左右。但是摄影师在拍摄的时候仍然会选择几百万甚至是上千万的像素的数码相机。这样在进行图片艺术处理的时候，就可以看到更多的细节，从而进行更加细致的处理了。
当然，现在适合使用192kHz的采样率建立工程和混音处理的场合并不多，一般只有在相当注重音频品质的数字高清电影当中才这样使用。加上，在跑192kHz的工程的时候，电脑的运算压力也大了将近八倍，所以，一般的电脑也是无法带动192kHz的工程的。
现在很多所谓入门级别的声卡都可以支持最高96kHz的采样率。在家自娱自乐的爱好者，可以使用44.1kHz或者88.2kHz的采样率。
为什么要推荐88.2kHz的采样率，而不推荐96kHz的采样率呢？这是因为如果使用96kHz或者48kHz的采样率建立工程，进行编曲、录音和混音，那么在刻录到CD之前就要将采样率转化成44.1kHz，否则，CD播放器是无法识别的，这样就需要重采样（Sample Rate Conversion缩写为SRC）。而重采样做不好的话，反而会影响品质。用同样的重采样方法，从88.2kHz到44.1kHz的重采样效果要好于从96kHz到44.1kHz的重采样效果。这是因为88.2kHz是44.1kHz的整数倍。
在电脑的二进制系统中，字长决定了有效的量化间隔数，也决定了数字系统的分辨率。我们通常用二进制，比特来表示。比特是二进制系统中的最小信息容量单位，也就是0与1中间的任何一个。字长就是比特宽度，或者叫做比特深度。例如，8比特的字长提供256个间隔数，计算方法是2的8次方。16比特的字长提供了65536个量化及，也就是间隔数。24比特提供了2的24次方，16777216间隔数。而32比特的字长则是2的32次方，4294967296量化及。24比特是目前主流的专业声卡ADC支持的比特宽度，也就是采样精度。标准的CD格式音频是16比特的。
之所以采用24比特的精度来建立工程，跟采用192kHz的采样率道理是一样一样的，因为我们可以在录音与混音中进行更加精细的处理。如果你只是简单的自娱自乐，那么用最高支持16比特的采样精度的声卡就可以了。如果要开录音棚或者音乐工作室，那就最好使用支持24比特的采样精度的声卡。比如我现在用的这款入门级的专业声卡：雅马哈UR22。
需要注意的是，很多声卡的说明中，都说自己是支持24比特的采样精度，你一定要仔细看到底是支持24比特的录音还是24比特的回放，不要被厂家忽悠了哦。
另外，比特还决定了所记录声音的最大音量范围，也就是声音的动态范围。1比特对应6分贝的音量，16比特的数字音频信号最高可以承载96分贝的音量，24比特最高可以承载144分贝的动态范围。人耳在接受15分贝以下的声音时，感到寂静，30分贝以下感到安静，50分贝感到嘈杂，80分贝感到听不清对方说话，120分贝感到耳朵疼痛，160分贝就会立刻耳膜穿孔。现在大家能够明白为什么CD的标准格式是44.1kHz的采样率与16比特的采样精度了吧。因为在这样的采样率与采样精度下就已经可以
接近完美的记录声音了。
老幽说：“采样出来的数据记录在电脑里，到底是需要多少数据呢？”好，我们下面来看看。
比如，一段声音，时长为一秒，采样率是44100Hz，采样精度是16位，声道是双声道下面我就来讲一下计算方法。因为时长是1秒，每秒采44100个采样点，所以是1乘以44100；用的是16位，那么就要在1乘以44100的基础上再乘以16；一个字节是8位数据，这样就要再除以8；而1kB等于1024字节，所以再除以1024；最后因为是双声道的，所以还要再乘以2。也就是1乘以44100乘以16除以8除以1024乘以2等于172.26kB。也就是说，一秒钟要使用172.26kB的数据。注意哈，我们这里说的都是指PCM编码哈，其他的诸如MP3等编码我们这里不做探讨。那么一分钟呢，再乘以60，也就是172.26(kB)乘以60(秒)等于10335.6(kB)。如果换算成MB的化，再除以1024，就是10.09MB。也就是说，一分钟44.1kHz，16BIT的标准双声道声音文件，大小是10.09MB。
数字信号到模拟信号的转换过程正好相反。，里就不罗嗦了哈。
ADC和DAC的功能就是这些。
下面我们就来聊聊声卡硬件方面的内容哈。
我们首先来说说一块声卡的构成。声卡上最重要的芯片有三类，就是DSP芯片、I/O控制芯片和CODEC芯片。
DSP就是Digital Signal Processor的简称，意为“数字信号处理器”。它是使用数字逻辑电路对数字信号进行处理的芯片。DSP就如同CPU一样，拥有一定的运算能力，而且是专门为音频处理服务的。可以说，它是整个声卡的CPU。
DSP芯片是可编程的，因此设计者让它干什么，它就干什么。一般来说它主要有两种作用：一种是用来协调和控制整个声卡上音频、MIDI等电路的工作，或者是MIDI等硬件加速。而另一种功能则是对数字音频信号进行运算处理。我们常说的带DSP芯片的声卡，主要是指后者。比如读屏族圈子里曾经风靡一时的创新系列声卡，在安装kX驱动后，就是用DSP芯片来运行各种效果器插件的。这些效果器插件完全使用DSP芯片来运算，而不占用电脑的CPU资源。所以DSP芯片究竟充当什么角色，是由其驱动程序来决定的。
并不是所有的声卡都有DSP芯片，很多声卡没有DSP。它们直接使用I/O控制芯片来做为主芯片。或者，有的声卡有DSP芯片，但并不让DSP去运行效果器插件，而是只负责声卡的工作。
I/O控制芯片，顾名思义就是负责和协调声卡输入输出控制的。现在有很多声卡本身就是纯粹的音频接口，因此没有DSP，而是只靠I/O芯片来协调音频的输入输出。
CODEC，它是编码解码器。它的作用，也就是声卡最关键的两个作用——把来自电脑的数字信号转化为模拟音频信号和把声卡模拟输入的模拟音频信号转化为数字信号。它的组成部分主要就是我们以前聊过的ADC和DAC芯片。也就是统称的AD/DA。所以可以说这是决定声卡音质的最重要部分。
一块声卡的模拟输入输出品质和CODEC的转换品质有着很大的关系。如果说DSP或I/O控制器决定着声卡内部数字信号的质量，那么CODEC就是决定着模拟输入输出的好坏。衡量一块声卡的音质，往往要看它使用的是什么样的芯片来做CODEC。
当然，并不是说只要用的芯片好，音质就一定好。事实并非如此，因为除了这三种主要的芯片之外，整个声卡的其他部分，包括整个声卡模拟电路部分的用料，还有运放芯片等，也都很重要。并不是主芯片的指标高，音质就一定会很好。
对于“音质”这个话题，是很难讲的，声卡的芯片性能指标并不完全等于其音质，而且往往商家会在广告文章中宣扬其产品音质如何好，一些测评文章也只标榜它使用某某芯片，而实际音质并不一定就好，且不同的人，对音质的概念也不尽相同。所以，挑选一款音质好的声卡，要多询问用过的人们的口碑，而不能只看广告的宣传和芯片的指数，有的时候，人们的耳朵比软件测出的指标数字更有说服力。
如果你兜兜里的钱钱按不住的往外跳，那么你可以不使用声卡上的AD/DA转换芯片，直接购买专门的AD/DA来代替声卡上的ADC和DAC就得了。
另外，在声卡的ADC之前和DAC之后，还有一个叫做低通滤波器的东西。所谓低通滤波就是让低于某个频率的声音不受影响的通过，高于这个频率的声音被阻截屏蔽。这里面的某个频率是指耐奎斯特频率。老长说：“啊，还要进行过滤啊，那不是影响了音质了?”放心，过滤掉的基本都是人耳听不到的频率。
哥特问：“我刚开始接触电脑音乐，板载声卡能用来练习做音乐吗？”答案是肯定的，没问题！
现在的软音源插件以及软采样器，都是直接用运算的方式来导出音频，而运算导出音频的过程，和声卡的音质没有任何的关系。不过，板载声卡都不支持ASIO驱动，因此在使用软音源的时候，必然会产生延迟，也就是按下琴键要过上半秒钟才响，这个可是无法忍受的！不过，解决的方法很简单，只要你装上一个ASIO模拟驱动，就没有问题啦！比如著名的Wuschel 4ALL ASIO驱动，装上之后，你的板载声卡也可以勉强享受到专业声卡的低延迟。
可能初学的朋友还不知道ASIO是怎么回事，这就要牵扯到声卡驱动了。驱动是声卡的灵魂，是至关重要的东西。下面说一下声卡所支持的一些常用驱动标准。
大家最常见的是WDM。
这是微软制定的Windows音频驱动。它工作在Win98SE以后版本的Windows平台中，使用WDM驱动标准的声卡，可以一定程度地降低音频流的延迟时间。我们平时听音乐的播放器一般都是使用它。一些专业音频软件也可以使用它。由于他和我们搞电脑音乐制作没多大关系，所以我们这里就不展开叙述了哈。
下面来说说ASIO。
这个可就重要了哈，要竖起耳朵仔细听哈。ASIO的全称是Audio Stream Input Output，直接翻译过来就是音频流输入输出接口的意思。为了实现“音频设备零延迟”的理想，著名的音乐制作软件Cubase、VST的开发者斯坦伯格（Steinberg）公司提出了被称为Audio Stream Input Output的标准规范。其目的是为了让各硬件厂商开发出来的设备能够很好地与Steinberg的音频处理软件Cubase和VST相结合，以使其在数字音频处理和软件音源模拟方面发挥出最佳的性能水平。
ASIO完全摆脱了Windows操作系统对硬件的集中控制，它能实现在音频处理软件与硬件之间进行多通道传输的同时，将系统对音频流的响应时间降至最短。根据ASIO规范中定义的细节，声卡厂商可以为其硬件产品编写出高效能的ASIO驱动程序，使用声卡硬件对音频流的响应时间降低到几毫秒以内。要知道，即便是对于那些极其苛刻的专业音乐制作人，这样低的延迟量也是根本无法察觉到的。
简而言之就是，ASIO能达到“多声道”和“低延迟(low latency)”的效果。至于为什么会达到这两个效果，我们这里就不多聊了，免得亲们头晕。
只要亲们记住，这是目前我们进行电脑音乐制作最常用、最重要的驱动就行了。
阿峰说：“我在一些声卡评测文章中，看到过‘CoreAudio’这个东东，好像也和声卡驱动有关，他是神马玩意捏？”哦，这个是苹果平台下的一种声卡驱动，很多苹果平台下的音乐工作站软件可以使用他来进行音乐制作，由于我们这次的扫盲篇主要是针对我们广大PC用户的，所以关于CoreAudio这些内容，我们就不详说了哈。
除了上面说的那些声卡驱动外，还有诸如MME、GSIF等。由于这些驱动现在基本上已经淡出历史舞台了，所以我们也不展开叙述了哈。关于声卡驱动方面的内容暂时就讲这些。
老王说：“既然解决了延迟问题，软音源插件导出音频又和声卡无关，那干吗还用买更好的声卡呢？”呵呵，哪有天上掉馅饼的好事。虚拟出的ASIO，确实能解决一定的延迟，但是，在音乐工作站软件中使用的轨道数量稍微一多，加载的插件一多，噼里啪啦的爆音就出来了。
板载声卡的音质是无法和那些昂贵的声卡相提并论的。我们在做音乐的时候，听到的一切音乐都是要从声卡里出来，声卡的音质就会直接影响到音乐的制作。如果牵扯录音，那就更别说了，你用板载声卡在网上语音聊天，那个音质是没有问题的，但要专业录音，你觉得它音质行吗？
不过吗，做为初学或者业余爱好，先用板载声卡装上ASIO模拟驱动来练习，是没有问题的。或者也可以买一块支持kX驱动的创新声卡，装上kX驱动也可以使其支持ASIO。关于kX驱动的读屏族使用指南，我在视障者音乐制作交流基地（szzyyzz.com）发表过相关教程，这里就不再赘述了。如果你想专业一些，有点专业精神，嘿嘿，还是买个好声卡吧。
在选择声卡的时候，除了要看他的ASIO性能外，还要看一下声卡的输入输出。声卡的输入输出端口包括了模拟信号输入输出和数字信号输入输出这两种端口。数字信号输入输出端口距离我们初学者很遥远，所以我们这里就暂时不多说，等亲们把模拟信号输入输出端口搞明白了，那么数字输入输出端口就不难理解了。
专业声卡的模拟信号输入与输出接口都是平衡性的，关于平衡与非平衡的内容，我们在上上上一节就已经聊过了。既然是平衡的，那么就说明每个输入输出端口都是单独的插座了哦。但是要排除双声道耳机输出插座哈。
我们购买声卡的时候，信噪比是个很重要的判断指标。信噪比太小的话，录音就会带来更多的噪音，使得声音不够“纯净”。关于“信噪比”，我们前面也讲过了，这里就不啰嗦了。
选购声卡的时候，还需要看一下声卡输入输出的端口数量是否能否满足你的要求。
一般来说，如果只是使用一个话放，一个话筒来进行录音，那么就只能用到一个单声道的输入端口。如果要进行双声道的立体声录音，那就需要两个声道的单声道端口，或者一个立体声输入端口。如果要进行多轨录音的话，那就要选择有很多个输入端口的声卡了。如果你要很好的录制架子鼓的话，那就需要用八到十二个输入端口的声卡来进行多轨录音。
输出端口也是一样要看你的需要的。如果你只有一个耳机和一对音箱，那么有一个耳机输出和一对单声道输出端口的声卡足够了。如果你有很多的监听设备，或者要进行多声道环绕立体声制作，那就要用到有很多输出端口的声卡。
一般来讲，不论是在家中自娱自乐录音，还是以人声录制为主的小型录音室，一块有四路输入和四路输出的声卡，也就是我们常说的四进四出的声卡就足够你使用了。
注意哈，我们这里说的几进几出是能够独立分配的端口哈。比如我现在用的这款UR22，他虽然同时能插入一副耳机和一对音箱，看起来貌似是四出的，但是他们输出的信号是一样的且不能独立选择不同的声音来源的哈，也就是说他其实只是有二出哦。这个问题亲们一定要搞清楚哟。
很多人在购买声卡的时候，觉得多通道输入输出的声卡样子比较酷，所以购买了多进多出的声卡，但是在使用了一段时间后，发现能够派上用场的端口只有非常有限的几个而已，这就是一种资源的浪费了。说白了，钱花的不是地方。千万不要被经销商误导了哦，认为有很多输入输出端口的声卡就是专业声卡，这是一种完全错误的评判标准。
除了这些传输音频信号的接口外，有些声卡上还有那种圆形的五针MIDI接口。当然这个不一定是声卡的标配了哈，这个要看声卡厂商对他的声卡的定位了，是位以MIDI编曲为主的客户群开发的呢，还是为以录音混音的客户群开发的。比如我现在用的这款UR22，他上面就带有一对这样的五针MIDI接口。关于这种接口的用法，请到前面关于MIDI常识的章节去查阅，我们这里就不重复讲解了哈。
下面再说说声卡的内部通道。
内部通道和真实的输出端口是两码事。它主要是构建灵活的内部音频流环境。比如多个音频软件同时工作，各走各的通道，互不干扰。我曾经在《kX驱动读屏族使用指南》中讲过调音台的妙用，其中就涉及到了内部虚拟通道的内容，感兴趣的朋友就自己去阅读了。不过现在很多的专业声卡是不能录制系统声音的，他只能录制输入端口进来的信号，也就是说，不能用于网络歪歪直播等。其实也无所谓啦，我们用专业声卡是用来搞电脑音乐制作的，谁会用他去歪歪捏？对吧！
可以说，驱动程序是声卡的灵魂之所在。很多专业声卡的所谓“驱动”，往往并不只是一个驱动，而是带有声卡本身的软件界面，提供有强大的调节功能。但这也给用户的操作带来了麻烦，因为音乐工作站软件里有调音台，然后声卡又多出来一个调音台。这样的话，用户经常会在信号路由上犯迷糊，比如搞不清声卡的a端口进来的信号通过这两个调音台一转悠，最后走到了音乐工作站软件的哪一个轨道上了等。
正因如此，现在的声卡的驱动又逐渐回归简洁了。吧很多在软件控制界面上调节的功能都移植到声卡硬件的机身上了。有的是触摸式的，有的是实体的旋钮和按钮。老王问：“晓波，你用的那款什么的22的情况是怎样的捏？”哈哈，我这个声卡的软件控制界面非常简单，就只有设置声卡采样率和ASIO延迟时间的选项，其他的音量调节啦、混合监听的比例啦等等都是在声卡机体上用实体的旋钮来调节的。
我们读屏族在选购声卡的时候，需要特别注意的是，他的软件控制界面用读屏软件是否能操作，声卡机体上的控制部分是否是实体的旋钮和按键。这些必须要在购买之前搞清楚哈，不然买回来后，自己不能调节，那买回来的就是一件昂贵的“装饰品”了，哈哈。
早期，很多专业声卡都是装在机箱里的，比如PCI或者PCI-E接口的声卡。由于这样的声卡容易受到机箱内部复杂的电磁干扰，所以现在的声卡基本上都做成外置的了。
外置声卡目前主要有通过USB接口、1394火线接口和雷电接口等连接电脑的。
老王嚷道：“1394和雷电是个什么玩意？那有没有闪电接口捏？”哦，老王，你怎么知道有闪电接口啊？你太有才了。1394和雷电等都是一种类似USB接口的外置接口。他们都源于苹果电脑，而USB源于PC上。
“那他们长什么样啊？我的电脑上没有这个接口该怎么办呢？”老王接着问。哦，由于雷电接口目前在PC上海不是主流的，所以我也没有见过雷电接口长啥样子，哈哈。1394接口也叫做火线Firewire接口，也叫做“IEEE接口”。
火线接口分4针与6针的，声卡一般用的是6针的接口。6针的插头长得和USB插头一般大小，只是其中的一个很窄的边缘是弧形，另一个窄边缘仍然是平面的，厚薄比USB插头略微厚一点点。现在主流的笔记本上应该都有这种6针火线接口，如果是台式电脑，又没有这种接口，可以弄一块PCI或PCI-E转火线接口的东东，大家都称他为“火线接口”，把他的PCI或PCI-E接口插在主板的对应插槽里，然后就可以在他的外置接口上外接火线声卡了。
不过，由于火线等这类苹果电脑上的接口和PC硬件存在严重的兼容问题，对火线接口的芯片有很苛刻的要求，而USB就不同了，他本来就是PC上原配的，所以兼容性是毋庸置疑的，稳定性是最高的。在PC界，火线接口的声卡目前已经被USB接口的声卡PK出局了，哈哈。而且USB已经是所有的电脑的标配接口了，即便是苹果电脑也不例外。
专业声卡中还有一类是专门为一些软件所设计的，而这些软件也必须要有这个声卡才能运行。比如大名鼎鼎的Pro Tools早期的系列就是如此。如果你没有专门的卡，就无法使用这个软件。不过现在PT也解除了这个严重制约他发展的条款了，早就能在其他专业声卡上工作了。
还有一类多功能的音频接口，它们不仅仅包含了声卡的功能，同时还具备其他功能。这类声卡既是一个外置声卡，本身又相当于一个数字调音台，还相当于软件控制台，还自带效果器。这类产品使用起来无疑更加方便，移动性也比较好。但是吗，价格也是相当相当高的。有的高级多功能声卡还集合成器、声卡、MIDI键盘、MIDI控制器、MIDI接口、效果器等于一身。一个笔记本电脑再加上这类声卡，就什么都有了。很适合外出携带。
很多朋友误以为在读屏族圈子里风靡一时的创新声卡是专业声卡，非也，大错而特错。很多创新声卡只能支持最高48kHz和16比特的录音，所以算不上专业声卡。目前，专业声卡应该具有192kHz的采样率与24位的输入采样精度。大家可以根据以上的内容来判断商家是否在忽悠你了。比如我的……大家齐声说：“UR22。”哦，哈哈，亲们都知道了哇。老王嘀咕道：“谁不知道啊，你前面都提了n次了。”这款声卡作为入门级的专业声卡来说，很适合像我这种搞个人音乐工作室的无产阶级使用，经济又实惠。虽然是2013年上市的，但是目前仍然是一款非常畅销的声卡。因为畅销，所以假货自然就满天飞了，亲们在购买的时候一定要小心哦。
总之，声卡是非常重要的，因为要做音乐，你听到的一切声音都是从声卡里出来的，声卡的声音好坏直接关系着你的音乐的质量。
从主板自带的声卡，到1000元内价位的中低端专业卡，直到万元以上价位的高档产品，各种类型，不同功能特点的声卡琳琅满目，多得数不清，选购一个最适合自己的声卡，是很重要的。说句实话，所有的东西都是一分钱一分货，声卡也不例外。一块千元价位的声卡，是根本不能和万元级别的声卡相提并论的。越贵的东西越好，这个是肯定的。但是，相同价位的不同品牌型号的声卡，其功能、性能上区别也很多。同样的价位，要看你需要的是音质，还是功能。往往功能强大而复杂的声卡，音质却不一定就好，因为其成本都用在那些功能上了。而功能和音质都很强的，价格则必定很昂贵。
我们通过这次的内容，了解了声卡的方方面面，亲们请根据自己的实际用途和经济情况来确定如何投资，挑选一个最适合自己的声卡。
老王说：“好了，晓波，你赶紧去录制读屏族电脑音乐制作实战课程吧，我们下次再见！”哦，这个啊，我已经把30课时录制完毕了哦，30课时总时长远远超过了30个小时。好了，题外话就不多说了，亲们再见。

2015年8月21日15点14分完稿

点此查看上一篇《话放与信号放大》，点此查看下一篇《监听设备》。

作者: 葫芦娃 时间: 2015-8-23 19:43
标题: 回楼主王晓波
先来点个赞，然后慢慢拜读。

作者: 灿烂明天 时间: 2015-8-24 17:21
标题: 回楼主王晓波
来赞一个

作者: 琴韵晓波 时间: 2015-8-24 19:03
谢谢上面两位点赞了哦。

作者: 音乐海洋 时间: 2015-10-5 10:04
给小波老师点赞，学习了！

作者: 琴韵晓波 时间: 2015-11-10 13:52
这里再给亲们转帖一篇midifan月刊2015年10越上的文章。如需浏览文章中提到的图片，请自行下载第115期的midifan月刊。

音频世界的连接协议
作者：Pete Gardner  编译：Logic Loc
USB、Firewire和Thunderbolt：谁更适合音频工作？
当你在挑选新的音频接口或计算机时，对于种类如此之多的连接协议，你是否了解它
们各自的优势和劣势呢？
购买带有USB、Firewire、Thunderbolt或PCIe接口的声卡是不是更好？在接下去的5至10年里，这些连接方式还会存在吗？为什么支持USB 3的音频接口还不太多呢？数据从A到B的传输选项又增加了—新加入的USB 3、Thunderbolt和Thunderbolt 2，以及之前的PCIe、USB1、USB 2和Firewire 400、800—这些是专业人士和家庭录音室用户经常会面临的问题。在这篇文章中，我会尝试告诉你，在投资音频计算机和/或音频接口时需要知道的事。
世代的更迭
在深入讲解细节之前，有一些好消息是我们值得关注的：不管产品采用的USB、Firewire和Thunderbolt是哪一代的，最新的标准都具有向下兼容性。大多数Firewire400设备能通过Firewire 800连接运作。通过转换器，很多Firewire设备也能连接到Thunderbolt端口上。类似地，USB 1和2设备也能在USB 3端口上使用。即便如此，这其中也还是存在一些例外。在本文撰写的时期里，最常见的通用PC数据连接类型是USB2，但很明显，未来会更加广泛地采用USB  3。目前，很多新发布的主板已经用USB  3取代了一部分的USB  2插槽。庆幸地是，USB 3是向下兼容的。实际上，它能支持大部分常用的周边设备。不过，在通过USB 3端口连接一些老的USB音频接口时，可能会遭遇未知的问题。在USB 2刚出现时，USB 1设备也常出现类似的问题。我们看到音频接口厂商在陆续对固件和驱动做升级—这意味着，不久之后，这样的问题就将彻底解决。
USB 3标准在这方面是很成熟的。今后你购买的音频接口应该会处理好这些问题。但是，如果你选择购买二手设备，那么最好提前到网络上搜索该型号在某些问题上的表现情况。当然，就算你遇到了兼容性问题，也不会是世界末日：现在的主板还是会搭载少量的USB 2接口。你可以选择低效但稳定的工作方式，直到音频接口制造商将这些暂时的问题处理好。
UBS 2够好了吗？
很多用户都对音频接口制造商在USB3方面如此迟缓的进展感到意外。直到最近几个月，才有一些支持USB 3的产品进入市场。的确，USB 3是具有一些优势的，但进展如此缓慢，也是有原因的。
首先，在带宽的问题上，USB 2已经能满足大部分家庭录音室的应用需求了。USB 2的技术规格显示，它能传输高达480Mbps的数据。但由于线路限制，数据处理的方式以及设计师为保证日常使用效果而保留的净空量，设计良好的USB 2也只能达到接近280Mbps的吞吐量。让我们用更具体的音频词汇来翻译一下。在USB  2最大的理论带宽下，你能够录制超过40轨24-bit、96kHz的音频。改为48kHz的采样率，能够录制80轨。如果在24-bit/48kHz的情形下，考虑更加实际的USB2带宽，240Mbps 比较保守的数字，考虑到之前提到的连接限制）：你仍然有能力同时使用40条达到广播品质的音频通道！另外有一些公司，通过构建自己的USB控制器，将USB 2音频接口的通道数提得更高。当然，因为在研发和性能优化上进行的工作和设计更多，所以它们的售价也更高。举例来说，RME的MADIFace  USB，一款采用USB  2连接方式的数字音频接口，能提供128条通道的支持。为什么有这样的可能？这是因为数据传输处理采用了比USB标准更加高效的MADI协议。
很多USB 2音频接口制造商也会提供更高的采样率，比如96、192和384kHz，但在这样的情况下，USB的带宽会不够用：每当你加倍采样率时，数据量也会加倍。按照我之前说的240Mbps来讲，在96kHz的情况时，你能同时处理35条通道；在192kHz下，只有17条；384kHz下，只有8，9条。制造商要么提供数量少，但品质高（在前置放大器，A-D和D-A转换上）的通道I/O，要么就会限制某一采样率下可用的I/O数量。所以，虽然USB 2存在带宽的限制，但公平地讲，对于今天大多数的家庭录音室用户来讲，这个限制是可以忽略的。毕竟，我们中有多少人能听出96kHz和192kHz录音的差别呢？
USB 3的潜力
图一理论上，几种不同协议的带宽非常接近。但实际上，各种协议都存在或多或少的带宽限制，
特别是不同的USB协议。而Firewire和Thunderbolt需要的“净空量”较少。
根据技术规格，USB 3能达到惊人的5Gbps带宽。但跟USB 2一样，在真实世界的应用中，这个数字会减少很多。实际上，它接近于3.2Gbps—比USB 2带宽十倍还多。
制造商正在着手利用性能更好的USB  3。目前虽没有太多的USB  3音频接口出现，但按照趋势，早期的USB3音频接口将拥有更多I/O数量，支持更高的采样率。对于那些需要连接大量外部设备或运行大型录音工程的用户来说（他们不会满足于在44.1或48kHz下录音），这似乎是一则好消息—随着时间的推移，这样的系统应该会便宜不少。
虽然现在还是USB 3时代的初期，但我们已经在计算机上看到了USB 3.1的标准—在AppleMacBook和Google  Chromebook的一些移动产品上已经出现，部分桌面PC主板也开始配备。笔记本上的“USB 3.1 Gen 1”“Gen”指的是世代）端口并没有提供比USB 3.0更高的速度/带宽，但它提供了更好的功能配置和性能优化标准。
随后，更新的“USB 3.1 Gen 2”也出现了。它的功能与“Gen 1”一致，但速度翻了一倍—理论吞吐量提升到了10Gbps，同时提升了数据转码效率，降低了消耗。在真实世界里，我们可以预期它的带宽超过7Gbps，比USB 3.0和3.1 Gen 1的两倍还多。
跟以前一样，新的标准会带来很多的物理连接口，这里需要理清一下。之前提到的Apple和Google系统，使用的是USB Type-C连接头（更加小巧，可反转的插口设计）。而已经拥有USB3.1主板的Asus和许多准备在接下来几个月更新产品线的厂商，虽然采用了更加高速的Gen2端口，但仍然保留了经典的单向USB连接口。
USB性能
USB 3（各种世代）的另一个潜在好处是，它能为需要线路供电的设备提供更多电流：900mA，而不是USB 1和USB 2的500mA。理论上，制造商可以利用这一点，开发出更好的线路供电接口—要么有更多的功能，要么有更多的通道。我之所以说“理论上”，是因为大多数产品还没有完全利用上这些额外的资源。不过，一些用户可能已经通过其他方式获得了效益：我偶然一次发现，如果一个需要线路供电的音频接口，在通过板载放大器为幻象供电话筒或需要驱动的耳机提供较好的性能，那么，在连接到USB 3端口上时，这个情况会改善。
Firewire
Firewire（IEEE 1394）从未像被Windows PC和Apple机器广泛采用。最近几年，主板的直接支持逐渐减少，这意味着，使用Firewire音频接口的用户在购买新的桌面机器时需靠对此做特别的考虑。
说到带宽，第一代的Firewire 400标准（IEEE 1394a）在字面上要比USB 2差一些（400Mbps）。它采用了对等网络连接系统，效果比USB的主/从方式更好。这意味着，Firewire浪费的带宽较少，提供的数据吞吐量更加稳定。最终，在同等条件下，它获得的延迟比USB更低。有时候，-Firewire能比USB 2设备提供更多的I/O数量。这些因素让Firewire在很长一段时间里成为大型录音室更偏爱的连接标准。不过这些年，性能的差距不断缩小。在某些情况下，高端的USB3音频接口能够获得比Firewire更低的延迟。
图二 Firewire  400超出了大部分用户的需求，只要还有支持当前操作系统的驱动存在，那么大
多数的Firewire音频接口都可以通过转换器在Thunderbolt上运行—制造商都纷纷宣布
这一消息！
第二代Firewire（Firewire  800或IEEE  1394b）也出现了很多年。它提供的带宽是FW400的两倍，所以，你能想象到，多数大型I/O解决方案会选择FW800。因为这些优势，一些产品还支持多个接口的菊花链接，它能极大地提升录音性能。这就是专门的FW800接口比FW400要少的原因：跟USB 2一样，FW400已经能满足大部分家庭录音室用户的需求了。
不过，这些年一直存在一个困惑，尤其是对PC用户：因为Firewire标准更依赖于设备连接端之间的双向传输方式（这种情况下是计算机和音频接口），所以这也意味着，失败的可能性更高。有时候，如果两个控制器之前没有经过制造商进行的组合测试，那么它们可能无法一起工作。Apple用户经历的挫折可能比较少，因为Apple建立了少量使用通用组件的标准模型，而大多数制造商也会努力将它们的音频接口放在多数Mac型号上测试。
由于这个原因，大多数制造商会在网站上保留FAQ页面，详细描述各种Firewire音频接口型号的预测试结果。在购买之前，你有必要查看这些列表。如果你的制造商没有提供这方面的建议，那么记住，最常推荐的解决方案是使用围绕“Texas  Instruments”控制芯片构建的PCIe控制器（通常会在产品盒上标明）。大多数制造商都会用这些控制卡来测试它们的音频接口。它们已经在很多工作室配置中服役多年。
Thunderbolt
最近出现的标准是Thunderbolt，它已经是Apple Mac平台上的固定配置了（对于它们的率先采用，需要表示肯定）。它也在努力（缓慢地）打入Windows  PC市场—有一些主板现在开始支持它了：主板上自带端口或通过扩展
卡。虽然说起来很简单，但这些扩展卡必须
处于BIOS级别，并且需要有专门的接口来连
接；你不能像Firewire扩展卡那样，直接连
接Thunderbolt。制造商迟迟不将这些扩展
卡引入市场，也阻碍了Thunderbolt在Win-
dows用户中的应用。
去年，Thunderbolt  2标准来到—它是针对图三  通过PCIe卡，如ASUS的产品，可以让一些主板兼
容Thunderbolt。但要注意，这种方法没办法直接4k视频播放、采集以及其他高带宽应用需求加入USB或Firewire端口：通常，需要主板自带专而诞生的。跟Thunderbolt  1一样，它提供了门的接口。
20Gbps的单通道带宽，反之，Thunderbolt 1是两个10Gbps的通道。它保留了对原标准的向下兼容性。Thunderbolt在Windows PC上的缓慢进展，可能会导致大多数新的PC主板跳过Thunderbolt 1，直接提供Thunderbolt 2。
对我们而言，Thunderbolt的关键优势是，它的协议兼容Firewire，保留了很多同样的功能设置。这意味着，你可以在配备了Thunderbolt的计算机上通过适当的转换器，连接过去的Firewire设备。基本上，能让大量的Firewire音频接口重新派上用场，本身是一个利好消息—这可能会让过去的音频接口焕发新生。
虽然早前的一些报告指出，这些Firewire到Thunderbolt的转换器并不稳定，但最近的测试和反馈显示，大部分的Firewire音频接口—甚至是一些之前就不太稳定的—在通过Thun-derbolt转换器工作时，没有出现任何问题。如果你考虑在新机器上，通过Thunderbolt，使用过去的音频接口工作，那么最好先调查一下制造商的技术支持论坛，看看其他用户分享的经验。
内置卡选择
在连接方式的比较中，我不敢怠慢这个内部
声卡的经典选择。以PCIe为基础的声卡已
经越来越少见了，很多用户都需要将录音室
级别的音频接口带上路，通过笔记本移动工
作。音频接口市场反应了这一点。然而，在需
要更多带宽的情况下，我们仍需要PCIe所提
供的数据传送率和低延迟。这就是为什么，
在一些很专业的广播音频卡上还能看到它。图四这意味着，来自RME和Lynx的那些音频卡
多年以来，通过PCIe卡连接计算机的音频接口，比仍然能提供出色的性能。如果你拥有其中之
如RME的产品，是实现高带宽、低延迟音频的唯一一，并计划升级桌面机器，那么最好找一款
选择。虽然USB在某些方面有了提升，Thunder-
bolt也似乎快要追上PCIe了，但从原则上讲，我们支持PCIe插口的机器。当然，这个格式的性
没有理由抛弃PCIe音频接口—它们仍然拥有优能正面临着新出现的Thunderbolt标准的
秀的性能。强力挑战。
结论
对于需要购买设备的用户，目前的市场恐怕还存在着极大的不确定性，混杂的标准众多。的确，就在不久前，出现了Thunderbolt 3的消息。作为第一个官方支持，它会出现在2015年末发布的Intel  Skylake”芯片上。
图五在我们发稿前不久，Intel发布了Thunderbolt 3的消息。虽然支持的设备还没有上市，但它
承诺提供更大的带宽，更多的线路电源以及串联设备的能力。这值得等待吗？
Thunderbolt3被吹捧为一个能兼容一切的连接协议。标题数字为40Gbps的数据比率—是Thunderbolt 2性能的两倍。在带宽允许的情况下，支持最多六台设备的串联。如果通过适当的转换器，它能支持过去的Thunderbolt设备以及DVI、HDMI和VGA显示器。最有意思的是，Thunderbolt  3能为连接设备提供100W的供电，同时提升线路供电设备的功率，从目前10W的标准提升到了15W。随着时间的推移，这应该能满足连接设备恐怖的“功率消耗”。顺便提一句以防混淆，它采用的是与USB3.1一样的可反转连接口标准设计—Thunderbolt3端口甚至能向下兼容USB 3.1。不过，在连接3.1设备时，只能按照USB标准，提供10Gbps带宽和较低的充电率。
上面提到的一切都会在未来出现。到2016年，Thunderbolt  3的计算机和外部设备应该会广泛流行起来。就目前而言，USB仍是最被广泛支持的标准。通过它，你可以轻松地连接大部分的桌面机和笔记本。你现在购买的任何主板都会带有USB 2和USB 3端口，它们能满足你大部分的需求。如果你选择的是最新的主板，也许还会配备最新的USB 3.1。
在音频接口方面，驱动和性能正在逐渐改善。对于小型录音工作室以及主要通过计算机工作，对声源录制要求不多的用户，USB仍然是最优良可靠的选择。因为USB被广泛采用，导致音频接口商在这部分市场份额上的竞争越发激烈，而这恰好有助于让价格维持在一个合理的范围内。虽然USB 3的采用率有所上升，但也不要贬低USB 2音频接口：它们所提供的性能已经超过了我们大部分人的需求。而且现在，USB 2设备也比专门的USB 3设备便宜不少。
图六一些音频接口，比如最新的Universal  Audio  Apollo，就利用了Thunderbolt提供的带宽
和性能。因为它们带有DSP插件处理器，需要与计算机进行音频交换。现在的笔记本上都
配备有连接口，这意味着，小型Thunderbolt音频接口还有一席之地，比如上面图片中的
Zoom TAC2，它可以与其他设备进行串联使用。
那些需要为桌面机器增加Firewire兼容性的用户，可以通过购买价格实惠的PCIe卡轻松实现。如果你想要在笔记本上使用Firewire，那么可以选择带Thunderbolt接口的型号，购置一个转换器。大多数的Mac电脑都提供了这些接口，而如果是其他品牌，选择上会稍有限制。
最后，我们要说说Thunderbolt，它满足了大部分音频应用的诉求。一些音频接口提供了大量高品质的I/O—有些甚至有板载的DSP处理功能—目前已有不少，之后还会更多。但我们也看到了一些售价适中的设备，比如那些I/O数量并不多的产品。为什么？因为Thunder-bolt带来的好处与Firewire一样。不仅是低延迟的性能，还有设备串联的能力。实际上，通过Firewire并不总能达到这么好的效果，毕竟它的带宽限制更大。鉴于现在大部分的笔记本提供的连接性相对有限，支持Thunderbolt的音频设备就变得更加诱人：不仅意味着你不需要通过转换器使用，也意味着，你可以将USB端口留给其他外部设备，如iLok软件保护器等。

作者: zxljynszbd 时间: 2016-4-29 19:39
标题: 回楼主王晓波
让我慢慢学习吧

欢迎光临视障者音乐制作交流基地 (http://szzyyzz.com/)