MIDI文件格式分析──理论篇

Seer Xillion 发布于2006-07-03 7 评论

MIDI文件属于二进制文件,这种文件一般都有如下基本结构: 文件头+数据描述

文件头一般包括文件的类型,因为Midi文件仅以.mid为扩展名的就有0类和1类两种,而大家熟悉的位图文件的格式就更多了,所以才会出现文件头这种东西。

而数据描述部份是主体,我们现在来一起分析它的结构:

在每个Midi文件的开头都有如下内容,它们的十六进制代码为:“4d 54 68 64 00 00 00 06 ff ff nn nn dd dd”。

前四个是ASCII字符“MThd”是用来鉴别是否Midi文件,而随后的四个字节是指明文件头描述部分的字节数,它总是6,所以一定是“00 00 00 06”,以下是剩余部分的含义:

以上就是MIDI文件头了,后面的所有内容都是真正做事的,我们先来看看它的构成。

MIDI的数据是由若干个格式相同的子数据构成的,这些子数据在多音轨的格式中记录了一个轨道的所有信息。多加一个音轨,就简单地把数据追加在前一音轨的后面就可以了,不过不要忘记更改文件头中的nn nn(轨道数)

先看全局音轨。全局音轨包括歌曲的附加信息(比如标题和版权)、歌曲速度和系统码(Sysx)等内容。

不管是全局音轨还是含有音符的音轨,都以“4D 54 72 6B”开头,它其实是ASCII字符“MTrk”,其后跟着一个4个字节的整数,它标志了该轨道的字节数,这不包括前面的4个字节和本身的4个字节。这一点,我们可以在后面的例子中去理解。

接着就是记录数据的地方了,每一个数据有着相同的结构:时间差+事件。

所谓时间差,指的是前一个事件到该事件的时间数,它的单位是tick(MIDI的最小时间单位)。它的构成比较特殊,这里要用二进制来说明。

一个字节有8位,如果仅使用7位,它可以表示0~127这128个数,而剩下的一位,则用来作为标志。如果要表示的数在以上范围,则这个标志为0,这时,一个7位的字节可以表示0~127tick。如果要表示的数超出了这个范围(比如240),则把标志设置成1,然后记录下高7位,剩下的留给下一个字节,在该例中240可以分解成128*1+112,这里的1就是第一个字节要记录的,加上标志位,应该为10000001,即十六进制的81;而112是下一个字节记录的,它的十六进制为70:所以要表示240这个时间,要写成81 70。同理,如果要表示65535tick,则可以先计算出65535=1282*3+1281*127+1280*127,然后得出结果:83 FF 7F。由此,我们反过来也可以知道如何确定时间差:只要标志位为0,则表示结束读取时间差。比如82 C0 03表示1282*2+1281*64+1280*3=40963,如果基本时间为120,则有341:043个四分音符。

以这种方式记录整数的字节称为动态字节,它根据记录的整数改变自身的长度,这在后面还要用到,所以必须熟练计算。

看完了这么麻烦的东西,我们再来看个更麻烦的东西:事件。在这些标准的解释后面,我们会通过一些例子来进一步掌握这些内容。

事件大体上可以分为音符、控制器和系统信息这几个种类。对于这些事件,都有统一的表达结构:种类+参数。

对于一个音符,由于它的有效范围是0~127,所以直接用00~7F作为“种类”,可以认为是个音符,比如3C表示中央C。而一个音符的最重要的参数是力度(也叫速度:velocity)。比如,3C 64 表示一个力度为十进制100的中央C音符。

因为一个字节有8位,所以剩余的一位如果置1,再联合其他的7位,则可以表示各种信息。我们暂且无视一个音轨到底是全局的还是用于记录音符的。它们归根结底都是用来记录各种事件的,只不过有些应出现在全局音轨比较合乎逻辑而已。既然这样,我们就可以从下面的表来看事件:

下表中,x表示音轨0~F,比如81表示松开第二轨的音符。

下表详细地列出了FF的详细情况,对于字节数由数据决定的情况,表中以“--”表示。

这些就是MIDI结构的全部内容,在下一讲,我们将通过一个实例来分析。

文章出处 http://www.midifan.com/

转载新闻请注明出自 Midifan.com

共有 7 条评论

  • 2021-05-24 22:41 匿名
    不知道1202年了还会不会有人会静心来看15年前的旧物。首先很感谢作者的教程!https://web.archive.org/web/20141227205754/http://www.sonicspot.com:80/guide/midifiles.html这是墙外的一篇更完整的理论,可以相结合着看!
  • 2021-02-26 21:22 匿名
    回复 匿名:居然发现还有人问问题。ID已经遥远到回收了,呵呵。 因为1拍跨越整拍的时候,乐谱软件默认是分成每个拍内各显示半拍,并用连音线连接的。 你切换到钢琴卷帘看,就能看到真相了。
  • 2018-09-10 17:19 匿名
    0 97 51 100 0 97 66 100 48 87 51 64 0 87 66 64 0 97 58 100 48 87 58 64 0 97 54 100 0 97 66 100 48 87 66 64 0 87 54 64 0 97 58 100 48 87 58 64 哈罗,楼主,麻烦你帮我看一下这个MIDI(第二列我是用str打印的,97和87是打开和关闭音符,tick=96)按照讲解,这样写的话,高音谱表中的音符66和低音普标的51都只是半拍吧?为什么数字普显示的高音普标66占一拍,低音普标51和58分别占半拍?这是怎么回事???
  • 2018-04-27 11:19 匿名
    感谢大佬分享!
  • 2018-02-05 11:14 匿名
    谢大佬!!!
  • 2010-04-18 20:17 匿名
    Thanks
  • 2010-04-17 21:31 匿名
    好东西!!!!