开源光学乐谱识别软件,用 Audiveris 扫描乐谱并转换为 MusicXML、MIDI 等格式|不是 OCR 识别
2024-11-13 12:4:32 Author: www.appinn.com(查看原文) 阅读量:4 收藏

Home

媒体工具

音乐

开源光学乐谱识别软件,用 Audiveris 扫描乐谱并转换为 MusicXML、MIDI 等格式|不是 OCR 识别

Audiveris 是一款开源的光学音乐识别软件,支持 Windows、Linux,以及在 macOS 上自编译,不同于普通的 OCR 识别,它「可以识别图片、PDF 音乐教材中的乐谱,并生成在音乐软件可编辑的工程文件」。@Appinn

开源光学乐谱识别软件,用 Audiveris 扫描乐谱并转换为 MusicXML、MIDI 等格式|不是 OCR 识别 1

来自发现频道,@ryanlo713 同学推荐:https://meta.appinn.net/t/topic/62158

Audiveris – 开源光学乐谱识别软件推荐

Audiveris 是一款专为音乐爱好者和专业人士设计的光学乐谱识别 (OMR) 软件。它的目标是将乐谱图像转录为符号形式,从而实现音乐的播放、编辑、搜索和再发布等功能。Audiveris 集成了一个高效的 OMR 引擎和用户友好的 OMR 编辑器,提供了良好的识别性能,尤其对于现实世界中的乐谱。

译者注:原文为 Optical Music Recognition,字面为「光学音乐识别」。为方便理解,译为「光学乐谱识别」。

OMR 与 OCR 的区别

  • OMR:光学乐谱识别
  • OCR:光学字符识别

在讨论光学乐谱识别时,常常会提到光学字符识别 (OCR),但它们之间有几点重要区别:

  1. 特征化书写系统:音乐记谱是一种特征化的书写系统,包含丰富的视觉元素(如音符、附点、音符杆等),而字符识别则主要关注已定义的字母和单词。
  2. 语义恢复:OCR 只能对字母和单词的字形进行识别,而 OMR 不仅要识别乐谱,而且要恢复其语义,例如通过音符的垂直位置来翻译成音高。这种复杂性在字符识别中是没有相应的。打个比方,从乐谱图像中恢复音乐可能与从网站屏幕截图中恢复 HTML 源代码一样具有挑战性。
  3. 字符集的复杂性:尽管不像汉字等书写系统字符集数量上的宏大,OMR 的原始符号集在尺寸上变化更为广泛,从微小的元素(如音点)到可能覆盖整页的元素(如大括号),并且某些符号如连音线没有严格的定义,呈现形式也不一而足。
  4. 二维空间关系:音乐符号的空间关系是二维的,而文本识别通常是一维的流式信息,只需确定基线即可读取。

主要特点:

  • 良好的识别效率,适用于现实中的乐谱(例如 IMSLP 上的乐谱)。
  • 支持大规模乐谱处理,最多可达数百页。
  • 方便的用户界面,能够检测和纠正大部分 OMR 错误。
  • 兼容 Windows、Linux 和 MacOS 平台。
  • 开源软件,数据透明。

截图

使用 Audiveris 读取乐谱图像时:

开源光学乐谱识别软件,用 Audiveris 扫描乐谱并转换为 MusicXML、MIDI 等格式|不是 OCR 识别 2

转写乐谱后,可校对:

开源光学乐谱识别软件,用 Audiveris 扫描乐谱并转换为 MusicXML、MIDI 等格式|不是 OCR 识别 3

完成校对后输出 Music XML 数据供其他软件使用,如 Musescore 等:

开源光学乐谱识别软件,用 Audiveris 扫描乐谱并转换为 MusicXML、MIDI 等格式|不是 OCR 识别 4

获取

注意,使用 Audiveris 需要先安装 Java 17 以上环境,仅支持 64 位操作系统。

第二个注意,需要单独下载 OCR 语言包。Audiveris 推荐了英语、德语、法语、意大利语(eng.traineddata、deu.traineddata、fra.traineddata、ita.traineddata),将这几个文件下载后放到以下路径:

  • C:\Users\appinn\AppData\Roaming\AudiverisLtd\audiveris\config\tessdata

就好了。

青小蛙帮你们打包了一份什么都有的下载包,扫码关注小众软件微信公众号,回复 241113 获取下载地址:

开源光学乐谱识别软件,用 Audiveris 扫描乐谱并转换为 MusicXML、MIDI 等格式|不是 OCR 识别 5

原文:https://www.appinn.com/audiveris/


文章来源: https://www.appinn.com/audiveris/
如有侵权请联系:admin#unsafe.sh