Audiveris 是一款开源的光学音乐识别软件,支持 Windows、Linux,以及在 macOS 上自编译,不同于普通的 OCR 识别,它「可以识别图片、PDF 音乐教材中的乐谱,并生成在音乐软件可编辑的工程文件」。@Appinn
来自发现频道,@ryanlo713 同学推荐:https://meta.appinn.net/t/topic/62158
Audiveris – 开源光学乐谱识别软件推荐
Audiveris 是一款专为音乐爱好者和专业人士设计的光学乐谱识别 (OMR) 软件。它的目标是将乐谱图像转录为符号形式,从而实现音乐的播放、编辑、搜索和再发布等功能。Audiveris 集成了一个高效的 OMR 引擎和用户友好的 OMR 编辑器,提供了良好的识别性能,尤其对于现实世界中的乐谱。
译者注:原文为 Optical Music Recognition,字面为「光学音乐识别」。为方便理解,译为「光学乐谱识别」。
OMR 与 OCR 的区别
- OMR:光学乐谱识别
- OCR:光学字符识别
在讨论光学乐谱识别时,常常会提到光学字符识别 (OCR),但它们之间有几点重要区别:
- 特征化书写系统:音乐记谱是一种特征化的书写系统,包含丰富的视觉元素(如音符、附点、音符杆等),而字符识别则主要关注已定义的字母和单词。
- 语义恢复:OCR 只能对字母和单词的字形进行识别,而 OMR 不仅要识别乐谱,而且要恢复其语义,例如通过音符的垂直位置来翻译成音高。这种复杂性在字符识别中是没有相应的。打个比方,从乐谱图像中恢复音乐可能与从网站屏幕截图中恢复 HTML 源代码一样具有挑战性。
- 字符集的复杂性:尽管不像汉字等书写系统字符集数量上的宏大,OMR 的原始符号集在尺寸上变化更为广泛,从微小的元素(如音点)到可能覆盖整页的元素(如大括号),并且某些符号如连音线没有严格的定义,呈现形式也不一而足。
- 二维空间关系:音乐符号的空间关系是二维的,而文本识别通常是一维的流式信息,只需确定基线即可读取。
主要特点:
- 良好的识别效率,适用于现实中的乐谱(例如 IMSLP 上的乐谱)。
- 支持大规模乐谱处理,最多可达数百页。
- 方便的用户界面,能够检测和纠正大部分 OMR 错误。
- 兼容 Windows、Linux 和 MacOS 平台。
- 开源软件,数据透明。
截图
使用 Audiveris 读取乐谱图像时:
转写乐谱后,可校对:
完成校对后输出 Music XML 数据供其他软件使用,如 Musescore 等:
获取
注意,使用 Audiveris 需要先安装 Java 17 以上环境,仅支持 64 位操作系统。
第二个注意,需要单独下载 OCR 语言包。Audiveris 推荐了英语、德语、法语、意大利语(eng.traineddata、deu.traineddata、fra.traineddata、ita.traineddata),将这几个文件下载后放到以下路径:
- C:\Users\appinn\AppData\Roaming\AudiverisLtd\audiveris\config\tessdata
就好了。
青小蛙帮你们打包了一份什么都有的下载包,扫码关注小众软件微信公众号,回复 241113 获取下载地址:
原文:https://www.appinn.com/audiveris/