Piano transcription

来自OtomadWiki
这是一款软件的介绍页面
computer
本页面介绍Piano transcription的基本信息和用法。欢迎您进行补充。
软件基本信息

全称

Piano transcription

作者

bytedance

官网

https://github.com/bytedance/piano_transcription

操作系统

Windows/MacOS/Linux

Piano transcription 是由字节跳动开发的高分辨率钢琴转录软件,可以高效率地将钢琴演奏转换为midi文件。[1]

使用教程

目前有命令行(Linux 和 macOS)和图形界面(Windows)的教程。

图形界面

在 Windows 下可以使用由 azuwis 提供的简易 GUI 一体包。可能需要安装 python(3.7+).

下载压缩包

Github:azuwis/pianotrans

双击EXE

解压缩包翻进去找exe双击运行。


命令行操作

此处以 Ubuntu Studio 21.04 为例。

安装

使用 apt 安装

  • Python (3.7+)
  • ffmpeg

使用 pip 安装

  • PyTorch (1.4.0+)
  • h5py
  • pandas
  • librosa
  • numba
  • mido
  • mir_eval
  • matplotib
  • torchlibrosa
  • sox
  • piano_transcription_inference

于命令行中使用

将 audio_path 和 midi_path 分别替换为音/视频路径和 midi 文件路径并执行。

逐条执行
from piano_transcription_inference import PianoTranscription, sample_rate, load_audio

# Load audio
(audio, _) = load_audio('audio_path', sr=sample_rate, mono=True)

# Transcriptor
transcriptor = PianoTranscription(device='cuda', checkpoint_path=None)  # device: 'cuda' | 'cpu'

# Transcribe and write out to MIDI file
transcribed_dict = transcriptor.transcribe(audio, 'midi_path')
使用脚本

qiuqiangkong/piano_transcription_inference 中的 example.py 下载下来。或者把 此处的代码 粘到空的 .py 文件中。

python3 example.py --audio_path='audio_path' --output_midi_path='midi_path' --cuda

参考文献列表