Piano transcription
来自音MAD维基
软件基本信息 | |
---|---|
全称 |
Piano transcription |
作者 |
bytedance |
官网 |
|
操作系统 |
Windows/macOS/Linux |
Piano transcription 是由字节跳动开发的高解析度钢琴转录软件,可以高效率地将钢琴演奏转换为midi文件。[1]
使用教程
目前有命令行(Linux 和 macOS)和图形界面(Windows)的教程。
图形界面
在 Windows 下可以使用由 azuwis 提供的简易 GUI 一体包。可能需要安装 python(3.7+).
下载压缩包
Github:azuwis/pianotrans
双击EXE
解压缩包翻进去找exe双击运行。
命令行操作
此处以 Ubuntu Studio 21.04 为例。
安装
使用 apt 安装
- Python (3.7+)
- ffmpeg
使用 pip 安装
- PyTorch (1.4.0+)
- h5py
- pandas
- librosa
- numba
- mido
- mir_eval
- matplotib
- torchlibrosa
- sox
- piano_transcription_inference
于命令行中使用
将 audio_path 和 midi_path 分别替换为音/视频路径和 midi 文件路径并执行。
逐条执行
from piano_transcription_inference import PianoTranscription, sample_rate, load_audio
# Load audio
(audio, _) = load_audio('audio_path', sr=sample_rate, mono=True)
# Transcriptor
transcriptor = PianoTranscription(device='cuda', checkpoint_path=None) # device: 'cuda' | 'cpu'
# Transcribe and write out to MIDI file
transcribed_dict = transcriptor.transcribe(audio, 'midi_path')
使用脚本
将 qiuqiangkong/piano_transcription_inference 中的 example.py 下载下来。或者把 此处的代码 粘到空的 .py 文件中。
python3 example.py --audio_path='audio_path' --output_midi_path='midi_path' --cuda
参考文献列表
|