将whisper部署到nas中,后台自动进行音频转文本的处理

技术专业 · 08-10

背景

今天的项目非常简单,就是将刚刚编写的,将obsidian下whisper目录中的音频文件自动转写为markdown的文本内容。
代码编写非常简单,按照官网给出的python样例进行简单改写就可以了。
但是在nas上安装whisper却遇到了问题,主要就是root、tmp下的空间不足带来的各种报错。

环境安装问题

1.创建虚拟环境

cd /volume1
python3 -m venv whisper_env
source whisper_env/bin/activate

2. pip3执行中指定目录

mkdir -p /volume1/tmp/pip_cache
XDG_CACHE_HOME=/volume1/tmp/pip_cache TMPDIR=/volume1/tmp pip3 install openai-whisper
按照这个方式安装终于成功:

程序执行问题

在开始进行程序执行的时候再次遇到存储空间不足的问题:

应该是程序执行中需要下载whisper模型,但是nas中的空间出现不足。
采取将whisper用到的目录连接到比较大的空间中的方式。
首先,确保目标目录存在
mkdir -p /volume1/whisper_cache
删除原来的缓存目录(如果存在的话)
rm -rf /root/.cache/whisper
创建符号链接,将 /root/.cache/whisper 指向 /volume1/whisper_cache
ln -s /volume1/whisper_cache /root/.cache/whisper

至此程序可以正常运行了,可以自动将obsidian的语音文件

Theme Jasmine by Kent Liao