GitHub 上开源的 AI 录音笔记神器,真的绝了
逛 GitHub 的时候,发现了一个 AI 会议总结 & 录音笔记工具。
刚刚在 GitHub 上开源,就获得了 1.7K 的 Star。
它非常适合注重隐私的小团队、初创公司或个人,需要高效的会议记录和知识沉淀工具,又不想把会议录音交给第三方公司。
可以基于这个开源项目搭一个应用,数据全在自己手里。
01
项目简介
Speakr 是一款开源免费、支持完全本地化部署的 AI 会议助手,专为解决传统会议记录效率低、隐私风险高的问题而设计。
开源地址:https://github.com/murtaza-nasir/speakr
自动化处理录音内容,让你能快速获取文字记录、智能摘要,甚至通过聊天交互方式提取会议关键信息,同时确保数据100%私密存储。以下是其核心特点:
① 自动转文字:
把录音(MP3, WAV 都行,甚至能直接在浏览器里录)扔给 Speakr,它就能帮你把里面的讲话内容一字一句地转成文字稿。
② 智能总结:
光有文字稿可能还太长?
Speakr 能自动阅读整个转录稿,生成一个简洁的标题和内容摘要,让你一眼抓住会议核心。
③ 聊天问答:
这个最酷。
你可以像跟朋友聊天一样,在 Speakr 的界面上问:“刚才讨论的预算具体是多少?” 或者 “小明对项目A提了哪些建议?”。
Speakr 会理解你问题的意思,从会议记录里找出相关部分回答你。
⑤ 录音:
02
如何部署
Speakr 支持两种部署方式,标准模式和 ASR 模式,ASR 模式带说话人分离。
以 ASR 模式安装举例,你可以通过如下命令进行初始化和配置:
# 创建项目目录
mkdir speakr-asr && cd speakr-asr
# 创建 docker-compose.yml
cat > docker-compose.yml <<EOF
services:
# 主应用服务
app:
image: learnedmachine/speakr:latest
container_name: speakr
restart: unless-stopped
ports:
- "8899:8899"
env_file:
- .env
volumes:
- ./uploads:/data/uploads
- ./instance:/data/instance
depends_on:
- whisper-asr
# ASR 转录服务
whisper-asr:
image: onerahmet/openai-whisper-asr-webservice:latest-gpu
container_name: whisper-asr
ports:
- "9000:9000"
environment:
- ASR_MODEL=large-v3
- ASR_ENGINE=whisperx
- HF_TOKEN=your_huggingface_token
deploy:
resources:
reservations:
devices:
- driver: nvidia
count: 1
restart: unless-stopped
EOF
# 创建配置文件
cat > .env <<EOF
# API 设置
TEXT_MODEL_BASE_URL=https://api.openai.com/v1
TEXT_MODEL_API_KEY=your_openai_api_key
TEXT_MODEL_NAME=gpt-4-turbo
# ASR 设置
USE_ASR_ENDPOINT=true
ASR_BASE_URL=http://whisper-asr:9000
ASR_DIARIZE=true
ASR_MIN_SPEAKERS=2
ASR_MAX_SPEAKERS=5
# 管理员账户
ADMIN_USERNAME=admin
ADMIN_EMAIL=admin@example.com
ADMIN_PASSWORD=changeme
# 高级设置
ALLOW_REGISTRATION=false
EOF
# 启动服务
docker compose up -d
Docker 启动之后,可以访问地址:http://localhost:8899 来访问搭建好的应用。
它把强大的 AI 转录、总结和对话能力,通过一个美观的界面,打包成一个你可以完全掌控在自己手中的软件。
Speakr 绝对值得一试,它能成为你个人或团队的强大 AI 会议助理。
本文是原创文章,采用 CC BY-NC-ND 4.0 协议,完整转载请注明来自 Jokerwoo
评论
匿名评论
隐私政策
你无需删除空行,直接评论以获取最佳展示效果