今天在 Show HN 上发现创新工具

lazy-notes

phantompeace

介绍

作者基于 Llama 3.2 3B 进行微调，构建了一个可在本地运行的工具，用于将语音笔记转写并整理成结构化 JSON，从而在精度和完整性上显著优于原始模型。

技术

Llama 3.2 3B（微调版）、Whisper/Parakeet 用于转录、LoRA（r=128，α=128，dropout=0.05）、llama.cpp GGUF Q4_K_M 用于推理、LM Studio、合成+真实数据管道、Unsloth 训练框架

添加于

2025-09-02

产品经理解读

建议

产品功能

引入一个简易的桌面或网页 UI，用于上传音频文件并可视化结构化输出。增加批量处理支持，并提供与 Obsidian 或 Notion 等笔记应用的可选集成。
UI & UX

设计一个简洁直观的仪表盘，用于管理音频转录和查看 JSON 输出，使工具对非开发者也易于使用。
SEO 或营销

创建博客文章、教程和演示视频，展示生产力工作流、会议转录和个人知识管理等用例，以吸引更广泛的受众。
多语言支持

通过在多语言数据集上微调额外的 Whisper 和 Llama 模型，扩展转录和结构化输出的多语言支持。

常问问题

1
这个工具的功能是什么？

它使用 Whisper/Parakeet 在本地转录音频笔记，然后通过微调过的 Llama 3.2 3B 模型处理原始转录文本，生成包含标题、标签、实体、日期和动作的结构化 JSON。
2
我需要云服务才能使用它吗？

不需要，该工具专为本地处理设计。你可以完全离线运行转录和结构化分析。
3
它的准确率和大模型相比如何？

微调后的模型在评估中获得 8.55 分，超过了多个更大模型，例如 Mistral-Small-24B（7.90）和 Gemma-3-12B（7.76），并且接近教师模型 Kimi K2（约 8.82）。