拆掉 GPU 单体。延迟更低，账单更低，部署不再需要专人盯着。

Hyperstate AI 曾运营一个 AI 辅助音乐制作平台。创作者上传音频，与制作人风格的助手（Louis Bell 形象）协作，跨会话保留完整上下文。该初创公司在发布后资金耗尽。

AI 全栈构建 2025 已关闭

预约通话

01 概览

概览

02 挑战

挑战

一台 GPU 重负载服务器同时处理音频、歌词、转录、MIDI 生成和制作人代理。部署全靠手动。算力账单涨得比用量还快。这种架构撑得起 demo，撑不起上线。无法横向扩展，无故障隔离，一次糟糕的部署就能让整个产品下线。

03 我们做出的关键决策

一台服务器干所有事，撑不到上线那天。

音频处理、歌词、转录、生成，全部堆在一台 GPU 机器上，部署还得手动。Demo 能跑，真实流量一上来就崩。我们拆成职责清晰的服务，每个组件都 Docker 化，把最重的自研库换成轻量、可扩展的托管替代。产品表层没变，算力账单只剩零头，部署再也不用专人盯着。

04 我们做了什么

我们做了什么

把 GPU 重负载的集成从单体单服务器里搬出来，迁到职责边界清晰的分布式微服务后端（代理、音频处理、生成服务），各自一套服务、各自一套扩展策略。把所有组件的部署栈从手动改成 Docker 化、可编排的基础设施。把本地自管的、计算密集的音频、歌词、转录库换成轻量、可扩展的替代方案，一并压下延迟和算力账单。上层保留 Django REST API、关联 thirdweb 的 JWT 认证、项目和样本管理、MIDI 生成工作流、Neo4j 知识图谱、PostgreSQL。同样的产品表层，换成能托起增长的基础设施，而不是跟增长对着干。

05 成果