PRD · Kick-off Proposal

把 AI 从会聊天的软件,
变成可佩戴、可理解环境、可持续陪伴的硬件入口。

一款便携、模块化、多模态的个人助理设备:以高质量记录为起点,向办公效率、旅行体验与家庭智能三条场景线扩张,最终成为用户的数字分身与外脑。

语音 + 视觉 + 位置 多模态协同 核心模块 + 外设生态 办公 / 旅行 / 家庭 三线切入
3高频场景主线:办公、旅行、家庭
6–8 月预计从设计冻结到量产节奏
¥150–250核心 BOM 目标带,利于商业化验证
智能便携多模态个人助理整体概念图
切入策略先用“会议纪要硬件”证明刚需,再延展旅行视觉场景。
差异化锚点不是功能堆叠,而是一个核心模块在多个真实场景中持续被佩戴与扩展。
Product Definition

产品定义:不是玩具,而是行动型 AI 助理

这不是又一个“能聊天”的 AI 小设备,而是一个能被用户随身带着走、在当下场景里真正提供记录、理解、提醒与服务的硬件入口。

核心价值

记录自动记录会议、旅途与生活片段,降低遗漏和事后整理成本。
理解结合语音、视觉、位置理解当前环境,而不是只回答一个输入框问题。
服务给出提醒、讲解、纪要、推荐与轻任务执行,向真实行动延伸。
扩展通过磁吸/触点外设,把同一核心设备变成办公助手、旅行搭子、家庭节点。
产品爆炸拆解图

模块化架构是产品上限

核心模块负责高频刚需:录音、提醒、基础视觉识别、轻量语音交互与缓存同步;APP / 云端承接大模型理解、纪要生成、自动剪辑与跨端管理。

Three Signature Scenarios

三大场景线:先打透刚需,再放大传播与生态

产品不从“万能助理”起步,而是从最容易证明价值和建立口碑的三个场景切入:办公线、旅行线、家庭线。

办公场景图

办公线

会议纪要生成器 + 桌面提醒终端 + 轻任务语音触发。效率需求最强,最容易形成付费理由。

会议纪要生成高保真拾音、转写、摘要、结论提炼与 Action Items 同步。
桌面智能玩伴日程、久坐、专注计时、消息提示,配合底座可形成更强存在感。
工作助理语音触发预订会议室、发通知、查出行信息等轻任务。
价值密度高直接节省整理与遗漏成本
验证路径短MVP 可快速跑通
商业意愿强效率型硬件更容易被买单
旅行场景图

旅行线

无感记录 + 景点讲解 + 防丢定位 + 推荐向导。多模态硬件在旅行场景里最容易被放大。

无感 Vlog 记录挂绳、磁吸、夹扣佩戴,支持定时/触发拍摄与自动剪辑。
轨迹与资产守护GPS 轨迹记录 + MFi / Find My + AirTag 级防丢体验。
随身导游位置自动讲解,双击触发视觉识别与实时说明。
传播性强天然带内容与社交分享属性
能力契合高视觉、语音、位置同时成立
品牌感强更像新一代 AI 硬件
家庭场景图

家庭线

从随身设备切换成家庭节点,成为更轻量、更灵活的家居 AI 入口和陪伴终端。

IoT 中枢磁吸上墙或放入基座后,承担语音控制、设备状态提醒与联动。
跨代陪伴儿童故事、互动问答;老人闲聊、提醒、服药与健康习惯辅助。
安防巡逻配合移动底座完成室内巡逻,进行异常环境识别与远程提醒。
生态延展从单品升级为家庭入口
长期关系提升设备陪伴频率
第二曲线更适合后续放量与配件扩张
Hardware & System

硬件规格:核心模块先满足刚需,外设体系负责打开上限

产品形态应由“全能主控核心模块 + 扩展生态体系”构成,先保证拾音、佩戴、低功耗和基础多模态能力,再扩张视觉和模块生态。

6 个设计目标

01
极致声学能力
3A 算法(AEC / ANC / AGC)+ 多麦阵列波束成型,优先解决嘈杂环境精准拾音。
02
安全声纹识别
绑定主人声纹,仅响应授权用户,兼顾隐私、安全与误触发控制。
03
超低功耗
纯录音 / 日常待机场景连续使用不少于 8 小时。
04
微型与无感佩戴
接近硬币或智能手表表盘尺寸,可挂脖、磁吸、夹扣佩戴。
05
模块化扩展
标准化物理与电气接口(如 Pogo Pin),可外接摄像头、电池壳、移动底座。
06
拍摄可用性
引入 OIS / EIS 级防抖和高强度结构设计,适配运动与通勤场景。

系统边界分工

核心模块负责录音、提醒、基础视觉识别、简单语音交互、轻量本地缓存与同步。
云端 / APP 负责大模型理解、会议纪要生成、视频自动剪辑、数据同步、内容管理。
硬件栈低功耗 SoC、麦克风阵列、广角摄像头、本地存储、BLE / Wi‑Fi、MFi 芯片与电源管理。
战略含义把最难复制的体验留在端侧,把最易演进的能力放到软件层,降低迭代成本。
声学是第一优先级 云端负责智能升级 标准接口支持生态
Competition

竞品分析:我们的机会不在“功能更多”,而在更完整的场景闭环

市场上已经有录音型、陪伴型、视觉型或动作模型型单点产品,但缺少一个核心模块能同时覆盖多个高频场景,并通过外设形成持续扩展关系。

竞品 核心主打 优势 相对短板
Rabbit R1LAM + 掌上交互交互新颖,可操作 APP体积偏大,无法无感穿戴,续航一般
Plaud Note录音与会议纪要录音质量好,使用门槛低缺乏视觉能力,场景局限在录音
NotePin随身记忆记录极其轻便,定位清晰缺少扩展性,功能天花板较低
Friend AI情感陪伴情绪价值强,设计感好缺乏工具属性与效率价值
Looki L1视觉识别 AI视觉分析能力强更偏辅助设备,非大众消费定位
本项目多模态 + 模块化生态办公、旅行、家庭三线场景统一承接,并具备外设延展空间软硬件协同复杂度高,前期研发投入更大

差异化 01

一个核心模块,进入多个高频场景,而非停留在单次使用或单一形态。

差异化 02

多模态协同,不是“附带一个摄像头”或“附带一个麦克风”的堆料式组合。

差异化 03

模块化接口让产品既能做消费品,也能做 B2B2C 的行业定制载体。

Execution Roadmap

实施路径:先证明确切价值,再逐步打开平台化

项目应按阶段推进,避免第一天就试图覆盖全部能力,导致产品失焦、成本失控与研发爆炸。

Phase Roadmap

Phase 1
核心打样
完成主控板开发,跑通 3A 拾音与语音链路,实现会议纪要 MVP,先证明办公场景成立。
Phase 2
视觉与内容能力
引入摄像头模块,联调图像防抖,开发 APP 端 Vlog 生成功能,打开旅行使用场景。
Phase 3
模块化生态
定义标准化外设接口,推出桌面行走底座、大容量电池壳等首批官方配件,从单品走向平台。

成本、时间线与风险

BOM 目标主控 SoC + 内存 ¥50,多麦阵列 ¥30,视觉模组 ¥40,MFi / 通讯 ¥30,电池与结构件 ¥40,总体目标 ¥150–250。
量产节奏M1-M2 详细设计与算法预研;M3-M4 EVT;M5 DVT;M6 PVT;M7-M8 MP。
关键风险软硬件协同复杂度高;续航与体积天然矛盾;功能贪多会导致失焦;模块生态冷启动需要官方配件先打样。
Strategic Value & Recommendation

立项建议:值得做,但必须克制启动范围

项目的真正战略价值,不是再做一个 AI 概念硬件,而是卡位下一代个人 AI Agent 的随身入口,并把现有算法能力沉到一个可持续复用的硬件载体里。

建议结论:按“会议纪要硬件 + 可扩展旅行入口”立项

办公场景最容易验证硬价值,旅行场景最容易放大差异化与传播,家庭场景更适合作为第二阶段生态延展,而不是第一天就压上全部筹码。

Next Step 1
冻结 MVP:只保留高质量会议纪要、可随身佩戴、基础提醒与后续视觉扩展接口。
Next Step 2
快速验证 3A 拾音在真实会议环境中的表现,并同步测试续航、发热、磁吸可靠性。
Next Step 3
并行评估售价带、BOM 区间与景区导览 / 企业定制等 B2B2C 机会。
先打透一个足够刚的单点价值 避免“全能助理”式失焦 用场景闭环而非概念取胜