多模态会议与AI协作工具定制开发

文章来源:成都小火软件开发公司发布时间: 2025-11-13

大家好,我是成都小火科技的人员,今天是2025年11月13日,星期四。前些周参加一次线上评审会,十二个专家开了四个小时,纪要写了三千字,哪晓得第二天发现最关键的决策点记错了,又得重新把会组织起来。当时我便思量,这会议效率的状况,已经不是人的状况,而是工具的状况。远程办公常态化之后,会议软件已经成为刚需,但大多还仅仅处于音视频通话的层面,真正的协作效率根本没有得到提升。所以我打算自行开发一套,是一套带有AI头脑、能够看懂PPT、能够听明白语气、能够自动安排任务的多模态会议系统。

做咨询的客户的痛点是会议信息流失严重。一个项目启动会,讨论的内容分散于聊天记录、共享文档、口头承诺之中,执行的时候就各持己见。当他找到我的时候,提出了一个很具体的需求:能否让人工智能自动识别会议里的决策项、责任人、截止时间等,之后会后直接生成工单派送到客户关系管理系统当中去。我产品经理听罢,兴奋地搓手,这儿得用Whisper来进行语音识别,儿要用视觉模型来做PPT内容解析,再接用LLM来做语义理解以及任务抽取,多模态融合是真正的难点。技术主管确定好了方案,前端使用React,后端使用Java,AI服务单独用Python来做微服务,音视频使用WebRTC,PPT解析使用OCR加上LayoutLM。

在四个半月时长的开发周期方面,总会有人询问开发周期需要花费多长时间?实际上得看复杂程度的会议场景了。客户还有支持同声传译且中英日韩四语的要求,需要接入专门的翻译API,同时还得去处理存在的延迟问题。到了第三个月的时候,中间需求存在改动的情况还确实不少,客户提出要在会议当中添加实时投票功能,我便去进行评估,这次改动涉及前端界面以及后端数据存储方面,属于中等程度的改动,于是就压缩了一下测试时间,把它添加进去了。在我公司所做的许多项目里,像赛事报名系统之类,也存在实时互动情况,不过会议系统的实时性要求相对更高些,如果延迟超过500毫秒,体验就会呈断崖式下跌。交付质量如何?上线之后客户称会议决策执行率从以往的60%攀升到87%,因为每一个决策都有踪迹可寻。

我投入了十二位技术人员,其中四个是从事AI算法的,三个是Java后端的,两个是前端的,一个是UI的,两个是测试的。研发人员的占比超过了80%,其中30%以上来自互联网大厂,有来自腾讯会议团队的,有来自字节跳动飞书团队的,带原厂的经验以及坑的。成都小火科技公司专门从事AI软件、政企软件、智慧管理类型的软件、智慧实施类型的软件、海外软件、APP、小程序、公众号、企业官网以及其他行业软件的定制开发。我官网的网址是www.xiaohuokeji.com,ICP备案号是蜀ICP备14021890号-1,网安备案号是川公网安备51010802031911号,是正规的公司,资质是齐全的。APP是否能够同时适配iOS以及安卓?这次做的是网页版,因为客户主要在PC端开会,不过我也做了移动端小程序,方便在外参会的人员接入。

测试阶段里颇为尴尬的状况被我发现,当会议室光线不佳的时候,人脸识别常常失败导致发言人标签出现错乱。最后我添加了一个声纹识别来做辅助,双重校验才得以解决。关于小程序是否存在手机兼容性问题?是会存在的特别是很多内存小的老款iPhone,在进行视频会议的时候就容易出现闪退的情况。我已经进行了内存优化,视频分辨率也被动态调整了,并且添加了崩溃日志自动上报功能。上线之后如果出现bug,我会负责修复?肯定是负责的,合同里有写明,紧急bug会在四小时内响应。维护费是如何收取的?首年是免费的,之后每年按照合同额的15%进行收取,其中包含API升级以及服务器扩容。后期要是想要添加功能是否需要额外花钱?是需要的举个例子来说,客户要是想要添加会议气氛分析,看看大家是赞同还是反对,需要添加情感计算模块,属于新增的需求。

UI能够设计多少个版本?我这边做了有三个版本,客户挑中了最为专业的一版,带有深色背景,凸显视频窗口。至于使用云服务器还是线下自主服务器?采用的是云服务器,有阿里云跟AWS双活,因为客户存在海外团队,得要全球来接入。代码的版权属于谁?属于客户不过对于有AI模型基座的我的技术积累而言,这一块是有单独的知识产权约定。开发完毕之后会对客户开展使用培训?是会的我制作了五段时长不超过三分钟的视频教程,并且还配备了操作手册,因为会议软件需要快速上手,没有人愿意去看长篇的文档。

本公司到底有多少个技术人员?总计是五十三个人。除了行政财务一块之外,剩下的全都是与技术相关的人员。有人就问是否有JAVA开发语言?有,有十四个JAVA后端的人员,这是本公司的主力军。有人疑惑为何不同公司的报价差距许多?由于会议系统关联音视频、AI、协作这三方面,每一方面都是难攻克之地,小公司只能够开展表层的业务,而我能够进行全链路的操作,成本构造是不一样的。我所开展过的项目情况,比如有AI智慧文旅小程序这类的,也存在多模态方面的需求,不过会议系统的实时交互要求则更为高些。我拥有ISO900认证(证书编号:29325Q410631R0S),质量管理流程相当严格。

复盘该项目之中,最大的障碍是个AI幻觉。有一次会议商讨预算的时候,PPT上写“控制在10%以内”,AI在抽取任务的时候,被理解成了“增加10%”,差一点就派错工单。此刻在LLM后处理中已添加规则校验,经过数字、人名、时间的三重核对之后,幻觉才算是被稳稳地压制住了。经验需要补充一些,多模态融合并非单纯堆砌模型,需要开展特征对齐以及时间同步的相关事项,我的音视频和PPT解析的时间戳对齐,就花费了足足两周的时间。重提醒很多想要去做多模态会议工具的企业,可不要贪大求全,先把核心场景做透彻,比如说先确保决策抽取准确率能达到95%,之后再去做属于锦上添花的气氛分析这类功能。说到底会议工具的价值在于让信息不流失且决策可追踪,即便花哨功能有很多,也比不上一次准确的会议纪要。我做这件事是期望能帮企业把开会的成本切实转化为执行力的提升,而不是增添数字的负担。


文章来源网址:https://www.xiaohuokeji.com/archives/xitongkaifa01/2408,转载请注明出处!

推荐文章

多模态会议与AI协作工具定制开发

2025-11-13 18:01:22

工业智能体(AI Agent)定制开发

2025-11-13 17:56:06

AI供应链与物流优化系统开发

2025-11-13 17:56:02

AI税务合规与风险评估软件开发

2025-11-13 17:55:58

AI全渠道智能客服系统开发

2025-11-13 17:55:55

数字大屏和AI数字人结合软件系统定制开发

2025-11-12 17:23:17

成都口碑不错有实力的软件开发公司介绍

2025-11-12 16:20:09

智慧农场系统APP定制开发过程

2025-11-12 16:12:19

Core competence

高质量软件开发公司-成都小火科技

多一套方案,多一份选择

联系小火科技项目经理,及时获取专属《项目方案》及开发报价

咨询相关问题或预约面谈,可以通过以下方式与我们联系

业务热线 19113551853