被遗忘的视频,正在变成金矿
全球每天产生的视频数据超过 500 万小时,但其中超过 80% 永远没被看过——存放在服务器里,积满灰尘,像数字时代的“黑匣子”。这些被称为“暗数据”的视频,可能是商场监控、工厂巡检、展会录像、客服通话记录,甚至是企业内部培训材料。它们不是没用,只是没人知道怎么用。
东京初创公司 InfiniMind 想把它们“挖出来”。这家公司由两名前谷歌日本员工 Aza Kai 和 Hiraku Yanagita 创立,两人在谷歌干了近十年,负责过 YouTube 推荐系统、云视频处理和日本本地化内容分析。他们亲眼见过大公司如何浪费这些数据:一个零售连锁店存了三年的门店监控,却从未分析过顾客动线;一家电视台存了五万小时的节目素材,想查某段采访,得靠人工一帧一帧翻。
“我们不是在做更聪明的AI,”Aza Kai 说,“我们是在解决一个笨问题——怎么让机器读懂一小时、两小时、甚至一百小时的视频,像人一样知道‘什么时候谁说了什么,发生了什么’。”
TV Pulse:日本媒体和零售的“视频搜索引擎”
InfiniMind 的第一个产品 TV Pulse,已经在日本落地。电视台用它快速定位某位嘉宾的发言片段,不用再翻硬盘;便利店用它分析高峰时段顾客停留位置,优化货架布局;甚至一家日本连锁药妆店,靠它发现顾客在促销区犹豫时,往往先看价格标签再看产品——于是他们把价格牌从侧面移到正前方,三个月内转化率提升了17%。
这套系统不需要写代码,只要上传视频,输入你想找的内容,比如“穿红色上衣的顾客在A区停留超过30秒”,系统就能在几秒内返回时间戳和截图。没有复杂的API,没有数据工程师,销售和运营人员自己就能用。
DeepFrame:能看200小时视频的“大脑”
现在,InfiniMind 正准备把核心能力打包成 DeepFrame,推向全球市场。它能处理长达200小时的单个视频文件,识别出:谁在说话、说了什么、情绪变化、物品出现、动作序列——甚至能判断“这是一次成功的销售演示”还是“客户明显不满”。
关键不是技术多炫,而是便宜。传统方案要花几十万买硬件、请团队训练模型,而 DeepFrame 用云端弹性计算,按小时付费。一个中型物流公司,用它分析司机行车记录仪,一个月成本不到2000美元,却能自动识别疲劳驾驶、违规变道、货物装卸异常,事故率下降了22%。
去年,一家德国汽车零部件厂试用后,用 DeepFrame 从过去两年的产线监控中,找到了三次被忽略的设备异响——最终发现是某个螺丝松动导致的连锁故障。修好后,年省维修费超80万欧元。
搬去美国,不只是换个办公室
今年初,InfiniMind 把总部从东京搬到了旧金山。不是为了蹭硅谷光环,而是因为客户在那儿。美国的媒体集团、连锁零售、物流巨头,早就被视频数据压得喘不过气。他们不缺技术,缺的是能直接用、不靠专家、不烧钱的工具。
这次580万美元种子轮,由日本风投 UTEC 领投,参与方包括几位前亚马逊和Meta的视频工程负责人。钱会全砸在两件事上:一是扩大工程团队,招更多懂视频、懂业务的人,而不是只会调参数的算法工程师;二是打通与主流企业系统(如Salesforce、Shopify、Microsoft Viva)的对接,让视频分析结果能直接变成销售线索、库存预警、客服工单。
“我们不卖AI,”Hiraku Yanagita 说,“我们卖的是答案。你不需要知道模型怎么跑,你只需要知道——昨天下午3点,那个穿蓝衬衫的客户,为什么没买那件外套。”
当企业终于能从海量视频里,找到真正有用的信息时,暗数据,就不再是负担,而是下一个被低估的商业资产。