
Google Cloud分享企业打造AI资料基础的5步骤
图片来源:摄影/王若朴
Google Cloud今日(3/25)分析,企业拥抱生成式AI前,得先建立整合的资料基础,包括制定AI优先的资料策略、建置统一的资料平台、运用AI将流程自动化、确保资料安全和资料治理,以及提高资料平台效率并降低资料成本等5步骤。尤其,企业得要有套整合式的资料分析平台,来彙整资料来源、与其他包括AI在内的系统串接,才能发挥AI效用。Google Cloud也观察到,台湾企业大都有成熟的资料蒐集模式,但将这些资料实际用于GenAI应用仍有段距离。
步骤1:制定AI优先的资料策略
要让AI发挥效益,首先得要制定AI优先的资料策略,包括建立资料策略、建立资料所有权和使用蓝图,以及形成资料生态系,来支援跨部门、跨场景的AI应用。
Google Cloud资料分析专家黄介荣解释,就好比企业内不同部门的员工,都有其运用资料和AI来解决问题的场景,比如人资单位可将自己的资料,如员工会议次数、进办公室的时长、工作绩效等,来运用AI模型预测其离职率,并及早因应。
此时,企业就可根据这些需求和场景来制定资料策略,解决过往发展AI时,必须经历的资料收集、资料清洗、建立资料分析模型并落地的冗长阶段。
步骤2:建置统一的资料平台,连结资料与AI
有了策略,下一步是建置整合式的资料平台,来连结资料和AI。黄介荣指出,常见的企业情况是许多资料库和系统独立,有些可能为了权限管理,有些为了业务方便。但到了大数据和AI分析时代,需处理的资料量和资料类型(模态)大幅增加,资料平台就得重新设计,需建置一套统一的资料平台。
这种资料平台,要能支援结构化、半结构化和非结构化资料,比如零售业的多维度客户资料,来优化行销与库存管理。这套平台还要能整合各系统资料,以及有能力快速分析即时资料串流并反应。
Google Cloud的自家资料平台产品BigQuery,也针对这类需求,在今年提供新功能,如支援多模态表格和自动探索、编目,来简化多模态资料的撷取与管理;整合大型语言模型(LLM)与SQL查询的AI查询引擎;以及即时RAG功能,来让LLM提供能精确的回答。
步骤3:运用AI将流程自动化
有了统一的资料平台,企业就可用来发展AI代理来自动化资料整理流程、产出洞察,来提高员工生产力。比如,运用AI代理来处理资料翻译、提供个人化建议,或是用于电子商务的商品分析、提供精準行销建议等。
不过,AI代理还能扮演一种资料分析角色,能协助使用者分析资料,打破过往资料分析的高门槛。这种代理又称为资料代理。Google Cloud自己也在3月推出一套资料科学代理Data Science Agent,使用Gemini模型来为开发协作平台Collab用户简化数据分析流程。
步骤4:确保资料安全和资料治理
另一方面,为发展AI,尤其是生成式AI应用,企业也要做好资料治理和安全管理。Google Cloud建议,企业可从资料品质、法规遵循和安全性下手,比如资料品质部分,需设置机制确保资料的正确性、完整性和一致性,安全性部分则需检视,资料平台是否具备加密、存取控制和威胁侦测等安全措施。
黄介荣指出,Google Cloud和财团法人人工智慧科技基金会在去年做了项《台湾企业AI準备度调查报告》,并发现,在发展AI所需的资料準备度中,超过半数的台湾企业具备良好的资料蒐集能力,但是,只有17.8%的企业拥有整合的资料平台或明确定义的资料管理解决方案,来快速处理多个来源的资料,显示台湾企业从蒐集到实作还有段距离。
他也表示,有些高机敏性的产业,如金融、特定製造业,在发展AI资料治理上步调较慢,因为得先建立规範,才能进一步实作。
步骤5:提高资料平台效率并降低资料成本
最后一步随着AI应用的规模扩大,企业使用的资料平台,也要能够扩展这些AI工作负载、极小化非必要成本,比如简化资料处理流程、提高资源利用率。
Google Cloud也建议,这个阶段的企业应考虑将工作负载自动化,比如资料平台来自动化资料管理任务(配置、扩展和备份等);另也需考量平台是否有自动化工具或功能,来监控、分析或优化资料储存状况和运算成本;以及考虑平台能否无缝扩展,来处理不断增长的资料量和AI工作负载,且兼顾效能和成本。